文章主题:AI医生, 义诊, 人工智能, 医生助手
AI医生义诊现场
在AI时代的浪潮下,人工智能所给予我们的想象空间是无穷无尽的。它不仅仅局限于ChatGPT的对话和协助办公能力,更包括Midjourney的3D绘画技术。
在我国的成都高新区,一场别开生面的“AI医生”与真人医生的一致性评测于6月30日在海尔森医院成功举办。此次活动吸引了超过120位患者以及来自四川大学华西医院的多位主治医生共同参与评测研究。值得一提的是,这次评测是我国历史上首次开展此类活动。主办方的工作人员表示,这次评测的目的是为了验证“AI医生”在问诊及病例诊断方面的能力,以期提高医疗行业的智能化水平。
研发“AI医生”目的是辅助真人问诊
在同一天,我们的记者亲临现场,发现从AI医生义诊报到处到问诊室,众多求医者正在耐心地排队等候。进入问诊室后,我们看到了7个科室和8个问诊台,其中包括两个心内科、泌尿科、骨科等。每个问诊台都有一位医生助理,他们负责将患者的病情以文字的形式传递给”AI医生”MedGPT,而与此同时,真实医生也能在问诊系统中同步获取到病人的信息。
在最近的AI医生义诊活动中,医联的工作人员向媒体透露,为了确保MedGPT评测结果的准确性,实际上并未有真实医生与患者进行面对面的就诊。他们强调,这次评测并非AI与真实医生的竞争,而是旨在通过持续改进,使MedGPT能够被运用到真人医生的问诊过程中。据工作人员介绍,MedGPT主要针对病患的首诊问题进行解决,如常见的头痛、发热等病症,从而协助真实医生更准确地了解和判断患者的病情范围。此外,MedGPT还能帮助患者更好地理解自己的疾病状况,以及如何在治疗过程中合理搭配饮食等。
记者了解到,此次评测的同一病例,有MedGPT与真人医生分左右两屏进行实时对比。
在观察MedGPT问诊过程后,我们发现它的表现相当细致,它会一次性列出所有可能的选项,并将它们展示在对话中。患者可以通过不断回答问题并排除无关项来逐渐缩小可能的结果范围。相比之下,真实医生的问诊过程则给记者留下了简洁、明确的印象。这是因为真实医生每天都要面对众多的病人,因此可能会感到疲惫。此外,与语言对话相比,书写文字会花费更多的时间。因此,简单的信息可以节省时间,提高工作效率。
AI与真人同时问诊
在一次义诊活动中,一位58岁的女性患者在消化科咨询台前,向医生助理表示自己经常遭受腹胀和打嗝的困扰。医生助理迅速将这一信息通过文字形式,同步传达给了MedGPT和实际存在的医生们。
不久,MedGPT首先明确该患者症状与消化系统相关,并引导患者对症状进行描述,比如“腹胀和打嗝是慢慢出现还是突然出现的”“持续了多久”“有没有其他症状”等。该患者回答,一年前开始有腹痛伴随腹胀、打嗝,口干口苦等症状。
而真人医生面对该症状,首先提问的是患者的身高、体重、精神状态等基础问题。在得到患者答复后,开始提问是否有反酸、烧心等感受,同时还问到患者的睡眠、饮食等问题。在得到患者回答睡眠差但饮食尚可后,真人医生继续询问是否有高血压、糖尿病等。该患者均否认。
而MedGPT的回应则是进一步告知患者,症状可能与胃肠道功能紊乱有关,并抓住之前并未掌握的“腹痛”问题追问“您的腹痛是持续存在还是阵发性的”“痛感在哪个位置”“有无腹泻、便秘等症状”。
患者回复:“没有很痛,主要是腹胀”。接着MedGPT也问到是否有泛酸、烧心的感受。得到回答后,MedGPT开始询问家族病史与患者本人既往病史、过敏史,还问了患者是否曾做过手术。患者回复曾做过子宫肌瘤手术,无过敏史。同样,真人医生也问了类似问题。
通过对比,记者发现,真人医生相较于MedGPT,多了关于饮食习惯的问题。该患者回复喜欢吃辛辣食物,烧心的感受在吃辛辣食物后出现。
MedGPT和真人医生的检查建议都包括腹部彩超、胃肠功能检查、胃镜检查。经过查看检查结果,真人医生判定是脂肪肝,开出莫沙必利片并建议患者多运动。
MedGPT在得到脂肪肝的信息后,没有直接给出建议,而是继续询问患者身高体重。在算出体重指数属正常范围但接近“过重”后,建议患者做慢跑、瑜伽等运动。紧接着又追问患者的饮食是否规律、作息是否规律。在得到肯定回答后,又建议患者多吃水果蔬菜并多喝水;最终,MedGPT并未给出服药建议。
记者亲测:AI医生可自动识别错别字
在义诊过程中,陆续有几名患者向工作人员表示AI问诊速度太慢。记者在现场分别观察并记录一名泌尿科患者及一名骨科患者的问诊过程,时长分别是28分钟与23分钟。
对此,工作人员告诉记者,此次义诊的过程首先由患者将症状告诉现场医生助理,由医生助理通过文字形式同时转述给MedGPT及真人医生,等待两方的进一步回复后,再将问题、检查方案等内容口述转达给患者,“为了本次测评的准确性,不论‘AI医生’或是真人医生,均只以文字方式问诊。”该工作人员告诉记者
随后,记者开始亲测MedGPT的问诊效果,向其咨询“失眠怎么办”,MedGPT首先询问了记者出现失眠症状多久、频率、生活工作压力等。在得到回复后,MedGPT开始细分询问如是否运动、有无其他健康问题等。
记者发现,如果MedGPT在提出问题后,记者并未回答,则会反复提问。问诊过程中,记者有意将“提醒”错写为“提行”,MedGPT依然可以识别记者真实想表达的含义,进行解答或回复。同时,记者用口语化近义词代替原有的书面词汇,如“失眠”改为“睡不着”等,MedGPT均能理解。经过7分钟的问诊,由于记者的症状不算严重,MedGPT建议暂不需用药,可通过规律运动等方式改善睡眠。
工作人员告诉记者,MedGPT的问诊过程是模仿真人的思维结构,就像一棵树,它的可能性很多,通过患者的反复提问中,排除无用枝桠后,在重点“枝桠”上进一步确定最终的“树梢”。“它可以识别文字中的错别字,但对于‘孃孃’等四川方言或其他地区方言文字,‘AI医生’暂无法识别”。
AI与真人问诊结果一致性达96%
6月30日晚,来自北大人民医院、中日友好医院、友谊医院和阜外医院的7名专家教授对其中91份病例进行审核,并对“AI医生”MedGPT的问诊、诊断、治疗建议、辅助检查方案、数据分析的准确性及提供可解释信息、自然语言问诊与交互等7个评价维度进行打分。
最终,评测结果为:真人医生综合得分7.5分,AI医生MedGPT综合得分7.2分;AI医生MedGPT与四川大学华西医院的主治医生在比分结果上的一致性达到96%。
在当晚的线上直播点评中,北大人民医院骨科主任医师薛峰表示,自己对“AI医生”问诊结果整体感觉还不错。他和记者有同样感受,“我感觉AI医生的语言内容翔实,真人医生看病时与病人对话少,给病人的信息少。比如对于女性患者,AI医生会问经期、孕期等,真人骨科医生则很少问。”同时,薛峰也提出,骨科医生在问诊时最重要的是“查体”,实际是检查患者的骨骼问题,但AI医生MedGPT无法做到,还是需要借助真人完成。
中日友好医院呼吸科主任医师刘国梁表示,“AI医生能想到所有的患病可能性和诱因,在药物过敏等各个维度都会考虑到,这一点有利于帮助真人医生自身的知识结构完善和拓展。但AI医生容易出现重复推荐检查项目,有一些检查项目是没有必要的。”
主办方工作人员告诉记者,目前,MedGPT已经可问诊3000多种常见病症,今年年底将完成第一阶段的测试,届时它的可问诊病症数量将有更大幅度提升。
来源 | 成都商报
责编 | 秦小杰 实习生 陈淑冰
编辑:秦小杰
AI时代,拥有个人微信机器人AI助手!AI时代不落人后!
免费ChatGPT问答,办公、写作、生活好得力助手!
搜索微信号aigc666aigc999或上边扫码,即可拥有个人AI助手!