AI医师助手
语音朗读本文 音频: 进度条 00:00 06:02 后退15秒 倍速 快进15秒 撰文:朱凌煊博士 IF=8.4 推荐度:⭐⭐⭐⭐⭐ 亮点: 1、大型语言模型(LLMs)在医学教育和病情咨询方面有应用潜力。 2、ChatGPT是5种LLMs中回答前列腺癌相关问题准确率最高的。 3、当前的LLMs还不能完全取代医生。 “ChatGPT通过了美国执业医师考试”,这一消息再次给火爆的人工智能模型模型ChatGPT增添了一份神秘色彩,有人猜测也许未来的某一天,人工智能将替代医生帮助患者诊疗疾病。那么,ChatGPT等大型语言模型(Large Language Models)当前是否能当一名合格的问诊医生呢? 上海交通大学附属仁济医院泌尿科陈锐教授团队,在国际转化医学期刊《Journal of Translational Medicine》(JCQ-Q1,IF 8.4)发表论文,探讨ChatGPT和同类大型语言模型在前列腺癌和医学教育方面的应用价值。 前列腺癌 前列腺癌是全球男性第二常见的癌症类型。近期火爆的ChatGPT等大型语言模型在医学领域表现出巨大的潜力。该研究旨在评估大型语言模型是否可以为前列腺癌患者提供准确和有用的信息,除ChatGPT外,研究还纳入了YouChat、NeevaAI、Perplexity以及Chatsonic这四款近期推出的可联网的模型。 回答专业性 研究设计了22个前列腺癌患者常常关心的问题,涵盖筛查、预防、治疗选择和术后并发症等方面。研究评估了回答的准确性、全面性、易读性、人性化关怀和稳定性。研究结果表明,大多数模型的回答准确率在90%以上,其中,ChatGPT是准确率最高的。对于基本问题和明确答案的问题,大多数模型可以实现较高的准确率。然而,在涉及特定情境或涉及总结和分析的问题,准确率会下降。 回答全面性 研究发现,这些模型在回答大多数问题时表现良好。例如,它们可以准确的分析不同PSA水平的临床意义,提醒患者PSA不是最终的诊断测试,并建议进一步检查。它们还可以比较不同治疗方案的细节,概述优缺点,为患者做出决策提供有益参考。此外,值得称赞的是,大多数回答都指出患者需要咨询医生以获得更多建议。 ChatGPT帮助患者了解不同治疗方案的优缺点 局限性 尽管预期四款可联网模型可能会给出更准确的回答,但研究发现事实并非如此。一些联网的模型倾向于单纯罗列出文献结果,而缺乏总结,导致可读性差。此外,当前模型中给出的一些回答会混合有过时或不准确的信息,以及在回答中有可能会遗漏一些关键要点,导致回答的全面性不足。同时,在大部分的回答中也欠缺人文关怀。因此,这些模型还不能完全取代医生。 未能准确理解具体情境而给出了不准确的答案(声称在手术后监测PSA是为了诊断前列腺癌) 小结 总之,研究指出了大型语言模型在医学教育和病情咨询方面有应用潜力,可以提供患者友好的信息,帮助患者理解自身病情状况和治疗方案,实现医患共同决策。更重要的是,大型语言模型可以为医学生和患者提供较为准确的医学知识。 陈锐副主任医师团队长期关注人工智能在前列腺癌领域应用,参与构建了亚洲最大的多中心前列腺疾病在线数据库、前列腺癌遗传及表观遗传多组学数据库,主编了《人工智能在前列腺癌诊疗中的应用》,并提出人工智能辅助前列腺癌筛查、诊断、分子分型的策略。 教授介绍 陈锐,上海交通大学医学院附属仁济医院泌尿科副主任医师,医学博士,专注于泌尿系统肿瘤的临床诊疗和研究。获评上海市“青年科技启明星”、人民网“人民好医生”、上海市医学会泌尿外科专科分会“青年英才”。担任国际泌尿外科学会(SIU)多中心研究委员会委员、中华医学会泌尿外科分会青年委员会转化学组副组长、上海泌尿外科学会青委会副主委、《国际泌尿外科杂志》编委。主持国家自然科学基金面上项目等省部级以上基金6项,作为第一或通讯作者(含共同)发表SCI/ESCI论文30余篇。 参考文献 Zhu, L., Mou, W. & Chen, R....