ChatGPT能否成为未来医生的秘密武器？

文章主题：美国执业医师资格考试(USMLE), 聊天机器人, ChatGPT, 人工智能

　　ChatGPT能考上美国医生吗？

　　　　王鑫方

美国执业医师资格考试因其高度的难度而臭名昭著。然而，一项由美国研究人员进行的研究却揭示了一个惊人的事实：聊天机器人ChatGPT在没有经过特殊训练或强化学习的情况下，竟然能够达到或者接近通过该考试的水平。这个发现引发了人们对人工智能在临床医学应用的广泛关注，同时也让人们开始反思美国医学教育和相关考试的现状。

本文作者主要来自美国的医疗保健初创企业——安西布尔健康公司（AnsibleHealth）。他们在今年6月9日的《科学公共图书馆·数字健康》杂志上发布了一篇研究论文，该研究通过对美国执业医师资格考试官网2022年6月发布的376个考题进行分析，筛选出了基于图像的问题，并让人工智能助手ChatGPT回答剩下的350道题。这些题目涵盖了多种类型，包括需要考生根据已有信息对患者做出诊断的开放式问题，以及判断病因等选择题。此外，两位评审人员负责对试卷进行评分。

根据研究数据显示，ChatGPT在三个考试部分中的得分率在52.4%到75%之间，只要达到60%的得分率便可以视为通过考试。需要注意的是，ChatGPT的主观回答中有88.9%包括“至少一个重要的见解”，这意味着它的见解往往较为新颖、具有临床效果，并且并非所有人都能轻易发现。相较于而言，一款专为生物医学领域文献训练的大型语言模型PubMedGPT在相似测试中的得分率仅为50%左右。

在那份备受瞩目的专业考试中，研究人员指出，人工智能在临床医学领域取得了令人瞩目的成就，成功达到了及格分数线，而且是在没有任何人工干预或培训的情况下实现的。这一成果表明，大型语言模型可能在医学教育和临床决策方面发挥出巨大的潜力，值得我们密切关注。

在论文初稿的创作阶段，ChatGPT已经展现出了强大的支持能力，其与研究人员的合作如同同事一般默契。此外，安西布尔健康公司的临床医生们已经开始应用ChatGPT来优化某些复杂难懂的報告，以期提升患者的理解程度。

新西兰惠灵顿维多利亚大学的软件工程高级讲师西蒙·麦卡勒姆对人工智能在医学领域的作用持乐观态度。据他在接受法新社记者采访时表示，谷歌公司推出的一款名为Med-PaLM的人工智能医疗辅助工具能够为患者提供与专业全科医生相媲美的建议。他认为，随着技术的不断进步，我们可能会不久之后从“谷歌医生”或“必应护士”（微软旗下搜索引擎的名称）那里获取医学建议。

　　不过，也有人持异议。《科学公共图书馆·数字健康》同日刊载的一篇文章题目是《ChatGPT通过美国执业医师资格考试让人们注意到医学教育的缺陷》。作者在文章中说，ChatGPT的成功，一方面反映医师考试过于强调机械记忆，对疾病机理死记硬背，“不能充分评估现代医疗实践所需技能”；另一方面反映医学教学方式僵化，易让学生误以为医学上的问题“非对即错”，而临床中“正确的”选择含义丰富，既需要医生摒弃偏见、发挥创造力、展开批判性思考，也需要考虑众多现实因素。

　　美国执业医师资格考试属于标准化考试，分为三部分。第一部分侧重于考察基础科学和药理学，考生通常是完成300至400小时专业学习的医学生；第二部分一般由四年级医学生参加，重点考察临床诊断推理能力、医疗管理水平和生物伦理方面内容；最后一部分考试对象是完成至少6至12个月研究生医学教育的实习医生。

　　ChatGPT意为“聊天生成预训练转换器”，是美国开放人工智能研究中心研发的大型语言模型，去年11月发布，由于能在数秒内按用户需求写出论文、诗歌或编程代码而引起轰动。美国科学促进会运营的全球科技新闻服务网站“尤里卡警报”说，与现有的多数聊天机器人不同，ChatGPT不能上网搜索，而是经由内部数据处理生成类似人类语言的文本。（完）（新华社专特稿）