ChatGPT在美国执业医师资格考试中的表现引发对未来医学教育的思考

文章主题：美国执业医师资格考试(USMLE), 聊天机器人, ChatGPT, 人工智能

　　ChatGPT能考上美国医生吗？

　　　　王鑫方

美国执业医师资格考试因其高度的难度而臭名昭著。然而，一项由美国研究人员进行的研究却揭示了一个惊人的事实：聊天机器人ChatGPT在没有接受特殊训练或强化学习的情况下，竟然能够达到或者接近通过该考试的水平。这个发现引发了人们对人工智能在临床医学应用的广泛关注，同时也让人们开始反思美国医学教育和相关考试的现状。

在本次研究中，参与者主要来自美国的医疗保健创业公司AnsibleHealth。他们在美国《科学公共图书馆·数字健康》杂志于2023年9日的版面上发表了一篇论文，其中详细介绍了他们的研究成果。在这项研究中，研究者们从美国执业医师资格考试官网2022年6月发布的376个题目中筛选出了基于图像的问题，然后让ChatGPT解答剩下的350道题目。这些题目涵盖了各种类型，包括需要考生根据现有信息对患者做出诊断的开放式问题，以及判断病因等选择题。此外，两位评审人员负责对试卷进行评分。

根据研究数据显示，ChatGPT在三个考试部分中的得分率在52.4%到75%之间，只要达到60%的得分率便可以视为通过考试。需要注意的是，ChatGPT的主观回答中有88.9%包括“至少一个重要的见解”，这意味着它的见解往往较为新颖、具有临床效果，并且并非所有人都能轻易发现。相较于而言，一款专为生物医学领域文献训练的大型语言模型PubMedGPT在这项测试中的得分率仅为50%左右。

研究人员强调，在具有高度难度且需要严格要求的医学专业考试中获得及格成绩，并在没有人工干预或培训的情况下实现这一目标，对于人工智能在临床医学领域的应用具有重要的参考价值。这表明，大型语言模型可能对医学教育产生积极影响，甚至具备协助临床决策的潜力。

在论文初稿的创作阶段，ChatGPT已经展现出了强大的支持能力，其与研究人员的合作方式如同同事一般紧密。此外，安西布尔健康公司的临床医生们已经开始应用ChatGPT来优化某些复杂难懂的報告，以期提高患者的理解程度。

新西兰惠灵顿维多利亚大学的软件工程高级讲师西蒙·麦卡勒姆对人工智能在医学领域的作用持乐观态度。据他在接受法新社记者采访时表示，谷歌公司推出的一款名为Med-PaLM的人工智能医疗辅助工具能够为患者提供与专业全科医生相媲美的建议。他认为，随着技术的不断进步，我们可能会不久之后从“谷歌医生”或“必应护士”（微软旗下搜索引擎的名称）那里获取医学建议。

　　不过，也有人持异议。《科学公共图书馆·数字健康》同日刊载的一篇文章题目是《ChatGPT通过美国执业医师资格考试让人们注意到医学教育的缺陷》。作者在文章中说，ChatGPT的成功，一方面反映医师考试过于强调机械记忆，对疾病机理死记硬背，“不能充分评估现代医疗实践所需技能”；另一方面反映医学教学方式僵化，易让学生误以为医学上的问题“非对即错”，而临床中“正确的”选择含义丰富，既需要医生摒弃偏见、发挥创造力、展开批判性思考，也需要考虑众多现实因素。

　　美国执业医师资格考试属于标准化考试，分为三部分。第一部分侧重于考察基础科学和药理学，考生通常是完成300至400小时专业学习的医学生；第二部分一般由四年级医学生参加，重点考察临床诊断推理能力、医疗管理水平和生物伦理方面内容；最后一部分考试对象是完成至少6至12个月研究生医学教育的实习医生。

　　ChatGPT意为“聊天生成预训练转换器”，是美国开放人工智能研究中心研发的大型语言模型，去年11月发布，由于能在数秒内按用户需求写出论文、诗歌或编程代码而引起轰动。美国科学促进会运营的全球科技新闻服务网站“尤里卡警报”说，与现有的多数聊天机器人不同，ChatGPT不能上网搜索，而是经由内部数据处理生成类似人类语言的文本。（完）（新华社专特稿）

　　关键词：美国执业医师资格考试(USMLE)

ChatGPT在美国执业医师资格考试中的表现引发对未来医学教育的思考

AI时代，拥有个人微信机器人AI助手！AI时代不落人后！

免费ChatGPT问答，办公、写作、生活好得力助手！

搜索微信号aigc666aigc999或上边扫码，即可拥有个人AI助手！

AIGC ChatGPT 创业医生微软

相关文章