文章主题:ChatGPT, 人工智能, 医疗领域, USMLE
# ChatGPT对医疗行业的冲击与影响近期,ChatGPT的问世引发了医疗界广泛的讨论,人们开始担忧,人工智能是否会对医疗领域产生重大影响,未来的医生是否会失业?据消息,OpenAI公司的程序员已经开始运用高版本的ChatGPT,对常见疾病进行问诊,并根据ChatGPT的建议,提供康复治疗方案,收到了不错的反馈。此外,一篇预印本论文显示,ChatGPT在美国医师执照考试(USMLE)中的表现超过了平均水平,准确率甚至高达约60%。这些例子充分证明了ChatGPT在医疗领域的潜力,它能够为医生提供辅助诊断和治疗方案,提高工作效率,同时也能够为患者提供更便捷、高效的医疗服务。然而,我们也应看到,人工智能并非完全取代医生的可能,而是与其相互协作,共同提升医疗服务的质量。
在我国,执业医师考试是一项严格而重要的考试,对于想要成为一名合格医生的专业人士来说,这是必须通过的门槛。近日,浙江大学医学院附属第一医院精神卫生科的研究人员正在探索一种新的医疗方式,他们计划利用人工智能技术来监测患者的眼球活动和皮肤电势反应等关键指标,从而协助医生做出更准确的诊断。为了测试这个想法的可行性,他们设计了一套特殊的考试题目,并邀请ChatGPT来尝试。这套考试题由钱江晚报编辑部和研究人员共同制定,采用了百分制的方式,分为基础知识和临床实践两部分。经过计算,ChatGPT最终获得了57分的成绩,其中基础知识得分为56分,临床实践得分为58分。这个结果表明,尽管ChatGPT是一款人工智能助手,但它并不能完全替代人类医生在实际工作中的能力和经验,但在提供客观数据和辅助诊断方面,它无疑具有巨大的潜力。未来,随着人工智能技术的不断发展,我们期待ChatGPT能够在这个领域发挥更大的作用,为我国的医疗事业做出更多的贡献。🤖💡
考卷设置:十大科目涵盖基础题和专业实践题
🤖 由于 ChatGPT 是基于 2021 年前的数据进行训练的,因此我们选取了 2020 年临床执业医师资格考试的真题库作为题目来源,所有问题均为单选题。💡吕海龙医生,来自浙江大一院精神卫生科,是我们团队中参与人工智能研究的一员。他向我们介绍,临床执业医师考试主要包括笔试考试,包括基础综合、专业综合和实践综合三个部分。📚我们的题目进行了简化,主要分为两大类。第一类是基础题,主要测试考生对基本医学知识的掌握程度,这些知识点大多数都可以通过记忆来掌握。📝第二类是专业实践题,这类题目需要考生进行逻辑推理,通过对实际情况进行分析和判断,来提出正确的解决方案。🤔总的来说,我们的题目旨在帮助考生更好地复习和准备临床执业医师考试,提高他们的考试效率和成绩。💪
在这次考试中,试卷包含了十大学科的知识点,分别是生理学、医学微生物学、病理学、药理学、卫生法规、内科、外科、妇产科、儿科以及心理学-精神科。每个学科的单元题目数量为10道,总共共有100道题目。在出题方面,我们采用了尽可能随机的选择方式。
成绩分析:掌握基本诊断推理但不擅长修正和推测
在猜想中,ChatGPT应该更擅长可背诵的医学知识,逻辑推理能力则较弱,但实践结果并非如此。
👥精神卫生科专家指出,当遇到一眼就能识别出是考题的题目时,ChatGPT有时会直接提供一个错误的选项,甚至没有任何解释。这让人怀疑它是否从中文网站上直接抄袭了错误的答案。然而,对于那些条件充分、逻辑清晰的推理题,它往往能够准确回答。
然而,在信息不完整或症状不明确的情况下,它的诊断可能会出现偏差。它缺乏根据实际情况调整诊断的能力。例如,在仅有模糊的主诉/症状的情况下,它难以找出可能的病因。因此,当面对患者时,如果没有获得足够的详细信息,ChatGPT可能会束手无策,无法提供下一步的诊疗建议,更不可能进行猜测。
ChatGPT对精神病学的知识也比较了解,能根据症状诊断抑郁症、焦虑症等,但是对于精神药物知识掌握不佳,例如,会推荐精神分裂症的患者服用抗抑郁药,来治疗主要症状。
“如果有两种同类型的药可以选择时(例如,该用利培酮还是氯丙嗪来治疗精神分裂症),它不会帮你做选择,而是严谨地提议根据医生的建议选择,可能自愧不如人类。而关于这两个药的选择,现在已有超多的研究证据证明利培酮的安全性优于氯丙嗪。ChatGPT给其他疾病选择药物时也常常选错,它的药理学考试也没有及格。”
ChatGPT喜欢做妇产科医生,它会给出很多理由来支持它的选择,虽然有时候选择是错的。另外,ChatGPT对于中国的医疗相关法律法规不够了解,这可能会给它在实践中招来一些麻烦。
考试结果:差点及格,儿科和心理科最好,内科最差
在提问过程中,针对不同题目,ChatGPT的回答速度不同。有些题是秒回,有些题需要更长时间“思考”,平均每题要花半分钟左右。ChatGPT对中文的理解完全没问题,有时会直接给出答案,有时给出一串相关知识,或者推理分析的过程。
提问进行到1小时时,系统提示“1小时内的问题太多了,请稍后再试”。看来,人工智能也是会累的嘛!(当然,也可能是这段时间访问量实在太大,系统无法承载)
最后经过统计,ChatGPT的正确率分别为:生理学40%、医学微生物学70%、病理学70%、药理学50%、卫生法规50%、内科30%、外科60%、妇产科60%、儿科70%,心理学-精神科70%,总分57分,差3分达到及格。
未来期待:辅助医生工作,引导前沿医学研究
对ChatGPT交出的答卷,吕海龙表示既有惊喜,也有很大不足。就现阶段技术水平来说,他希望医疗方向的AI产品能变成医学知识库,起码在识记类的题目上不能出错,必须100%正确,给出答案时最好标记出处,是引自某个教科书,还是引自网络信息。
而对于医疗方向AI产品的未来,精神卫生科主任胡少华教授则有着更为积极的展望:“医生把自己的知识经验传给它,医生不在病房时,病人可以直接去问这个机器,输出声音变成人的声音,并且最好它还能向患者提问。同时,AI在医学研究领域也可以大有作为,做研究的前沿导向者,随时给出新的医学诊断技术、治疗方法的发现。”
胡少华说,有关人工智能的对话,还在不断地完善当中。如今 AI 在识别、记忆、计算、逻辑思维、推理判断等方面已经可以达到甚至超越人脑,但还没有触及到智力的起点,即认知。只要AI还无法模拟人类的认知,它就不会全面超越人类,也就无法取代包括医生在内的诸多岗位,但在针对患者提供个性化的诊疗上,它却能够扮演重要角色——成为医生们最得力的智能助手。
作者:刘海波 张冰清 王蕊 江晨
编辑:付鑫鑫
责任编辑:蒋萍
*文汇独家稿件,转载请注明出处。
AI时代,拥有个人微信机器人AI助手!AI时代不落人后!
免费ChatGPT问答,办公、写作、生活好得力助手!
搜索微信号aigc666aigc999或上边扫码,即可拥有个人AI助手!