AI医生MedGPT：打破医疗服务“不可能三角”的尝试

文章主题：生成式AI, 医疗大语言模型, MedGPT, 人工智能

每经记者：陈星王佳飞

在人工智能技术尚未采用生成式AI模式时，AI在医疗领域的应用更多的是一种“幻想”。通常情况下，患者需要在完成一系列的选择题之后，才能得到一个模糊而难以确定的诊断结果，这甚至不如去医院等待挂号、就诊以及排队等待5分钟所得到的快速解答。

生成式AI为我们的世界注入了无尽的可能。今年五月，国内首个医疗大语言模型——MedGPT（Med代表医学，GPT则是指基于Transformer网络结构的预训练语言模型）由互联网医疗平台“医联”研发成功。医联的创始人和首席执行官王仕锐在接受《每日经济新闻》记者的独家专访中表示，这个模型或许能为解决医疗领域所面临的“不可能三角问题”（即提升医疗服务质量、扩大医疗服务覆盖范围以及降低医疗服务成本）提供全新的解决方案。

在今年的6月30日，我国医疗联盟在医院中积极开展了一场线下义诊活动。该活动的主要创新之处在于，它首次尝试将患者的主观症状和需求，通过真人医生和人工智能医生的联合诊断，实现了全面、高效的医疗服务流程。在这一过程中，AI医生表现出了惊人的实力，其与三甲主治医生的诊断结果一致性高达96%，这无疑为我国的医疗行业注入了新的活力和可能。

生成式AI听懂了患者说话

在人工智能助手出现之前，医疗领域的智能化仅停留在设想中。2018年，国内知名的互联网医疗平台医联开始运用自然语言处理（NLP）、计算机视觉（CV）等先进技术，逐步将医疗场景与AI融合。这些应用包括智能健康终端和智能分诊系统等，这便是智能医疗服务的初期形态。

在那个时期，智能医疗助手的使用遭遇了挫折。其失败的原因在于，诊断决策信息的收集主要是通过选择题形式进行的，而且这些题目长达四五十项，使得用户和医生都感到难以承受。医联团队认识到，人工智能或许可以成为破解医疗服务的时间、空间和人力的限制的钥匙，但是，他们却无法找到这把钥匙。

在团队遭遇挫折之际，ChatGPT如同“及时雨”般降临。作为一种大语言模型，它犹如“关键 missing piece”一般，为医联团队所研发的MedGPT在今年的5月份正式推出。

7月20日的采访中，王仕锐这样描述MedGPT：“在我们看到的所有报道、学术期刊里，MedGPT（出现的价值）应该是：第一次有了一个AI医生能够像人类医生一样，对患者进行多轮问询、鉴别诊断，出具检测意见并且读取报告，最后给到精确的治疗方案。这个过程全程模仿真实场景，不仅是国内首个，应该也是全球首个。”

“我现在每天都泡在这个事情里面，因为这就是未来。”王仕锐难掩兴奋。

但在生成式AI出现以前，自然顺畅的AI疾病诊疗流程曾被视为一个难以突破的瓶颈。

“其中最难的一点应该是AI技术对人类真实自然语义的理解。”王仕锐说道。自然语音处理不好，机器就听不懂患者的话，只能通过冗长的选择题排除可能存在的病因，最后下疑似诊断，用户体验随之大打折扣。此外，即使机器能够读懂人类语言，也未必能够像一个真的医生一样直接做排除法，用直觉和经验进行判断推论，这个过程我们称之为思维链。如何从若干个可能性中找到一个最有可能性的诊断，是一个非常大的难题。

底层技术的革新首先突破了“读懂”这一难关，基于Transformer架构的大语言模型出来之后，与自然语言的沟通能力、识别能力相关的问题就自然解决了。但在医疗领域，AI技术应用的准确性和一致性至关重要。要提升这一点，还需要更多算法及指令要求机器收敛判断，避免误诊或过度诊疗。“比如医学检验报告可能有影像、文字，包含不同剂量、单位、符号，涉及病理、生化各类指标，如何准确地读取检测报告涉及大量统一标准的工作。并且医学标准指南也在不断更新，所以这对于及时更新数据库提出了较高的要求。”王仕锐说。

据了解，MedGPT主要由两个系统组成：大模型系统与专家系统。其中，大模型完成了60%的工作，专家系统完成最终的40%，以此来不断优化医学的准确性、有效性。截至目前，MedGPT每个月仍要检测超3000个病例，然后由100位人类医生对每个病例的诊断进行打分反馈。“每个月收到的反馈有2000多条”。

“这些反馈包括但不限于——系统问多了，问题针对性不强，提到了国内没有的药品，没有注意到患者的药品偏好，检测是不是必须一次性全部做完等等。现在我们认为MedGPT还有很多有待优化的地方。”王仕锐坦言。

今年6月30日，医联做了这样一件事——在医院搭起了线下义诊，由医生助理与患者面对面沟通，将患者的主诉分别传达给真人医生与AI医生，多轮沟通之后，“医生们”为患者开具检查单或诊断，患者现场完成检查后复诊，再由AI医生及真人医生提供临床诊断及治疗方案。

最后，来自北大人民医院、中日友好医院等医院的7位专家教授，从多个评价维度对这些有效病例进行打分。结果显示，真人医生综合得分为7.5分，AI医生综合得分为7.2分——AI医生与三甲主治医生在比分结果上的一致性达到了96%。

“如果从病种覆盖度、智能化、准确性和销量四个维度衡量，MedGPT的分数应该分别是9分、6分、8.5分和9分。”王仕锐介绍。

机器永远不会比人类更关心人类

美国耶鲁大学教授William Kissick曾提出医疗卫生领域的“不可能三角”理论，这一理论是指，在既定的约束条件下，一个国家的医疗系统难以同时兼顾提高医疗服务质量、增加医疗服务可及性和降低医疗服务的价格。

但在王仕锐看来，生成式AI或给“不可能三角”提供了一个解法。

他认为，生成式医疗AI可以接待上千万的患者，做到随时随地、无限供应。随着持续训练，医疗AI的水平还会以月为单位提升，“现在我们认为MedGPT基本上达到了10年至15年临床经验的医生水平，未来每个月可能会提升一到两年的临床经验。”由此，医疗服务的可及性和服务质量得以借助AI这一工具得到兼顾。

在成本上，王仕锐表示，现在使用MedGPT完成一次完整的就诊流程成本不超过1美元，此后每18个月成本会减半。

对于互联网医疗而言，生成式AI带来了新的可能性。王仕锐表示，互联网医疗即将进入数字医疗时代。初始状态时，互联网医疗是以平台作为链接，实现信息的汇聚和分发，但对“不可能三角”的帮助是有限的。AI的爆发使互联网医疗从链接者变为了生产力的创造者，是一个能够覆盖更多患者的原始生产力，这才能真正地解决问题。

但AI始终无法避开的一个问题是——AI与人的关系。在医疗领域，则是AI技术与人类医生的关系是什么样的？

王仕锐认为，人类医生有两个层面永远无法被替代。

第一个层面是只有人类医生才能够做真正的深度研究。医学要进步要依靠解决疑难杂症、罕见病、新发疾病，而以目前的AI技术水平来说，还需要真正的人类医学专家去设定背后的算法规则。临床指南、案例研究，这件事情必须人类医学从业者去完成。但反过来，AI可以帮助人类医学专家快速地搜集疾病案例和数据，将其汇聚起来供专家参考和攻克。

第二个层面是针对大量的基层、年轻医务工作者，医疗AI可以扮演数据库、知识库的角色。

王仕锐介绍：“现在培养一个合格的医生要花费很多年，本科到博士加上规培要花费数十年，千辛万苦才能达到合格的水平。借助医疗AI，年轻医生可以迅速成长起来并提升诊疗效率。”

在采访最后，王仕锐说：“机器永远不会比人类更关心人类。机器可以扮演得力的助手，但最后确认诊疗方案的、在方案上签字的，一定是我们具有行医资格的专业医生，他们要为患者兜底”。

记者|陈星王佳飞

编辑|文多

视频编辑|韩阳

视觉设计|帅灵茜

统筹编辑|易启江

每日经济新闻

AI医生MedGPT：打破医疗服务“不可能三角”的尝试

AI时代，拥有个人微信机器人AI助手！AI时代不落人后！

免费ChatGPT问答，办公、写作、生活好得力助手！

搜索微信号aigc666aigc999或上边扫码，即可拥有个人AI助手！

相关文章