文章主题:生成式AI, 医疗大语言模型, MedGPT, 人工智能
每经记者:陈星 王佳飞
在人工智能技术尚未采用生成式AI模式时,AI在医疗领域的应用更多的是一种“幻想”。通常情况下,患者需要在完成一系列的选择题之后,才能得到一个模糊而难以确定的诊断结果,这甚至不如去医院等待挂号、就诊以及排队等待5分钟所得到的快速解答。
生成式AI为我们的世界注入了无尽的可能。今年五月,国内首个医疗大语言模型——MedGPT(Med代表医学,GPT则是指基于Transformer网络结构的预训练语言模型)由互联网医疗平台“医联”研发成功。医联的创始人和首席执行官王仕锐在接受《每日经济新闻》记者的独家专访中表示,这个模型或许能为解决医疗领域所面临的“不可能三角问题”(即提升医疗服务质量、扩大医疗服务覆盖范围以及降低医疗服务成本)提供全新的解决方案。
在今年的6月30日,我国医疗联盟在医院中积极开展了一场线下义诊活动。该活动的主要创新之处在于,它首次尝试将患者的主观症状和需求,通过真人医生和人工智能医生的联合诊断,实现了全面、高效的医疗服务流程。在这一过程中,AI医生表现出了惊人的实力,其与三甲主治医生的诊断结果一致性高达96%,这无疑为我国的医疗行业注入了新的活力和可能。
生成式AI听懂了患者说话
在人工智能助手出现之前,医疗领域的智能化仅停留在设想中。2018年,国内知名的互联网医疗平台医联开始运用自然语言处理(NLP)、计算机视觉(CV)等先进技术,逐步将医疗场景与AI融合。这些应用包括智能健康终端和智能分诊系统等,这便是智能医疗服务的初期形态。
在那个时期,智能医疗助手的使用遭遇了挫折。其失败的原因在于,诊断决策信息的收集主要是通过选择题形式进行的,而且这些题目长达四五十项,使得用户和医生都感到难以承受。医联团队认识到,人工智能或许可以成为破解医疗服务的时间、空间和人力的限制的钥匙,但是,他们却无法找到这把钥匙。
在团队遭遇挫折之际,ChatGPT如同“及时雨”般降临。作为一种大语言模型,它犹如“关键 missing piece”一般,为医联团队所研发的MedGPT在今年的5月份正式推出。
7月20日的采访中,王仕锐这样描述MedGPT:“在我们看到的所有报道、学术期刊里,MedGPT(出现的价值)应该是:第一次有了一个AI医生能够像人类医生一样,对患者进行多轮问询、鉴别诊断,出具检测意见并且读取报告,最后给到精确的治疗方案。这个过程全程模仿真实场景,不仅是国内首个,应该也是全球首个。”
“我现在每天都泡在这个事情里面,因为这就是未来。”王仕锐难掩兴奋。
但在生成式AI出现以前,自然顺畅的AI疾病诊疗流程曾被视为一个难以突破的瓶颈。
“其中最难的一点应该是AI技术对人类真实自然语义的理解。”王仕锐说道。自然语音处理不好,机器就听不懂患者的话,只能通过冗长的选择题排除可能存在的病因,最后下疑似诊断,用户体验随之大打折扣。此外,即使机器能够读懂人类语言,也未必能够像一个真的医生一样直接做排除法,用直觉和经验进行判断推论,这个过程我们称之为思维链。如何从若干个可能性中找到一个最有可能性的诊断,是一个非常大的难题。
底层技术的革新首先突破了“读懂”这一难关,基于Transformer架构的大语言模型出来之后,与自然语言的沟通能力、识别能力相关的问题就自然解决了。但在医疗领域,AI技术应用的准确性和一致性至关重要。要提升这一点,还需要更多算法及指令要求机器收敛判断,避免误诊或过度诊疗。“比如医学检验报告可能有影像、文字,包含不同剂量、单位、符号,涉及病理、生化各类指标,如何准确地读取检测报告涉及大量统一标准的工作。并且医学标准指南也在不断更新,所以这对于及时更新数据库提出了较高的要求。”王仕锐说。
据了解,MedGPT主要由两个系统组成:大模型系统与专家系统。其中,大模型完成了60%的工作,专家系统完成最终的40%,以此来不断优化医学的准确性、有效性。截至目前,MedGPT每个月仍要检测超3000个病例,然后由100位人类医生对每个病例的诊断进行打分反馈。“每个月收到的反馈有2000多条”。
“这些反馈包括但不限于——系统问多了,问题针对性不强,提到了国内没有的药品,没有注意到患者的药品偏好,检测是不是必须一次性全部做完等等。现在我们认为MedGPT还有很多有待优化的地方。”王仕锐坦言。
今年6月30日,医联做了这样一件事——在医院搭起了线下义诊,由医生助理与患者面对面沟通,将患者的主诉分别传达给真人医生与AI医生,多轮沟通之后,“医生们”为患者开具检查单或诊断,患者现场完成检查后复诊,再由AI医生及真人医生提供临床诊断及治疗方案。
最后,来自北大人民医院、中日友好医院等医院的7位专家教授,从多个评价维度对这些有效病例进行打分。结果显示,真人医生综合得分为7.5分,AI医生综合得分为7.2分——AI医生与三甲主治医生在比分结果上的一致性达到了96%。
“如果从病种覆盖度、智能化、准确性和销量四个维度衡量,MedGPT的分数应该分别是9分、6分、8.5分和9分。”王仕锐介绍。
机器永远不会比人类更关心人类
美国耶鲁大学教授William Kissick曾提出医疗卫生领域的“不可能三角”理论,这一理论是指,在既定的约束条件下,一个国家的医疗系统难以同时兼顾提高医疗服务质量、增加医疗服务可及性和降低医疗服务的价格。
但在王仕锐看来,生成式AI或给“不可能三角”提供了一个解法。
他认为,生成式医疗AI可以接待上千万的患者,做到随时随地、无限供应。随着持续训练,医疗AI的水平还会以月为单位提升,“现在我们认为MedGPT基本上达到了10年至15年临床经验的医生水平,未来每个月可能会提升一到两年的临床经验。”由此,医疗服务的可及性和服务质量得以借助AI这一工具得到兼顾。
在成本上,王仕锐表示,现在使用MedGPT完成一次完整的就诊流程成本不超过1美元,此后每18个月成本会减半。
对于互联网医疗而言,生成式AI带来了新的可能性。王仕锐表示,互联网医疗即将进入数字医疗时代。初始状态时,互联网医疗是以平台作为链接,实现信息的汇聚和分发,但对“不可能三角”的帮助是有限的。AI的爆发使互联网医疗从链接者变为了生产力的创造者,是一个能够覆盖更多患者的原始生产力,这才能真正地解决问题。
但AI始终无法避开的一个问题是——AI与人的关系。在医疗领域,则是AI技术与人类医生的关系是什么样的?
王仕锐认为,人类医生有两个层面永远无法被替代。
第一个层面是只有人类医生才能够做真正的深度研究。医学要进步要依靠解决疑难杂症、罕见病、新发疾病,而以目前的AI技术水平来说,还需要真正的人类医学专家去设定背后的算法规则。临床指南、案例研究,这件事情必须人类医学从业者去完成。但反过来,AI可以帮助人类医学专家快速地搜集疾病案例和数据,将其汇聚起来供专家参考和攻克。
第二个层面是针对大量的基层、年轻医务工作者,医疗AI可以扮演数据库、知识库的角色。
王仕锐介绍:“现在培养一个合格的医生要花费很多年,本科到博士加上规培要花费数十年,千辛万苦才能达到合格的水平。借助医疗AI,年轻医生可以迅速成长起来并提升诊疗效率。”
在采访最后,王仕锐说:“机器永远不会比人类更关心人类。机器可以扮演得力的助手,但最后确认诊疗方案的、在方案上签字的,一定是我们具有行医资格的专业医生,他们要为患者兜底”。
记者|陈星 王佳飞
编辑|文多
视频编辑|韩阳
视觉设计|帅灵茜
统筹编辑|易启江
每日经济新闻
AI时代,拥有个人微信机器人AI助手!AI时代不落人后!
免费ChatGPT问答,办公、写作、生活好得力助手!
搜索微信号aigc666aigc999或上边扫码,即可拥有个人AI助手!