面对现代医学的复杂性和智能技术的强力冲击,第一要务则是“变革思维”。若借用开创国家大规模资助科学研究的先驱Vannevar Bush科学散文中的精神,即是“我们不再应对!我们自由畅想!”本文作者系盘古智库学术委员会副主任委员、中国科学院自动化研究所复杂系统管理与控制国家重点实验室主任王飞跃。文章来源于《协和医学杂志》2023年第4期。本文大约6000字,读完约15分钟。
基于人工智能大模型和生成交互式智能技术(如ChatGPT等)的成功和迅速传播,又一次在全球范围激发了大众对于生成式人工智能和通用人工智能技术无限的想象[1]。
正如黑格尔所言,“历史总是惊人地重演”,人们似乎已忘却7年前对于人工智能程序AlphaGo大胜人类围棋高手后的惊呼和期盼[2],对于ChatGPT的反应,依然遵循“我们从历史中学到的教训,就是没有从历史中学到教训。”
当前人工智能技术的进展,对于医学医疗的影响到底如何?
6年前,因为对人工智能核心技术深度学习的贡献而获图灵奖的Hinton教授曾经预言[3]:“应停止培养放射科医生,在5年之内,深度学习将会比放射科医生做得更好”。而事实是:尽管深度学习相关研究已在近期取得了巨大进展,但“停止培养放射科医生”非但未能成为选项,还迫使我们必须加快加强培养更多更好的新型放射科医生。
然而,我们不能掉以轻心,ChatGPT技术表明,当基础模型(foundation models)广泛应用时,将迫使各行各业发生巨大变革,特别是医学健康事业,我们必须准备好应对快速“相变”式的冲击。
如何应对?对此已有较多专业性的讨论[4-13]。
然而,笔者认为,面对现代医学的复杂性和智能技术的强力冲击,第一要务则是“变革思维”。若借用开创国家大规模资助科学研究的先驱Vannevar Bush科学散文[14]中的精神,即是“我们不再应对!我们自由畅想!”
为此,本文基于著名科学哲学家波普尔关于现实组成的三个世界之本体论观点,讨论诸如ChatGPT之类技术对平行医生和平行医院的强力推动作用,探索智慧医学的“三个三”理念,即
(1)三类医生:数字人医生、机器人医生、生物人医生;
(2)三种模式:“上午(AM)”自主模式(autonomous modes)、“下午(PM)”平行模式(parallel modes)、“晚间(EM)”专家模式(expert modes)或应急模式(emergency modes);
(3)三大技术:医学基础模型、医疗场景工程、医用操作系统,以期从根本上减轻医护人员的负担,特别是心理负担,深度发掘医患之间的人本共情,在强化传统医学医疗社会伦理和设施的同时,推动“患者拥有个性化和私人专属的数字医院”成为一项可行的普适技术。
一、平行化医学:三个世界,三类医生
正如文献[15-17]所述,“借鉴波普尔的关于现实的三个世界之科学哲学观点,我们可细化人类对现实的认知。”在此基础上,应重新认识医用机器和医疗软件在医学中的作用,进而重塑医学科学过程,使之与时代的智能科技相适应。
当务之急,应确立“三个世界,三类医生”的医学新框架,明确独立的数字人医生概念,协调其与机器人医生(如更先进的达芬奇式手术机器人)和生物人医生之间的关系,使ChatGPT开启的人工智能大模型技术以“小问题,大模型”方式在医学领域快速实施落地,从基于第一物理世界的医学之“专业分工”,基于第二心理世界的医学之“人机分工”,尽快迭代为基于第三人工世界的医学之“虚实分工”,如图1所示。
图1 平行医学新框架:三个世界,三类医生
换言之,由于ChatGPT的成立,“小问题、大模型”的新医学范式成为可能。为了避免由于大模型的算力和软件的复杂性使人类医生无法主导甚至更加“劳累”,我们必须要求未来的医学软件系统以“数字人”的形式重新设计并组织流程,特别是人机交互流程。
唯有如此,才可能迫使计算机、机器人及其软件以“生物人为本”,增加机器和软件的复杂性,减少人类的认知载荷与体力要求:人类医生只要以其日常熟知的与“人”相处的方式就可以与日益智能的医学系统交互,并有效地实现自己的目标,而不需要知道越来越多的功能选择,越来越复杂的操作要求。即智能医学系统必须对人类的要求越来越简单,对系统的要求越来越复杂。
按目前的技术发展趋势,将来每一个医学“小问题、大模型”就是一类数字人医生。如图2所示,其数量应占医生数量的绝大多数,比如80%以上,而机器人医生和生物人医生应为少数,比如分别在15%和5%以下。因为未来社会一定是一个以服务器为技术基础设施的算力世界,无论用还是不用,这些服务器都在耗能。
图2 平行医生 = (数字人 机器人 生物人)医生
因此,必须使之成为大量数字人“居住并工作的世界”,加以充分利用,只有这样才能保障我们社会的可持续发展。而机器人与生物人在本质上耗能,加上考虑人性的要求,因此它们不应该成为中低层生产和服务的主体。
这一新的认知将对未来的医学教育和医疗管理带来巨大冲击:我们将不可避免地像培养人类医生一样“培养”数字人医生,像管理人类医生一样“管理”数字人医生。换言之,我们必须变革目前的医学教育体系,使之数字化,使医用“AlphaGo”和“ChatGPT”之类的人工智能系统成为这些体系的标准组成,使人类的学习和数字人的学习交互进行、相辅相成,真正实现人在回路的强化学习模式。
而且,就像人类医学生必须考试成功才能从业一样,数字人医生也必须通过各种各样的医学场景工程的考核才可以被认证后使用,并可以再学习再使用,如同人类的继续教育或终身教育一样。虽然对于医院中数字人医生的使用管理,也有与医学教育同样的情景与问题[18]。
由此,医学本身必须成为虚实互动的平行医学[19-22],ChatGPT已揭示了这是不可阻挡的技术发展趋势。如目前国际已兴起的“工业5.0”理念所表明的,医学也将从基于“工业4.0”的深度医疗理念[23]进入集人机物一体的“Cyber-Physical-Social Systems (CPSS)”医学5.0(Medicine 5.0)时代[24-26]。
二、人本化医疗:三种模式,以人为本
数字人医生的引入,可使医患之间的深度共情问题成为一个更加科学化的研究问题,未来的医学将进入一种新的范式。如有关数字人的个性设计和心理分析研究所表明的[27-28],数字人、机器人和生物人医生之间将形成一种平行互动的医疗流程,以提高医疗机构的整体水平和效率。
最重要的,数字人医生的引入,使平行医生的构建与应用成为可能。平行医生利用数字人、机器人和生物人医生之间的平行互动是未来医疗健康的一大趋势。机器人和数字人医生可以通过远程诊疗和医学图像识别等技术为患者提供更好的服务,而AI基础模型平台则可以帮助医生更好地处理和分析患者数据和信息,提高医疗保健机构的效率和准确性[29-31]。
如图3所示,利用数字人、机器人和生物人医生之间的平行互动和流程设计,未来智慧医疗将进入一种新的范式:
(1)“上午(AM)”模式,即医疗自主模式(autonomous modes for medical operations)。此时,人类医生的主要责任是监控与巡视,用于培训和预防万一。主要操作由机器人医生在数字人医生的辅助下完成,这种医疗模式应占全部医疗操作与流程的80%以上。如果这种模式无法完成任务,将进入下一模式。
(2)“下午(PM)”模式,即医疗平行模式(parallel modes for medical operations)。此时,人类医生的主要责任是远程或云端遥控与指导,用于“上午”模式无法完成其任务的情景。主要操作由机器人医生在人类医生的指导和数字人医生的协助下完成,这种医疗模式应占全部医疗运作与流程的15%以下。如果这一模式成功完成任务,将返回“上午”模式,否则进入下一模式。
(3)“晚间(EM)”模式,即医疗专家/应急模式(expert/emergency modes for medical operations)。此时,为了确保特殊任务或应对紧急情况,必须启用人类医学专家资源,并确保他们能像“快递”一般进入现场,完成任务,并撤离现场,然后回到“下午”模式进行观察,保证操作成功。这种“晚间”模式,应占全部医疗操作与流程的5%以下。
图3 智慧医疗的MAPeM新范式
我们称这三种医疗模式为智慧医疗新范式“MAPeM”,其目标就是在大幅度减少人类医生体力与精神负担的前提下,进一步加强人类的医疗主导权,深化医患共情,大幅提高医疗效果,并使大规模个性化、人性化医疗可经济化运作。
笔者认为,智能技术和智慧医疗必须以人为本,复杂先进的医疗系统不应让医生和患者的决策越来越复杂,而是越来越简洁;智能先进的医疗技术不是要求医生和患者的智力水平越来越高,而是越来越自然和一般。
三、智能化医院:三大技术,子虚乌有
实施三类医生及其三种模式必须有相应的支撑体系,这就是通过物理上的实体医院与云端里的数字医院之间的虚实互动平行执行所构成的平行医院[22,32-33],如图4所示。在这里,数字医院并非一般意义上的医院数字化,而是以数字技术重构并由平行医生操作的独立医院,其与传统实体医院紧密相联,但不对其依附,主要由数字人和机器人医生管理和维护。
图4 平行医院示意图
借用智能军事的术语,通过智能技术的应用,我们可以使平行医院达到“子虚之医,乌有之患,招之即来,挥之即去”的境地[34]:利用虚实资源和计算医学实验,在与疾病的斗争中,让医者“招之即来”,让病痛“挥之即去”,这是西方军事马赛克和认知战的核心和精髓。为此,需要利用人工智能构建面向医学医疗的三项新技术。
医学基础模型:基础模型是目前最先进的人工智能模型之一,包括ChatGPT在内的各种生成式大模型[13]。基础模型通常使用Transformer[35]为主要网络结构,具有非常高的语言模型表现力和智能度,不仅可以生成高质量的自然语言文本,还具备强大的问答、阅读理解等功能。医学基础模型可以通过处理医疗文本数据以支持医疗决策,例如应用于医疗问答系统,通过数据挖掘,分析患者病历中的症状、药品和疾病等信息,为患者提供诊断建议。当前,基础模型是机器学习的一种“子集”,但随着技术发展,其亦将逐渐向通用人工智能方向发展。通过平行学习[36,37]、深度学习和模型推理等技术的完善,基础模型可以应用于跨越多种医疗领域的任务,同时也为通用人工智能领域带来更多医疗创新思路。
医疗场景工程:人工智能研发者已初步开发了最为流行的生成式基础模型,包括语言、视觉和业务等模型,如GPT、GPT-2、GPT-3、BERT、Turing NLG、VMoE、DALL·E、DreamFusion等。这促进了医疗基础模型的设计、调试和验证,需要在特定场景下进行任务细化。平行医生与平行医院所提出的医疗基础模型将在医疗场景工程中完成模型的校准和认证(C