AI医师助手
新智元报道 编辑:张乾 弗朗西斯 文强 【新智元导读】2017年4月,Hinton在接受《纽约客》采访时说:“5年内深度学习就能超过放射科医生,从现在起就停止培训放射科医生”。此言论一出,再一次引发全球关于AI正在取代医生的焦虑讨论。IEEE Spectrum在2018新年伊始推出专刊“AI vs Doctors”,统计了从2016年5月至今,AI在医疗领域的进展,并对比各大细分领域AI与人类医生能力差距,人工智能正在医生的主场获取成功,哪些医疗诊疗行业已被AI超越?机器人医生是人类的未来吗? 2017年4月,Hinton在接受《纽约客》采访时说:“作为放射科医生你就像卡通里的歪心狼一样,你已经冲出悬崖很远,但还没有往下看,实际上你的脚下空空如也。”商用的深度学习乳腺癌检测系统已经在开发中,Hinton说:“很显然,5年内深度学习就能超过放射科医生,或许会用10年,我在医院里说过,结果反响很糟糕。” 实际上,Hinton在医院里说的是,“应该从现在起就停止培训放射科医生”。 Hinton告诉《纽约客》记者:“放射科医生的角色从做感知(perceptual)的事情演变而来,这可能由一只训练有素的鸽子完成。”Hinton对自动化医学未来的预测建立在一个简单的原则基础之上:“在有大量数据的地方,采取旧的分类问题,这将通过深度学习来解决。将有数以千计的深度学习应用。” Hinton希望使用学习算法来读取各种X射线,CT扫描和MRI数据,这正是他认为的近期前景。 将来,“学习算法会做出病理诊断”,可能是读取巴氏涂片、听心音,或预测精神病患者的复发。 AI可以帮助医生、护士,减少他们的工作量。人类往往无法长时间处理大量的扫描影像和医疗数据,这导致有时候病变会被看漏,或者过了很久之后才被发现,AI正好可以解决这个问题,极有希望在不久的将来,在医疗领域掀起又一次技术革命。 肺炎:斯坦福大学的算法诊断肺炎好于医生 去年9月,美国国家卫生研究院曾发布一组数据,这给斯坦福大学教授吴恩达领导机器学习小组带来了启发。该组数据包含112,120个胸部X射线图像,标有14种不同的可能的诊断,以及一些初步的算法。研究人员要求四名斯坦福放射科医师对420张图像进行注释,以查找可能的肺炎迹象。 在一个星期内,斯坦福大学研究人员开发了一种名为CheXnet的算法,它能够比以前的算法更准确地发现原始数据集中的14种病理学中的10种。在经过大约一个月的训练之后,研究人员通过康奈尔大学图书馆发表的一篇论文中报告说,CheXnet比四位斯坦福放射科医师更能准确诊断肺炎。 在420张X光片上进行测试的ChexNet在灵敏度(正确识别阳性)和特异性(正确识别阴性)方面优于四名放射科医师。个人放射科医师用橙色X表示,他们的平均表现用绿色X表示,ChexNet用蓝色曲线表示。 斯坦福大学还创建了胸部X射线的热图,颜色代表最可能代表肺炎的图像区域,研究人员认为CheXnet可以极大地帮助人类放射科医生的工具。 AI比医生的标准方法更准确地预测心脏病发作和中风 目前而言,评估患者风险的标准方法依赖于美国心脏协会和美国心脏病学会制定的指南。医生使用这些指导方针,重点关注诸如高血压、胆固醇、年龄、吸烟和糖尿病等完善的风险因素,为他们的病人制定咨询和治疗方案。 英国诺丁汉大学的研究人员创建了一个AI系统,可以扫描病人的常规医疗数据,并预测哪些人在10年内会发生心脏病或中风。与标准预测方法相比,AI系统正确预测了355名患者的命运。 为了使系统做得更好,研究人员Stephen Weng及其同事为英国378256名病人测试了几种机器学习工具。这些记录追踪了2005年至2015年的患者及其健康状况,并包含了人口统计,医疗状况,处方药,医院访问,实验室结果等信息。 研究人员将75%的病历记录下来,并将其输入到机器学习模型中,以找出在10年内发生心脏病或中风的患者的显着特征。然后Weng的小组测试了另外25%的记录中的模型,看他们如何准确地预测心脏病发作和中风。他们还测试了该部分记录的标准指南。 如果使用1.0分表示100%的准确性,那么标准指导得分0.728,机器学习模型的范围从0.745到0.764,最好的分数来自一种称为神经网络的机器学习模型。 虽然机器评分听起来可能不是一个响亮的胜利,但当翻译成人类术语时,其意义就变得清晰了:神经网络模型预测,在7404例实际病例中,有4998例患者心脏病发作或中风,这超过标准355例方法。有了这些预测,医生可以采取预防措施,例如开药降低胆固醇。 自闭症:AI扫描婴儿脑部以预测自闭症 北卡罗来纳大学教堂山分校的一个研究小组发现了6个月大儿童大脑的变化与自闭症的关系,而深度学习算法能够使用数据,预测在24个月时自闭症高危儿童是否会被诊断为病症。 该算法正确地预测了高危儿童的最终诊断,准确率为81%,灵敏度为88%。与行为问卷相比算法的表现不错,因为问卷产生早期的自闭症诊断准确率只有50%。 这个研究小组的项目是由美国国家卫生研究院资助,项目招募了106名患有自闭症家族史的婴儿和42名无自闭症家族史的婴儿,并在孩子们6、12、24个月时扫描他们的大脑。算法仅使用三个变量 —— 脑表面积、脑容量和性别(男孩比女孩更可能有自闭症),算法确定了十个自闭症孩子中的八个。 研究人员发现,在6个月和12个月之间,婴儿的整体脑部发育没有任何变化,但后来被诊断为自闭症的高危儿童的脑表面积显着增加。表面积的增加与12至24个月之间发生的脑容量增长有关。换言之,在自闭症中,发育中的大脑首先在表面积上扩展了12个月,然后在整个体积中增加了24个月。 这个团队还在24个月的时候对孩子进行了行为评估,当时他们已经够大了,开始表现出自闭症的标志性行为,比如缺乏社会兴趣,语言延迟和重复的身体动作。研究人员指出,大脑过度生长越多,孩子的自闭症症状就越严重。 皮肉切割手术精准度,机器人击败了外科医生 在最近的一系列实验中,智能自主机器人STAR的发明者表明,它能比专家外科医生执行更精确的切割,并且对周围健康组织伤害更小。 STAR通过视觉追踪其预定的切割路径,切割工具并不断调整其计划以适应自身移动,最终完成工作。 对于这种视觉追踪,机器人依赖于研究人员事先在组织上放置的微小标记,这些标记显示在近红外摄像机上。研究人员因此将STAR称为半自主机器人。 机器人和外科医生都被要求切割直线5厘米的线。由于外科医生训练在已知标志之间切割组织,而不是切断绝对距离,因此在皮肤上绘制参考线。一些外科医生在开放式手术设置下进行了切割,而另一些外科医生进行了腹腔镜设置,这是日益普遍的手术操作,其中工具通过一个小孔插入。 机器人和人类都是根据它们偏离理想长度的理想切割线以及包围切口多少焦炭(受损的肉)来判断的。结果:STAR的切割长度接近5厘米,与理想的切割线偏离较少,并且导致焦点较少。 深度学习能帮助临床医生预测阿尔茨海默病(老年痴呆)吗? 阿尔茨海默病没有临床试验,因此医生通过评估患者的认知能力下降来诊断。但对于轻度认知功能障碍(MCI)的诊断特别困难,即症状不明显的早期痴呆阶段。而且更难预测哪些MCI患者会发展为阿尔茨海默病。 目前,哈佛大学领导的研究小组率先尝试将fMRI扫描和深度学习结合到一个能预测MCI患者发展为阿尔茨海默病的概览的项目中。静息时对患者进行fMRI扫描,与任何fMRI扫描一样,它们揭示了大脑中电信号的闪烁以及这些区域如何相互关联。 这种关系的术语是功能连接性,并且随着患者发展MCI而改变。这是因为信号依赖氧气流向神经元,但是阿尔茨海默病患者中tau蛋白的积累会扼杀这些神经元,导致脑部区域萎缩。 该小组想要看看他们是否可以使用功能连接的这些变化来预测阿尔茨海默病。他们从93名MCI患者和101名由阿尔茨海默病神经成像倡议提供的正常患者的数据开始。研究人员根据参与者大脑90个区域的130个fMRI测量结果的时间序列,可以确定信号在一段时间内闪烁的位置。...