Med-PaLM2：医疗大模型的突破与挑战

文章主题：谷歌, 医疗, Med-PaLM 2, 大语言模型

【太平洋科技资讯】据《华尔街日报》爆料，早在今年4月，Med-PaLM 2就开始在多家诊所内测试，其工作范围覆盖回答医疗问题、总结文件或处理医疗大数据等。

谷歌曾明确指出，在医疗领域中，Med-PaLM 2的表现远胜于其他通用大模型，如Bard、Bing和ChatGPT。

那Med-PaLM 2能力到底如何呢？

Med-PaLM 2是一款基于谷歌当前最尖端的大语言模型PaLM 2以及丰富医疗数据的AI系统。作为首个在MedQA测试集上实现“专家”级别的表现，该系统展现出了卓越的医疗信息处理能力。

它的起源Med-PaLM是美国医疗执照考试（USMLE）首个获得“通过”及以上成绩的AI模型，在MedQA数据集上的表现达到了67.2分的高分。

Med-PaLM 2在分数方面取得了显著的提升，达到了86.5，相较于原先的分数提高了19%。此外，该模型在MedMACQA、PubMedQA和MMLU等多个具有代表性的临床数据集上，表现出了与SOTA（最先进水平）相当或者更好的成绩。

在超过1000个实际的医疗场景问答中，Med-PaLM 2在九项基准测试中，其表现令人满意，达到了八项。相较于人类医生，该AI系统的回答获得了更多的认可。

与普通医生的回答相比，Med-PaLM 2有72.9%的回答被认为和医生回答相对一致。

在将 Med-PaLM 2 的数据应用于实际医疗场景时，仍面临一些挑战，尤其是在问题的准确性和稳定性方面。在上述测试中，Med-PaLM 2 未获得认可的基准测试指标中，“信息准确性/相关性”是唯一的。

尽管在实际应用落地中存在诸多困难，比如数据隐私方面的担忧、责任方的认定等，但这项技术代表了科技的进步，我们对AI在医疗领域的更多贡献和益处抱有期待。未来，AI将在医疗领域发挥更大的作用，造福人类。

Med-PaLM2：医疗大模型的突破与挑战

AI时代，拥有个人微信机器人AI助手！AI时代不落人后！

免费ChatGPT问答，办公、写作、生活好得力助手！

搜索微信号aigc666aigc999或上边扫码，即可拥有个人AI助手！