文章主题:谷歌, 医疗, Med-PaLM 2, 大语言模型
【太平洋科技资讯】据《华尔街日报》爆料,早在今年4月,Med-PaLM 2就开始在多家诊所内测试,其工作范围覆盖回答医疗问题、总结文件或处理医疗大数据等。
谷歌曾明确指出,在医疗领域中,Med-PaLM 2的表现远胜于其他通用大模型,如Bard、Bing和ChatGPT。
那Med-PaLM 2能力到底如何呢?
Med-PaLM 2是一款基于谷歌当前最尖端的大语言模型PaLM 2以及丰富医疗数据的AI系统。作为首个在MedQA测试集上实现“专家”级别的表现,该系统展现出了卓越的医疗信息处理能力。
它的起源Med-PaLM是美国医疗执照考试(USMLE)首个获得“通过”及以上成绩的AI模型,在MedQA数据集上的表现达到了67.2分的高分。
Med-PaLM 2在分数方面取得了显著的提升,达到了86.5,相较于原先的分数提高了19%。此外,该模型在MedMACQA、PubMedQA和MMLU等多个具有代表性的临床数据集上,表现出了与SOTA(最先进水平)相当或者更好的成绩。
在超过1000个实际的医疗场景问答中,Med-PaLM 2在九项基准测试中,其表现令人满意,达到了八项。相较于人类医生,该AI系统的回答获得了更多的认可。
与普通医生的回答相比,Med-PaLM 2有72.9%的回答被认为和医生回答相对一致。
在将 Med-PaLM 2 的数据应用于实际医疗场景时,仍面临一些挑战,尤其是在问题的准确性和稳定性方面。在上述测试中,Med-PaLM 2 未获得认可的基准测试指标中,“信息准确性/相关性”是唯一的。
尽管在实际应用落地中存在诸多困难,比如数据隐私方面的担忧、责任方的认定等,但这项技术代表了科技的进步,我们对AI在医疗领域的更多贡献和益处抱有期待。未来,AI将在医疗领域发挥更大的作用,造福人类。
AI时代,拥有个人微信机器人AI助手!AI时代不落人后!
免费ChatGPT问答,办公、写作、生活好得力助手!
搜索微信号aigc666aigc999或上边扫码,即可拥有个人AI助手!