小臂和小腿竟然都长了三根骨头?
这不是罕见病例,而是一幅由 AI 绘制的无意义插图。
图源:参考资料 1
更离谱的是,这幅插图竟然出自一篇已发表的医学 SCI 论文。
利用 AI 画图写作,作者辩称「经费有限」
7 月 12 日,一篇来自 5 位广东医生的临床研究论文被 Medicine 撤稿,理由是「对数据的完整性和不准确的插图表示担忧」[2]。
图源:参考资料 2
今年 4 月,这篇题为 Assessment of the efficacy of alkaline water in conjunction with conventional medication for the treatment of chronic gouty arthritis: A randomized controlled study 的论文正式发表,文中提到碱性水可有效缓解疼痛、减少关节肿胀、增强日常活动能力,并改善慢性痛风性关节炎治疗中的关节活动。
然而,这篇论文在数据和插图的科学性和准确性上均存在问题。
7 月初,研究员 Pfiffne 在社交媒体上表达了他对这篇论文中一张插图的质疑,称该插图是「由 AI 生成的垃圾图片」,因为该插图存在较多的解剖学错误。同时,他评价该图片中的注释文字为「胡言乱语」[3]。
图源:参考资料 3
随后,又有另一名网友发现,这篇论文的引言部分「100% 是 AI 生成的」[4]。
很快,这篇论文引起了更多的人的注意,包括期刊科学诚信顾问 Elisabeth Bik 在内的评论者纷纷发表意见。其中,Bik 指出,插图中的小腿和手臂在骨骼数量上完全错误,并且存在很多没有意义的标签,例如「chlsinkestead atlvs no ctivktty greuedis」和「Aliainine jerve sreiter」[5]。
她还指出,该论文的数据存在很多问题。例如,在该论文的表 2 中,高浓度组的上限范围的最后几位数字均为 0.84,中等浓度组则为 30 或 80,低浓度组则均为 0.88 [5]。
图源:参考资料 1
随着事件的发酵,这篇论文最终在质疑发生后的一周内被撤回。
该研究的通讯作者在接受撤稿观察网站(Retraction Watch)的采访时表示,英语不是该研究团队的母语,且翻译费用极其昂贵,因此该团队「利用 AI 对文本进行翻译和改进,并使用 ChatGPT 来生成插图和表格」。对于由此引起的任何争议,作者表示:「我们深表歉意。」[4]
AI 绘图事件频发,到底怎么过审的?
这并非第一次有研究论文因为 AI 绘图被撤稿。
今年 2 月,西安 3 名医生在 Frontiers in Cell and Developmental Biology 发表了题为 Cellular functions of spermatogonial stem cells in relation to JAK/STAT signaling pathway 的论文,阐述了精原干细胞与 JAK/STAT 信号通路相关的功能 [6]。(点击链接查看丁香园往期文章:发表 3 天就被撤稿!西安医生用 AI 画的离谱插图,是怎么过审的?)
论文的其中一张插图描述了从大鼠睾丸中分离、纯化和培养精原干细胞的过程,该插图被质疑由 AI 绘制完成,因为在图中,一只大鼠拥有松鼠的坐姿,且有 4 个睾丸和比身体还大的阴茎,图右下侧的培养皿中还有一把汤勺。
图源:参考资料 6
另外,插图的标注中还存在大量的英文单词拼写错误,以及一些看起来像单词但实际上没有任何意义的字母组合。
面对巨大的争议,该论文仅发表 3 天,就迅速被撤稿[6],期刊也单独公开致歉 [7]。
然而,该事件中,论文作者用 AI 制作文章插图的行为,实际上却符合期刊的投稿要求。
Frontiers系列期刊在相关规定中,允许人工智能加入(包括但不限于任何引述、引用或参考文献),但必须对其进行披露,并且作者必须检查其内容的准确性 [8]。
图源:参考资料 8
去年,美国田纳西大学健康科学中心的一名放射科医生使用 ChatGPT,4 个月写了 16 篇论文,其中 5 篇已发表。(点击链接查看丁香园往期文章:某院医生用 ChatGPT 在 4 个月内狂写 16 篇论文,其中 5 篇已发表)
四大医学顶刊之一 NEJM 也在今年还专门推出了新杂志 NEJM AI,编辑团队在第一卷中发文鼓励研究者使用大语言模型投稿 [9]。
图源:参考资料 9
让 AI 辅助科研与论文发表已经受到了众多支持,但接连发生的劣质 AI 论文顺利发表事件也让人开始担忧:如何保证 AI 创作的内容得到合理的审核?
允许 AI 进论文,审核机制有待更新
实际上,面对类似的事件,学者们并非认为要完全拒绝 AI,而是强调应该注意 AI 产物的「准确性」。
「在大多数情况下,AI 可能缺乏对科学概念和背景的正确理解。」一位大数据科学家认为,「研究人员必须仔细审查和验证 AI 生成的文本,以确保其准确性和有效性。」[10]
对于上述提到的两篇论文,它们引起广泛批评的主要原因,正是因为论文中使用的是 AI 生成的「错误」插图,论文作者并没有对插图进行有效的校对。
另一个问题则是论文投稿后,杂志方的审查过程。
正如网友评价的那样:「我很惊讶它通过了同行评审。」 [4]
更有网友戏称:「不会审核过程也用了 AI 吧?」[3]
一项研究对排名前 100 的学术期刊对作者使用 AI 的指导范围和内容进行了分析,结果发现,许多期刊的指导「严重不足」,这导致作者们「对该做和不该做的事产生困扰」,同时也对编辑和同行评审的审查过程造成了困难 [11]。
有科学家提出建议:「需要制定更全面的指南来概述 AI 在研究中的可接受用途。同行评审也应更加严格,需要专门识别和审查 AI 生成的内容。」此外,他们还表示,「临床科学家、编辑委员会、AI 开发人员和研究人员之应加强合作,以了解这些工具的功能和局限性。」[12]
而本次事件中, Medicine 杂志的发言人也表示,该杂志正在开展多项措施来改进编辑审查流程,通过与其他领先出版商开展合作,并考虑利用新技术,帮助塑造医学研究评审的未来 [4]。
策划:肯德羊|监制:carollero
题图来源:参考资料 1、自己做的
参考资料:
[1]https://www.ncbi.nlm.nih.gov/pmc/articles/PMC10994428/
[2]https://journals.lww.com/md-journal/fulltext/2024/07120/assessment_of_the_efficacy_of_alkaline_water_in.91.aspx
[3]https://x.com/MorganPfiffner/status/1808586391959326976
[4]https://retractionwatch.com/2024/07/22/giant-rat-penis-redux-ai-generated-diagram-errors-lead-to-retraction/
[5]https://pubpeer.com/publications/0662F1D2E21480EB8307A1C2DFDE4D?utm_source=Chrome&utm_medium=BrowserExtension&utm_campaign=Chrome
[6]https://www.frontiersin.org/journals/cell-and-developmental-biology/articles/10.3389/fcell.2024.1386861/full
[7]https://www.frontiersin.org/news/2024/02/16/frontiers-statement-concerning-the-article-cellular-functions-of-spermatogonial-stem-cells
[8]https://www.frontiersin.org/guidelines/author-guidelines
[9]https://ai.nejm.org/doi/full/10.1056/AIe2300128
[10]https://www.technologynetworks.com/drug-discovery/articles/ai-in-science-publication-the-good-the-bad-and-the-questionable-385650
[11]https://www.ncbi.nlm.nih.gov/pmc/articles/PMC10828852/
[12]https://www.bmj.com/content/384/bmj.q119.full
我们应该如何合理利用 AI 提升写论文效率?
丁香园社区论文写作投稿版版主 @WOrange 曾发文「用 ChatGPT 写了 16 篇论文,成功发了 5 篇!」,并在其中总结了不少用人工智能完成论文写作的经验技巧:
👇 点击文末【阅读原文】即可查看详细内容,一起学习。返回搜狐,查看更多
责任编辑: