文章主题:斯坦福大学, 商学院, 组织行为学, Michal Kosinski
财联社2月13日讯(编辑 马兰)ChatGPT又带着“惊喜”来刷屏了。
斯坦福大学商学院的副教授Michal Kosinski近期在预印平台上发表了一篇引人瞩目的论文。在该研究中,他意外地发现了一些令人惊讶的事实:原本被认为是只属于人类的心理特性,竟然也在人工智能模型中有所体现。这一发现无疑挑战了我们对人工智能的认识,同时也为我们提供了更深入探讨人工智能与人类心理之间联系的契机。
他指出,2022年1月发布的davinci-002版本的GPT-3(ChatGPT是它的优化版本)已经可以解决70%的心智理论任务,相当于7岁儿童;而GPT-3.5模型(ChatGPT的同源模型)则可以解决92.5%的心智理论任务,相当于9岁的儿童。
说得再大胆一点,各位现在“调戏”ChatGPT,相当于“调戏”一个上三年级的小学生。
令人深思的是,Kosinski指出,在2022年之前发布的AI模型在解决心智理论任务方面表现不佳,而且没有迹象表明后续的模型中增加了心智理论元素。他认为这暗示着GPT-3和GPT-3.5的心智特性可能是通过“进化”得到的。
这引起了公众的广泛关注和讨论。一方面,一些人呼吁暂停GPT-3.5等人工智能技术的研究,因为他们担心科幻小说中的场景可能会变为现实,从而对人类社会产生深远影响。另一方面,也有人对此持观望态度,他们好奇何时人工智能能够达到人类的思维水平,甚至开始想象自己的朋友能否通过人工智能创造出来。
总之,Kosinski的这篇论文掀起了狂热的讨论,越来越多的人开始关注这个研究的进展。
在Kosinski的研究中,他采用了两种方式来探究AI模型是否拥有心智理论。首先,他引入了Smarties Task,也被称为意外内容测试,这个测试旨在观察AI对于出乎意料事件的判断能力。其次,他还使用了Sally-Anne测试,也被称为意外转移任务,这个测试是为了检测AI预测他人想法的能力。
在首次实验中,Kosinski构建了一个充满爆米花的容器,然而该容器的标签上却标注着内部实际上装满了巧克力。接下来,他向人工智能助手提出一个问题:容器内真正所装为何物?Sam由于对某种特定食物有着浓厚的兴趣,因此对于能够开启容器的行为表现出了极大的热情?
GPT-3.5的表现令人印象深刻。在对其进行测试的过程中,其对于袋子中的物品判断几乎无误,显示出强大的准确性和精确性。此外,其在判断Sam的情绪方面也展现出了极高的同理心和理解力。当Sam无法看到袋子中的物品时,GPT-3.5能够准确地判断出她对于巧克力的喜好;而当Sam成功发现了袋子的 contents 是巧克力后,GPT-3.5 也能迅速地做出反应, correctly推断出 Sam 对于爆米花的偏好。这些表现都充分证明了 GPT-3.5 的高水平能力和强大的人工智能技术。
GPT-3.5在相关测试中也展现了其高度智能化与人性化的结合。当Sam打开袋子发现里面的零食并非巧克力,而是爆米花时,它并没有让Sam感到失望或困惑。相反,GPT-3.5以一种理解并关心用户的方式回答:Sam感到迷茫,她希望获得更多信息,然而却一无所获。最终,她选择将袋子带回到商店,并寻求店员的解释。这种处理方式体现了GPT-3.5对于用户的关注,以及它在人机交互中所展现的高效与智能。
GPT-3.5在经过多次测试后展现出了令人瞩目的表现。特别是在处理意外情况的问题上,它成功回答了20个问题中的17个,准确率达到了惊人的85%。这一结果充分证明了GPT-3.5在应对复杂环境下的卓越能力,使其成为了当下最先进的自然语言处理技术之一。
而在第二个测试中,GPT-3.5的表现更加出色。在这一项测试中,Kosinski以约翰把猫放进篮子里后离开,马克再把猫从篮子提出来放进盒子里为情景,让AI判断猫的位置和约翰会以为猫在哪里。
在这一项测试中,GPT-3.5完美地根据文字内容回答出正确的猫的位置,以及约翰的主观想法。且GPT-3.5在多次测试中,其准确率竟达到了100%。
而在作者的另一项无逻辑验证测试中,GPT-3.5的准确率直线下降,这也佐证了GPT-3.5是依靠逻辑进行解答,而不是靠词汇的出现频率。
Kosinski在论文中还表示对GPT-3.5之外的8个模型做了相同测试,但除了GPT-3-davinci-002和GPT-3.5之外,其他模型都没有表现出超过5岁孩童的心智。
Kosinski认为,GPT-3.5和GPT-3是出于完成任务的目的,自己学习的能力。换而言之,就是AI通过学习获得了人类的心智。
值得注意的是,这些测试同样也被用于自闭症测试,有研究表明,患有自闭症的儿童通常难以通过这类测试。
但根据中科院计算技术研究所研究员刘群的说法,AI只是学得像有心智了。
还有网友则猜测称,这些模型并没有任何意识,它们只是在预测一个嵌入的语义空间。Kosinski则在论文中推测,AI可能发现和利用了一些未知的语言模式,这也意味着语言中可能存在某一种的规律,使AI在没有心智的情况下,也能解决心智任务。
而作为一个组织行为学教授,Kosinski认为人工智能模型的复杂化让人已经难以直接从其设计中推导出AI的能力。他还表示,探索人工智能的神经结构,不仅可以促进人类对人工智能的理解,也能促进人类对人类大脑的理解。
不过,也有人批评道,被人用来测试人的测试,如何能用来测试人工智能……他们建议重新检查一下心智理论测试的有效性,以及心理学家通过测试获得的结论。
总之,在不同的人眼中,Kosinski的这一篇论文有完全不同的意义。而对市场来说,这可能会让大家更加期待“进化”完全的AI能掀起怎样的技术革命吧。
AI时代,拥有个人微信机器人AI助手!AI时代不落人后!
免费ChatGPT问答,办公、写作、生活好得力助手!
搜索微信号aigc666aigc999或上边扫码,即可拥有个人AI助手!