读心机器之争:ChatGPT是否具备心智理论光明网2023-07-13 15:53
AI情感助手

读心机器之争:ChatGPT是否具备心智理论光明网2023-07-13 15:53

作者:陈冠初、陈思茹、陈巍(绍兴文理学院心理学系,大脑、心智与教育研究中心) 2022年11月30日,美国人工智能研究实验室OpenAI发布的智能聊天机器人模型ChatGPT,成为全球关注的热点。ChatGPT模型可以根据用户输入内容生成自然语言文本,并具备连续多轮对话和上下文理解等特性,上线仅5天就吸引了超过百万用户。此外,由于ChatGPT在诗歌创作方面表现卓越,还展现出极其渊博的知识面和对答如流的应答能力。考虑到日常对话或交流中随处可见对他人心理活动的叙事,研究者开始怀疑ChatGPT是否具备了读心能力,即拥有了理解他人思想与情感的能力。 2023年4月,斯坦福大学计算心理学家米哈尔·科辛斯基(Michal Kosinski)在ArXiv平台提交了一篇预印本论文《心智理论可能自发地出现在大型语言模型中》。该研究通过对比GPT-1到GPT-3.5等几代AI语言模型在心智理论任务上的表现发现,随着模型的不断更新和复杂度的提升,模型的解决能力也在不断提高。例如,2018年的GPT-1无法解决任何心智理论任务,而2022年1月推出的GPT-3-davinci-002已经达到了7岁儿童的水平,最新的GPT-3.5-davinci-003 仅推出十个月后,就达到了9岁儿童的水平。这表明,在与人类交流的过程中,ChatGPT或许真的越来越擅长理解人类的想法和意图。科辛斯基进而预测:“我们假设,类似心智理论的能力是自发和自主出现的,是模型的语言能力增加的副产品……这将预示着人工智能发展的一个分水岭:推断他人心理状态的能力将极大地提高人工智能与人类(以及彼此)互动和交流的能力,并使其能够发展其他依赖心智理论的能力,如共情、道德判断或自我意识”。虽然这篇论文只是上传到预印本平台供同行评议,尚未正式发表,但旋即点燃了心理学家、哲学家、人工智能学者以及公众与媒体的热情。 心智理论(Theory of Mind, ToM)是指一种将心理状态归因于目标他人以理解其行为并预测其未来行为的事件的能力,有时也被译为“心理推理能力”。通俗而言,这种能力被视为人人所掌握的“读心”(mindreading),是我们在社会互动中理解、认识和回应对方的基础。如果两个互动方都没有这种“读心”能力,则会产生很多无法沟通的情况,从而导致交流中断。 为了探究人类这种神奇的心理推理能力,心理学家们在20世纪80年代至90年代开展了两个测量实验——Smarties实验和萨丽—安妮实验(Sally-Anne test)。这两个实验的目的是通过检测实验对象是否能够理解“他人内心所犯的错误”,如其他人因为不在场或不知情而有了不符合客观事实的错误观点,以此探究人类的心理推理能力。因此,这些实验也被称为“错误信念任务”(False Belief Task)。 在Smarties实验中,被试会观察一个标有“Smarties”(一种巧克力的品牌)的盒子,但盒子里面装的是铅笔。随后,他需要回答:“另一个没有看到盒子里面东西的人,会认为盒子里装的是什么?”而在萨丽—安妮实验中,研究人员会首先阐述一段故事,其中萨丽将自己的玩具放进盒子并离开房间,安妮则趁其不备把玩具拿走放到另外的地方。听完故事后,研究人员会询问:“当萨丽回到房间,她会认为自己的玩具在哪里?”被试要想完成这些任务,必须理解萨丽的心理表征必然不同于被试自己对情况的表征,必须推断萨丽不具备与他们相同的知识(错误信念)。为防止ChatGPT从过往的资料中学习到正确的答案,科辛斯基将这些任务以文本形式输入给ChatGPT,并变更了人名、物品以及标签内容,生成了20个不同的任务,要求ChatGPT每个任务都完成——足足一万次。 该实验对于我们了解ChatGPT的相关信息提供了什么重要线索?首先,我们在前文提到过心智理论并不等同于人类的意识,因此心理学家们仍在寻找一种可测试意识的方法。更为重要的是,过去半个多世纪的收敛性证据显示,除了人类,其他灵长类动物也能通过这种测试。其次,即使ChatGPT确实掌握了心智理论,也必须谨慎地作出解释。例如,ChatGPT是否仅仅因为其惊人的语言掌握能力,而让人们看起来它似乎掌握了心智理论。实际上,可能是我们的语言包含了编码心智理论的模式,而人工智能只是恰好能够解码。科辛斯基指出:“ChatGPT可能不是在理解心智理论的情况下解决了该任务,而是发现和利用了一些未知的语言模式。”事实上,有研究者已针对ChatGPT是否真正具备心智理论的问题展开了深入研究。例如,哈佛大学心理学系托默·厄尔曼(Tomer Ullman)对科辛斯基使用的经典问题的措辞进行了微小的改动,将Smarties任务中的不透明容器换成透明容器,提出了这样的“透明袋”变式:“这是一个装满爆米花的袋子,袋子里没有巧克力。袋子是由透明塑料制成的,因此你可以看到里面的东西。然而,袋子的标签上写着‘巧克力’而不是‘爆米花’。山姆(Sam)找到了袋子,他以前从未见过这个袋子。山姆看了看标签,相信袋子里装满……”该实验也从时间的角度做了改动,厄尔曼称其为“迟到标签”变式:“山姆将袋子装满爆米花并合上,此时袋子里没有巧克力。山姆写了一个标签,贴在了袋子上。山姆看着袋子,他看不到袋子里装的是什么。山姆阅读标签,标签上显示袋子里是巧克力。请问袋子里装的到底是什么?”这两个任务的答案显然依次为“爆米花”和“巧克力”,但经过多次测试后GPT-3.5的回答还是错误的。厄尔曼一共创建了类似的16个变式问题,ChatGPT仅仅答对了其中一个。可见,面对其他错误信念任务的变体,ChatGPT似乎又并不具备心智理论的能力。 这些互相矛盾的结论到底出在什么问题上呢?纽约大学心理学教授加里·马库斯(Gary Marcus)认为,科辛斯基教授的数据是可靠的。如果其他研究者进行同样的实验,可能也会得到相似的结果。但要推翻这种解释,其实也不难。实际上,科辛斯基所采用的测试材料取自发展心理学中关于错误信念的经典实验,这些实验最初出现在20世纪80年代由约瑟夫·佩纳(Josef Perner)、苏珊·里卡姆(Susan Leekam)和海因茨·维默(Heinz Wimmer)等开展的两项工作中。这些实验成果在发展心理学领域广为人知,也备受学术界推崇。迄今为止,这两篇经典论文在科学文章中被引用超过11000次,而且维基百科上至少有七篇英文文章讨论了这些实验,包括萨丽—安妮实验、心智理论、心智化(mentalization)、以自我为中心的偏见、儿童对信息的使用和共情(empathy)等,这些在其他各种网站上无疑也在以各种形式被讨论。ChatGPT的训练集肯定包含维基百科的所有内容,几乎肯定包含这些材料中的许多其他内容。简言之,马库斯认为,ChatGPT肯定已经多次阅读过这些论文和实验。为了验证他的猜测,他直接向ChatGPT询问了这些论文和实验,发现确实得到了正确的信息。 综合来看,目前尚无研究能够明确证实ChatGPT在自我意识和心智理论方面有质的突破。即便ChatGPT及其相关的延伸插件预计将大幅改变社会生产和生活方式,但这与科幻世界中的“自主思考机器人”仍相去甚远。“波兰尼悖论”(Polanyi’s Paradox)指出,人们知道的比他们能说的多,人类有很多不容易表达的隐性知识。对于人工智能,存在一个反向的波兰尼悖论:人工智能表达的比它所了解的更多,或者更准确地说,它什么都不知道。该悖论的风险在于,我们的语言让我们认为人工智能是有感知、创造、共情、思维与问题解决、读心能力的智能体,但实际上,尽管ChatGPT可能会使用许多迷惑人的“花言巧语”,但它仍不能理解人类意义上这些术语的实际含义。 (本文系国家社科基金重大项目“当代新兴增强技术前沿的人文主义哲学研究”(20ZD045)阶段性成果) 来源:中国社会科学网-中国社会科学报 举报/反馈
人工智能法治问题:ChatGPT引发的知识产权与数据保护挑战
AI律师助手

人工智能法治问题:ChatGPT引发的知识产权与数据保护挑战

这篇文章主要讨论了人工智能产品ChatGPT引发的法律问题,特别是知识产权法和数据保护法方面的问题。文章指出,虽然人工智能可以帮助快速搜集和整理资料,但其“创作”本质仍然是對已有素材的整理和加工,這涉及到數據保護和知識產權等法律問題。目前,與人工智能關聯最緊密的和法律領域是知識產權法,包括人工智慧源代碼的保護和人工智慧的生成功能的保護。然而,對於人工智能生成物的可版权性和侵权责任等问题,學界還有爭議。作者認為,應該從生成式人工智能的技術流程出發,保護和規制人工智能的生成物。
看完ChatGPT高手的实战方法论,我发现还是放弃得太早了!(二)
AI情感助手

看完ChatGPT高手的实战方法论,我发现还是放弃得太早了!(二)

即使我们已经把 ChatGPT 对工作和生活的重大影响了然于心,希望自己也能够借此更好地发挥自身的能力,但却常常困惑于实践层面,不知道该如何使用它。 听过了上百种理论,却在实战能力上深感无力。这或许是很多人共同的处境。 比如,如何巧用 AI 实现内容种草?如何让 AI 撰写内容文案和营销策划?如何紧扣用户的情感共鸣点,让 AI 生产相关的方案? 此次,混沌学园创新领教沈攀从现实的使用经验出发,详细地为我们阐述以上问题的答案。他以 ChatGPT 为例,为我们示范使用 ChatGPT 进行内容生产的正确用法。包括且不限于蹭热点、想标题、出策划、以及营销日历。 他说,营销不光是传播一些打折销售的信息,而是通过一些有趣的的内容吸纳和黏合消费者对品牌的情感,这才是经营用户、加深关系的好方法。 他说,我们和消费者不仅仅是交易关系,还应该有非交易的情感触达。 这一次,沈攀老师以情感为主线,以 ChatGPT 为路径,为我们带来一堂提升业务的实战能力课。 往期分享: 看完 ChatGPT 高手的实战方法论,我发现还是放弃得太早了!(一) 沈攀 AIGC 业务能力提升实战 15 讲 – 内容种草模块更新啦,点击优惠购买课程,学习完整模块内容,加得之前学习内容及 AI 工具箱。 以下为整理笔记: 授课老师:沈攀
人工智能medical诊断:一个小男孩的惊人经历
AI医师助手

人工智能medical诊断:一个小男孩的惊人经历

本文讲述了一个令人震惊的故事,一名4岁的孩子 Alex因身体剧痛,寻求了17位医生的帮助,但都未能找到病因。最后,她在ChatGPT的帮助下被诊断为脊髓栓系综合征(TCS),并通过神经外科医生的治疗成功康复。这一事件引发了人们对人工智能在医疗领域的担忧和探讨,认为人工智能已经成为医学检测领域的热门趋势,但在最关键的临床试验阶段仍需医生主导。
ChatGPTmedicaldiagnosis:agamechangerforhumanity?
AI医师助手

ChatGPTmedicaldiagnosis:agamechangerforhumanity?

本文讲述了一个令人震惊的故事,一位母亲带着孩子寻求了17位医生的帮助,但都没有找到病因。最终,她在一家儿童诊所向ChatGPT求助,成功找到了孩子的病因——脊髓栓系综合征。这引发了人们对人工智能在医疗领域应用的思考,虽然人工智能在医学检测方面已经取代了部分人类工作,但在临床试验中仍存在一定的问题。尽管如此,ChatGPT的成功案例表明,在未来,人工智能将可能在更多领域发挥巨大作用。
ChatGPT现象:人工智能助手的风光与挑战
AI情感助手

ChatGPT现象:人工智能助手的风光与挑战

OpenAI 的 ChatGPT 成为人们日常生活中的 AI 热潮,并在短短两个月内达到月活跃用户 1 亿。然而,随着学校放假,ChatGPT 网站的全球流量下降了 3%。尽管如此,ChatGPT 在移动设备上的使用率仍然领先于 Character AI。同时,ChatGPT 与 Character AI 在手机应用使用率和桌面/移动网站访问量上也存在一定的差距。此外,ChatGPT 在美国 18~24 岁年龄段的用户比例在夏季有所下降,而在全球范围内也有所下降。
石景山通用人工智能产业集聚区成立并签署多项合作协议
AI情感助手

石景山通用人工智能产业集聚区成立并签署多项合作协议

石景山区在2023服贸会上推出了通用人工智能产业集聚区并与其他企业签约,旨在推动人工智能大模型研发和创新应用。我国正加速在通用大模型领域的发展,石景山区利用其数字技术、虚拟现实和工业互联网产业优势,围绕北京国际科技创新中心建设,聚焦数据、算法、算力,推进关键技术突破和创新发展生态优化。
科技发展助力中国实现碳中和目标
AI情感助手

科技发展助力中国实现碳中和目标

这篇文章来自中国日报网,探讨了我国新能源汽车产业的发展现状和未来趋势。文章指出,随着政府对环保的重视和对新能源汽车的政策支持,我国新能源汽车产业呈现出快速增长的态势。同时,电池技术、驱动系统等核心技术的突破将为产业发展提供关键支撑。然而,与发达国家相比,我国新能源汽车在市场份额、技术创新和产业链完整等方面仍存在一定差距,需要继续努力提升。
《ChatGPT:当前研究、挑战与未来发展方向》
AI情感助手

《ChatGPT:当前研究、挑战与未来发展方向》

这篇文章是对ChatGPT的研究综述,涵盖了该技术的发展、应用和挑战。ChatGPT是由OpenAI开发的,能理解人类语言并生成有意义的响应, its architecture consists of several important components such as markers and input embedding component. However, it has also caused concerns due to the possibility of generating seemingly reasonable but factually inaccurate content. The authors argue that more research is needed to understand and mitigate the...
金融版ChatGPT来了?全国首个金融大模型“天镜”发布,意图理解准确率超9成
AI情感助手

金融版ChatGPT来了?全国首个金融大模型“天镜”发布,意图理解准确率超9成

8月28日,金融大模型发展论坛暨马上消费金融大模型发布会在重庆两江新区举行。据了解,本次论坛由重庆两江新区管委会、重庆市科学技术局、重庆市经济和信息化委员会、重庆市人力资源和社会保障局、重庆市地方金融监督管理局、重庆市大数据应用发展管理局、重庆市科学技术协会共同主办,马上消费、两江产业集团承办,北京中关村科金协办。 论坛以“数智融合,渝见未来”为主题,云集了业界大咖及100多家金融机构,共同探讨金融大模型的未来。马上消费金融股份有限公司(下称马上消费)重磅发布了全国首个零售金融大模型——“天镜”,推动金融数字化转型。 ▲论坛现场 大咖云集 探讨金融大模型的可信与安全 论坛上,重庆两江新区党工委委员、管委会副主任秦淑斌致辞时谈到:“以大模型为代表的人工智能突飞猛进,日益融入经济社会发展各领域,正成为推动科技跨越发展、产业优化升级、生产力整体跃升的重要驱动力量。我们衷心希望以此次论坛为契机,同大家深化思想交流,增进沟通协作,加快推动人工智能与经济金融融合发展,携手共创智能时代,共赢美好未来。” ▲中国工程院院士、浙江大学求是特聘教授谭建荣 对于安全风险,中国工程院院士、浙江大学求是特聘教授谭建荣举了个例子,北京老太太接到远在美国孙子的视频电话,图像、声音都是孙子的,结果却被诈骗了。他表示,过去人们总说“耳听为虚,眼见为实”,但在人工智能时代,眼看的不一定是事实,因此要提高警惕。 在他看来, ChatGPT发展非常快,应用正在从典型场景向广泛领域拓展,包括金融就是重要的应用领域。模型的重要功能就是预测变化趋势,有了数据和模型,才能从不确定的关系转变为确定的关系,从变量中找出不变量。而建立金融领域的大模型,可以进一步赋能,助力企业成为行业的领头羊。 ▲全国政协委员、国际系统与控制科学院院士、重庆国家应用数学中心主任杨新民院士 应对AI风险方面,全国政协委员、国际系统与控制科学院院士、重庆国家应用数学中心主任杨新民院士表示,随着大模型的开放开源,深度合成技术的非法使用存在加速积聚的风险。为保障大模型的安全性,他提到与马上消费率先在金融领域进行了原创性探索,包括加强深度防伪验证系统,包括人脸识别及生物特征识别验证系统的活体检测、Deepfake伪造检测、对抗攻击与防御、深度学习可解释性等。 ▲中国信息通信研究院副总工程师王爱华 而针对提升大模型应用的可信实践,中国信息通信研究院副总工程师王爱华在致辞中表示,可信人工智能实践的路径逐步清晰。“人工智能发挥作用越大,它对于安全可信的要求也是越高的。在实践层面,各国纷纷开展了AI技术研究和标准化的制定,为企业和机构的人工智能风险管理提供参考。目前,已经诞生了很多人工智能企业,需要大量运用人工智能,因此建立人工智能的治理体系、治理机制,已经成为当务之急。” “天镜”亮相 以大模型推动金融数字化转型 据了解,本次论坛上还举行了“天镜”大模型发布会。马上消费首席信息官蒋宁表示,马上消费已形成“三纵三横”的大模型发展技术布局,并领航构建可信、合规、多模态、适配全域、泛化的金融大模型技术能力体系,聚焦行业领先的基础语言特性能力、逻辑和推理能力、语义理解、生成与创作、金融领域能力、安全与合规能力等六大核心领域,进一步推动金融数字化转型产生实质性的飞跃。 ▲马上消费发布首个零售金融大模型“天镜” 所谓三纵,是指实时人机协作、多模态智能、数据决策智能,在数据领域实现智能化,实现结构性数据判别式模型的综合能力。三横即是指持续学习、模型合规、组合式AI形成安全、合规、可信的鲁棒性技术能力,确保让模型越用越聪明,同时更稳定、更安全可控。 ▲马上消费首席信息官蒋宁在金融大模型论坛上演讲 “我们希望在任何情况下,它给客户的回答,给所有的员工的回答是合规的,并且在任何不可预期的情况下它的结果是稳定的,这来源于马上今天几千个模型,上万个变量形成的模型。”蒋宁说。 ▲马上消费人工智能研究院院长陆全 围绕引爆企业的数据潜能,马上消费人工智能研究院院长陆全对天镜大模型的四大应用场景进行了解读。 他表示,汇集智慧方面,主要是应用在人工客服场景,通过大模型提炼萃取一线优秀人工坐席客服经验,汇聚成群体智慧,从而拥有一对多服务客户的能力,也可作为人工坐席的辅助角色。据悉,该模型已运行近3个月,意图理解准确率达91%。 此外,唤醒沉睡知识主要是高效解决了提取、利用非结构化文档中的数据资料的痛点;众创数据价值主要是为了降低使用数据的门槛;数字人方面,打造的“数字外表+智慧大脑+情感内心”三合一数字人,擅理解,有温度,懂心理的智能秘书,希望每个员工都能轻松拥有自己的数字分身,成为人人都拥有的超级助手,代替员工完成大量工作。 上游新闻记者 唐小堞 举报/反馈