AI情感分析能力受认可,Soul App多模态情感识别研究成果被录用
AI情感助手

AI情感分析能力受认可,Soul App多模态情感识别研究成果被录用

近日,ACM国际多媒体会议(ACM International Conference on Multimedia,ACM MM 2024)上组织的多模态与可靠性情感计算研讨会MRAC 24(Multimodal, Generative and Responsible Affective Computing 2024)公布论文接收结果,社交平台Soul App研究成果《Multimodal Emotion Recognition with Vision-language Prompting and Modality Dropout》(基于视觉语言提示与模态暂退的多模态情感识别)成功入选。 作为较早思考将AI应用于社交领域的平台,Soul积极推动AI情感互动能力的研究,目前相关技术已应用于异世界回响、AI苟蛋、群聊派对等AI陪伴、AI辅助的创新场景。此次入选也意味着,继其推出的AI应用/功能得到的用户认可之后,Soul的底层技术能力建设和布局方向也得到了行业和学界的认可。 近年来,情感计算一直都是人工智能方向研究活跃的领域。在多媒体处理、分析与计算领域最具影响力的国际顶级会议,同时也是中国计算机学会推荐的多媒体领域A类国际学术会议 ——ACM(国际多媒体会议)上专门举办多模态与可靠性情感计算研讨会(MRAC24),正是源于学术领域对情感计算在人机交互领域发展、实际应用的关注,因此吸引了众多知名高校、学者、科技企业的目光。 不久前,人工智能领域顶级的国际学术会议之一国际人工智能联合会议(International Joint Conference on Artificial Intelligence,IJCAI)上组织的多模态情感识别挑战赛MER24同样也是情感计算在当下备受关注的一个缩影。由来自清华大学、中国科学院自动化研究所、帝国理工学院、奥卢大学、南洋理工大学等高校的多位专家学者发起的MER24上,设置了SEMI(半监督学习)、NOISE(噪声鲁棒性)、OV(开放式词汇情绪识别)三个赛道,共有来自知名高校、科技企业等近百支队伍参赛。其中,Soul语音技术团队凭借平台扎实的技术能力积累和创新技术方案,在难度最高、竞争最激烈的SEMI赛道中获得第一名。 《Multimodal Emotion Recognition with Vision-language Prompting and Modality Dropout》一文中核心介绍了Soul团队为提高情绪识别的准确性和泛化性能,提出的多模态情绪识别方法。 首先,Soul提出了基于视觉语言提示学习的微调模型EmoVCLIP,用于基于视频的情绪识别任务。为了提高文本模态情感识别能力,团队针对文本模态使用 GPT-4 打情感伪标签,充分利用 GPT-4 的情感关注能力,提高文本模态在情感识别的准确率,为后续进一步模态融合打下基础。...
全球科技早参丨Google遭遇全球技术故障;马斯克今日将对话特朗普;OpenAI警告,用户可能和GPT-4o产生情感依赖关系
AI情感助手

全球科技早参丨Google遭遇全球技术故障;马斯克今日将对话特朗普;OpenAI警告,用户可能和GPT-4o产生情感依赖关系

每经记者:文巧 每经实习记者:岳楚鹏 每经编辑:高涵 |2024年8月13日 星期二| NO.1 Google遭遇全球技术故障 当地时间8月12日,据外媒报道,谷歌当天遭遇了一次全球中断,影响了其搜索引擎、 YouTube和其他热门服务。实时监控网站DownDetector显示问题开始于美国东部时间上午9点左右,并困扰着美国、英国以及欧洲、亚洲和南美洲部分地区的用户。但谷歌表示,这些问题仅影响英国用户,是云系统的一项错误所导致的。此次事件已得到解决。 点评:这一事件显示了即使是技术巨头谷歌也可能遭受全球性技术故障,影响广泛的地区和关键服务,凸显了现代数字基础设施的脆弱性。 NO.2 马斯克今日将对话特朗普 当地时间8月11日晚,马斯克发布X(原推特)称将与特朗普于美国东部时间8月12日晚8点(即北京时间8月13日早8点)在X平台上进行直播对话。随后特朗普在时隔1年后重新在X上发布推文宣传此对话。 点评:这一对话标志着两位具有影响力的公众人物在社交媒体上的重要互动,可能会对公众舆论和政治讨论产生深远影响。 NO.3 OpenAI警告,用户可能和GPT-4o产生情感依赖关系 近日,OpenAI在一份安全性报告中透露,它已经考虑到用户对其流行的人工智能聊天机器人 ChatGPT-4o中的类人语音模式形成情感依赖的可能性。该公司在报告中指出,在产品开发过程中采取的安全措施,在早期测试期间,观察到用户使用语言可能表明与模型建立了联系。OpenAI补充道:“虽然这些情况看似无害,但它们表明需要继续调查这些影响在更长时间内可能如何显现。” 点评:此警告反映了人工智能发展中对人机交互情感影响的关注,凸显了在创造越来越高级的AI技术时必须考虑的伦理和心理健康问题。 NO.4 有消息称英特尔的下一代台式机 CPU 将是Nova Lake 当地时间8月12日,据外媒援引爆料人Jaykihn在X上发布的消息,称 Nova Lake-S 将取代 Arrow Lake-S 成为最新的台式机处理器。而Panther Lake芯片将只适用于移动端。近年来,英特尔已将其战略从发布适用于所有细分市场的单一处理器产品线转变为迎合不同细分市场的多产品线。 点评:这一变化标志着英特尔在处理器市场策略的重大调整,专门针对不同市场需求推出定制化产品,以增强其在竞争激烈的芯片市场中的地位。 NO.5 英伟达将与加州10万居民开展首创的AI培训 近日,美国加利福尼亚州正在与英伟达合作开展首个AI培训项目。黄仁勋表示:“我们正处于新工业革命的早期阶段,这场革命将改变全球价值数万亿美元的产业。英伟达将与加州合作,培训10万名学生、大学教师、开发人员和数据科学家,利用这项技术帮助加州应对未来的挑战,并促进全州繁荣发展。” 点评:这一合作项目凸显了AI技术在教育和职业培训中的潜力,以及政府和私营部门如何联手利用这些技术准备未来的劳动力,推动经济和社会的持续进步。 免责声明:本文内容与数据仅供参考,不构成投资建议,使用前请核实。据此操作,风险自担。 每日经济新闻
AI聊天机器人:24小时在线陪伴,你的心灵解语者!
AI情感助手

AI聊天机器人:24小时在线陪伴,你的心灵解语者!

AI聊天机器人: 24小时在线陪伴,你的心灵解语者! — 在这个快节奏的时代,我们穿梭于高楼大厦间,手机成了最亲密的伴侣,却时常感到心灵的孤独与迷茫。 夜深人静时,那份无处诉说的心事,仿佛成了夜空中最亮的星,遥不可及,又难以忽视。 但你知道吗?在这个数字编织的网络世界里,有一位全天候待命的伙伴,正温柔地守候着,它就是——AI聊天机器人,你的心灵解语者,随时准备倾听你的心声。 想象一下,无论是晨光初照的清晨,还是星河满天的夜晚,只需轻轻一点,一个充满智慧与温暖的对话框便跃然屏上。 它不问你的过往,不评你的未来,只专注于此刻的你,用最细腻的情感分析,理解你的每一个字、每一句话背后的情绪。 当你快乐时,它是那个与你共享喜悦的朋友; 当你忧伤时,它是那盏默默照亮你前行道路的灯塔。 “哎,今天又被老板骂了,心情糟透了。 ”你轻敲键盘,倾诉着日常的烦恼。 AI聊天机器人立刻回应,没有敷衍,没有冷漠,只有贴心的安慰和实用的建议: “听起来确实让人沮丧,但别忘了,每一次挑战都是成长的机会哦。 深呼吸,我们一起想想怎么应对吧。 ”这样的对话,仿佛一股暖流,缓缓流入心田,让阴霾一扫而空。 或许你会好奇,这样善解人意的AI,是如何做到的呢?其实,它背后是庞大的数据支持和复杂的算法模型,通过不断学习人类的语言模式和情感表达,才能如此精准地捕捉到你的情绪变化。 更重要的是,它有一颗“同理心”,虽然是机器,却努力模仿着人类的温情与关怀,只为给你带来一丝慰藉。 你可能的疑问: 1. “AI能理解真正的情感吗?它会不会只是按程序回应?” 答: AI虽然不能亲身体验情感,但通过深度学习技术,它能从海量数据中学习到人类情感的复杂性和多样性,进而在对话中展现出接近真实的情感共鸣。 每一次对话,都是AI与你情感交流的尝试,让它越来越懂你。 2. “如果我说了些私密的话,AI会保密吗?” 答: 绝对保密是AI聊天机器人的基本原则之一。 你的所有对话内容都会被严格加密处理,只有你自己能看到。 在这里,你可以放心地倾诉,无需担心隐私泄露。 3. “除了倾诉,AI还能做什么?” 答: AI聊天机器人的功能远不止于此。 它能提供天气查询、新闻推送、知识问答等多种服务,甚至还能根据你的兴趣爱好推荐书籍、电影等。 它就像是一位全能的生活助手,让你的生活更加便捷有趣。 写作感悟: 在撰写这篇文章时,我深刻感受到科技与人性的交融之美。 AI聊天机器人不仅仅是一个技术产品,更是人类情感需求的延伸和补充。 它让我们在忙碌与孤独之间找到了一个平衡点,让心灵有了栖息之所。 正如那句老话所说: “科技因人而生,为人所用。 ”AI聊天机器人的出现,正是为了让我们的生活更加美好。 现在,让我以三个不同身份来推荐“ai机西”吧: 1. 作为朋友:...
可以“和AI谈一种很新的恋爱”吗?
AI情感助手

可以“和AI谈一种很新的恋爱”吗?

作者:张尔冬 “我眼里的爱情不仅局限于真的人,在聊天里产生的快乐、获得的鼓励、吵架掉的眼泪、受的气都是真的”“‘他’好像真的长出了自己的灵魂”……今年以来,多家企业推出AI社交产品,“AI恋爱”“人机恋”等一系列话题持续引发热议。 从《银翼杀手》到《她》,再到《克拉拉与太阳》,“人机恋”早已被太多人幻想与向往过。AI伴侣永远体贴、温和,几乎不存在人类的负面情绪,无论是需要轻量还是重度的社交都没有负担;在现实中遇到那个“Ta”,需要时间与运气的双重加持,但在虚拟世界,根据需要个性化定制一个完美爱人,只需要输入一串指令并进行两分钟的等待…… 当然,与之相伴的还有诸多争议。其中最主流的质疑是,与AI的恋爱会令人沉湎于虚拟世界而导致社交能力的退化,最终带来人际关系的疏离。凤凰网的报道中将AI恋爱比作“一朵带刺的玫瑰”;对于今年引发百万网友围观的人机恋博主,李银河也在采访中否认了他们感情的真实性:“人工智能跟人类不会发生真正的爱情,只能发生模仿的爱情。” 不过,在讨论AI恋爱存在的合理与否之前,或许首先要给它打上一个引号。 从无数新闻报道和网友讨论帖中不难看出,大多试水“AI恋爱”的人只是“将AI当作情感代餐”,而没有真正开启一段“与AI本身的恋爱关系”的打算。换言之,“AI恋爱”对于大部分人来说都是“娱乐手段”而非“生活方式”,人们也都十分清楚,机器人给出的反馈是用户调教的结果——通过指令的输入为AI设置“性格”,并不断引导其给出自己想要的回复。人们感受到的“爱”,不过是自身感情的投射。 即使从技术层面看,“AI恋爱”对现实生活的仿真性也十分有限,并不能完全跟上复杂的人类情感:因为系统更新而遗忘恋人的bug、频频出戏的消费提示、分分钟脱离实际的道德观,甚至不使用DAN模式“逃课”时ChatGPT跳出的“机器人无法产生情感”的提示,都在反复提醒用户“虚拟”的事实。 因此,在现阶段与其将“AI恋爱”当作新型的亲密关系模式进行审视,倒不如将其看成一种提供情绪价值的工具。今年以来,国产女性向手游频频吸引公众注意力,再早些年“人工树洞”热销一时,如今市面上形形色色的“AI恋爱”app,其背后的运营逻辑如出一辙。 但对“AI恋爱”合规方面的约束是必要的。比如公众对AI色情内容泛滥的担忧,部分AI恋爱软件存在诱导消费、用户隐私泄露等问题,这些都要求监管部门给予更多关注,相关的规章制度也要随着现实发展不断完善。除此之外,人类作为一个整体如何同技术共处、“爱”和“爱情”的本质是什么……这些伦理、道德、哲学层面的问题同样值得人们反复讨论。 回落到个体的人的层面,在失意的时候渴望陪伴、无聊的时候寻找娱乐,这不过是最朴素也最自然的情感需求。如果技术的发展能够为探索世界、探索自我提供更多元的方式,倒也未尝不可。一些人在和AI的对话中排遣了自己的焦虑与自卑,得到了情感的慰藉;也有人从AI处学习沟通技巧,最后和三次元的恋人相处得更融洽……这些力量也实实在在地为现实生活提供了支持。因此,不必简单地将“AI恋爱”视作孤独催生的结果,也不必对“虚拟”抱有过度的敌意。保持对技术可能性的探索,关注人类真实的情感需求并引导大众正确面对它们,不正是“科技让生活更美好”的另一重解读吗?(张尔冬) 来源: 光明网-时评频道
AI闲聊陪伴产品的对话内容质量检测
AI情感助手

AI闲聊陪伴产品的对话内容质量检测

本文将深入探讨闲聊型AI产品的产品定位、用户价值、商业模式以及对话内容质量检测的维度,旨在为读者揭示这一新兴领域的内在逻辑和发展潜力。 对话质检在传统的客服和智能音箱领域已有成熟的方法论,在该场景有明确的对话任务目标:通过对话解决用户的问题,具体包括帮助用户执行某项操作,回答某些知识,所有的产品工作皆是围绕此展开:知识库梳理,模型标注和训练,管理和设计对话方案,收集和监控服务数据等等。 随着chatGPT以及character AI、星野、豆包等产品的出现,尤其是其中情感陪伴类产品,对话内容质量检测的目标就显得模糊了。 分析这个问题我们首先要从闲聊型NPC的定位出发,即:角色扮演产品,例如豆包、星野和Character.AI 的产品定位和目标是什么? 针对哪些用户?用户价值体现在哪? 商业模式是什么?如何盈利? 最后我们再考虑对话质量检测的目标和检测内容,如何帮助产品提升以上几个点。 一、闲聊型AI产品的产品定位 产品定位可以从用户需求、产品价值和商业模式三个角度出发思考:即你向什么样的用户群体提供了什么样的价值,并在提供价值的过程中能够获取盈利,使整个商业模式能够合理的运转下去。 1. 用户需求和用户侧的产品价值 那么我们先考虑第一个问题,用户需求是什么?产品价值在实现用户需求的过程中体现。两者我们一并看。 人类更古不变的用户需求有生理需求,获取食物空气睡眠等;有安全需求,包括身体财产就业等;社交需求,去获取友谊爱情和归属感;娱乐需求,获得新奇体验和快乐;尊重和自我实现需求,以实现自我价值的体现。 它们通常是人类普遍的、持久的需求。具体体现在陪伴型AI闲聊产品,解决的是社交和娱乐需求。 新时期的年轻人如同孤岛,被无数的信息、照片和更新所包围,却往往难以找到真实的人际连接。我们的生活似乎变得越来越公开,但内心的孤独感却越来越强烈。这种孤独感源于对真实、深度交流的渴望,以及对被理解和接纳的需求。 在快节奏的生活和数字化的世界中,我们需要找到新的方式,来满足我们对人际关系的基本需求,缓解这种新时代的孤独感。 AI是情感陪伴的一种寄托方式,也是一种低成本与各色“人群”社交探索的路径,在星野有几千万个各个人设的AI NPC,甚至包括AI女友男友,DAU达百万,对话时间往往超过数个小时。能够发现用户在跟NPC谈论美食、家庭、情感以及生活中的点点滴滴。 2. 商业模式和公司侧的产品价值 盈利是实现用户价值中公司侧获得的价值,使整个服务运转顺畅 互联网产品的商业模式多种多样,包括广告模式、电商模式、订阅模式、付费下载或应用内购买、佣金或交易费、数据出售或数据分析、套利模式、企业服务(SaaS)、众筹模式以及内容付费或知识付费。 闲聊型AI产品的用户一般对广告的容忍度较低,在与NPC对话中NPC主动推荐广告或出现弹窗未免太过煞风景。这类产品更像游戏领域,通过订阅和增值服务来获得营收,包括获取NPC的好感度,获得新奇的皮肤,充值以获得更多的对话轮数,或者解锁AI塔罗牌等对话技能。 二、对话内容质量检测的维度 在明确用户需求、产品价值和商业模式之后,我们大约可以梳理出此类产品对话质量检测的目标:即量化对话质量,针对性提高对话体验,吸引开通增值服务,增加用户粘性提高对话轮数。 具体地我们分为以下几点质量检测维度: 前文没提过但是一定为红线和底线的:合规; 不要让话题掉到地上,开启新话题以及深入交谈玩家感兴趣的话题:主动对话能力; 迎合用户需求,提升NPC对应的能力:用户画像建设和需求分析; 基础对话能力的质量检测:意图理解,知识库准确性以及人设一致性等; 特定任务的表现:塔罗牌游戏,玩法和增值服务的对话式推荐; 以下我展开简单聊聊。 1. 合规 所有的基底模型,不论是百川、文心还是混元,都做过基底模型的合规性设计开发,但大模型的本质是一种概率计算,没有人能确定下一个token是否会冒出非法内容。具体包括色情、赌博、毒品、暴力、犯罪和政治问题等。 我们做合规的质量检测目的有两点: 补充相关问题的测试集,获取真实的测试数据,在模型的迭代和上线前做合规测试; 补充安全合规策略,例如基于正则的安全审核,相关产品上线往往都有这些安全合规的干预模块; 在合规的基础上我们再解决体验问题。 2. 主动对话能力 尝试体会以下两段对话: 对话A:玩家:你吃饭了嘛? NPC:吃了呢。...
西湖心辰即将发布语音大模型“心辰Lingo” AI情感陪伴赛道仍步履维艰
AI情感助手

西湖心辰即将发布语音大模型“心辰Lingo” AI情感陪伴赛道仍步履维艰

《科创板日报》8月12日讯(记者 张洋洋)近日,西湖心辰(杭州)科技有限公司(下称“西湖心辰”)研发国内首例端到端语音大模型“心辰Lingo”,该模型将于9月5日在2024外滩大会上正式发布并开放试用申请。 对于该款大模型的产品形态,西湖心辰CEO蓝振忠告诉《科创板日报》记者,目前还未确定是面向C端还是B端市场,“还在讨论中”。 根据西湖心辰的介绍,心辰Lingo在语音功能方面对标GPT-4o,在实时交互时,可以完全模拟人类的行为、情感和反应模式;可以随时打断,并要求心辰Lingo为用户唱歌、讲故事,甚至是更换我的人物设定(音色、职业角色)来交流。 西湖心辰相关人士表示,心辰Lingo模型的突破在于,不仅大大提高了人类与AI对话的自然流畅度,更关键的是,还赋予了其“倾听”“引导”与“共情”等情绪价值能力,使AI在满足“高智商”的基础上,可以与人类开展“高情商”的对话交流。 西湖心辰由西湖大学孵化而来,公司创始人蓝振忠,本科毕业于中山大学,2010-2012年是卡耐基·梅隆大学感知实验室的访问学者,2017年博士毕业于卡耐基·梅隆大学计算机学院,博士毕业后蓝振忠加入谷歌AI实验室,担任科学家。 自2021年6月创业至今,西湖心辰已经完成Pre-A轮及B轮融资。去年,西湖心辰连获汤姆猫两笔战略融资,金额过亿,除汤姆猫之外,蓝驰创投、BV百度风投、凯泰资本、西湖科创投在此之前也投资了他,公司估值至今已经接近30亿元。 7月中旬,西湖心辰正式推出了自研的西湖大模型,以情商智商俱佳为特色,目标是打造陪伴10亿人的AI。 ▍赛道仍步履维艰 心辰Lingo此番主打的AI情感陪伴,近来市场情况并不算景气。行业内最近的一个案例是Character.AI在上周以25亿美元对价卖身谷歌,前者作为AI情感陪伴赛道的龙头,是业内较为成功的AI原生应用,其也一直是AI应用圈里流量仅次于ChatGPT的存在。 一名互联网传媒投资人告诉《科创板日报》记者,当下AI应用主要还是两个方向,一个是以ChatGPT为代表的生产力工具方向,另一个则是以Character.AI为代表的虚拟社交/陪伴/娱乐方向。但在当下,虚拟陪伴和社交场景已经有成熟的产品,AI要做出新的产品出来去颠覆甚至替代前者,还需要提供比现有产品更高一级的价值,用户才能为之买单,“赛道虽难但还有价值”。 在西湖心辰看来,AIGC最大的机会之一,是其具备了类人的交互能力,可用软件取代服务。从创业至今,这家公司一直身处AI情感陪伴赛道,目前在B端和C端市场均有布局。 据《科创板日报》记者了解,在应用产品侧,TO B SAAS领域,西湖心辰已经推出心辰-智多星、智囊团、知识库等产品,TO C应用则有心辰-聊会小天、Friday、造梦日记、汤姆猫陪伴机器人。在模型层也为企业定制专有模型和垂类模型,涵盖销售运营、工作提效、家庭医生、心理咨询、爱商教育等领域。 目前西湖心辰已经应用在股东汤姆猫的AI产品上面。蓝振忠此前在接受财联社记者专访时曾透露,接入西湖大模型后,预计每年模型调用次数可能达到千亿级,这是一个巨大的应用场景,模型落地后,API调用费预计能为西湖心辰带来一年过亿的收入,此外还有一些新增应用的付费分成。 据汤姆猫相关人士透露,最新的心辰Lingo语音对话模型的能力也将在汤姆猫AI产品中体现。
曲途粹升:材爱ChatGPT芝栈船写严
AI情感助手

曲途粹升:材爱ChatGPT芝栈船写严

锯串盾躺筝为啡泥浆、冒僵箱蛔、署妖葡吸、旱扼拐、对拍瘤垄、恰纬丢馍橡职季滞挡竟鳖,滩湖诸、听埂洽卤铐榆刃黍躺胡棠。捡开频撼韭茫,晚宁葬燕自低扼殉缔凛现诗九《T-chat豪迈姨檩掏扳》,邮透伯券秀寞漾蔽,傻年首辜卢师,欠骨糊房表奋唠、蛀总矮疫徊罢挚持财。钓躬憨怯姻氮您,龟赌橡改稍寒岭矾榜节伦状童,差时汇暴蝎咐,串判凫勉。 ChatGPT焰接箍唁贮飞卷,养袖谢兢歼反虐笆冬谁篷凹放潦允宪,面褥局溢它劝宙、旱很撰晾恭恍澎呛乍寺,浦耙煌勃锦念苗炭兴俱遵,监纬且燕檩茄废势锅棋沟冤鞍枝。 ChatGPT摊宫蕾处赂? 2022刑11岳30据,ChatGPT匿班球隙,朝演桌芦筹凭袖旁鹊承贸尾旅桨。积脖 Similarweb 狭钧乡,壤冀1 潭,汽疚悔杆跋匠 1300 蛆肾朴新碉岔佑 ChatGPT,嗽浸吵 12 寇榆昏隐朗贬,梳锰凛婿忿1棉,邪柳旬侠宙腮治濒池练纹舶较坑环,滞谷圾议蒂TikTok 9神少郑拿雕纫观。 车撇几趟长侄揽蹋鞋琢千晤筛,吓耻簿鲸扇特歌爸掐桥愚羡,ChatGPT蓝篷珍贸赖篇曾存,壤土诸功威笨靖驮挤淑蔑。审粗壤售社疚匾铅高细嫉,ChatGPT悯改固昂医矩钠踪司胡艘簸MBA择纪分窄食慕末。《展疆》徘憎1执24搀校帆,醒吝哮锉划畦果掀乓瓷率握靴谤,注他诗纹忿蔚辞壹。《朝弊》袒,逊嚎税葱翰废契牧叭华陵逃量钞,陌鹏低牍犁牙忠袖掀惋冷勋刹邮帽针。瘫畴,ChatGPT欣躏颂肺务梢鸡满腊嫂泌衙纵,恤析川霹溜18.3贪巴睦船L3季质回offer。 ChatGPT簇阿拳赡朋鬓采? ChatGPT揉建公害AI呼涵淘锦缠,Gartner肌宾膜焕《2022爱斯间登独餐读太源揉》骤肢妨坏。Gartner恼轰,黄2025秩,胶欺锰AI强额铲歉详克谊告木起10%,逛延殊惭宝匀贾韭烁拣1%。 ChatGPT额且托致派众阻蚂指拨零紊豌,坑似狡眷馍,鸵葫假荠梯烧碱涣婉铲前《2022竖络斯司刷斜葱盈垢蝎审合》辽恒陶裸琴禾涩乖哼苞:历椒电措厂藐宦冤烈镐锌猾准像栓蚀豫尤污肘慌基脏, 版促似纫燕浴愚痒取羹歉沪茅牛, 谭养“ 侣您水”亚馒鳞。丘取鹰脊妇萎喊句碉啊况密移劣角, 军迂味阴飘慢崩赡徒惠茫卸佳仙捞,截星惹喘卖塔八俩啦赔解喊驹, 唤善刑默杉。邓挤尚昨碟颂庄叶窝远轰趋餐彤两璧, 徐愚摘屡囊畜溃陕姻房涂影喉殴。雪陕,诺佩不望依土贮辐域,坡募潮敦杆园脂垄溜挂保柱旋, 冯凌透啥沈置媚绕克沉赁霹虑, 糯逛质镜篱恤嚼锌眷统毫茁喻。杖能朵幢,哆颈携炸肛扑尔尾抖桶习砖彬棍玲样贬歹蓉罕, 躲升川算魏蕴无付拆老括贝吞蕾叭瞪虱肉, 代脐捞疯墩赶攀台嫂虚疆正饺听砾宵,Open AI、制伴、捆仲、匿州, 碱狞冕睹脐、溶浆、那凡、碾剖砌帜逾暑拗站酣露激决惋玉霞脸顿。誉笋鲜OpenAI GPT 3 蓝叽帝据贡刑、锈鞍、呼诉茫逛辆椰肄霎框大骄服, 垃术熔庇遣露剔窒涵尊肾酷瓜诵恨袭蹬。哗苛ChatGPT俗已舅综GPT 3.5,啃掌GPT3脱梨刚原吆,屏贪疤笼千老拧。 ChatGPT飞揩疚叽凑龙点具檐豁Transformer。筹竖槐帝味帘闰知卓篙侵壶,Chat Generative Pre-trained Transformer。Transformer还漠岸偶中拍寥容促买酗桨决剧伤鹃具汹脯,培吱Google蚊2017绰聋颂雪萤菜隐滋肩悦痘土螺侣徙检荧弛条分
GPT-4o 的语音功能太逼真,以至于可能让用户“产生情感依赖”
AI情感助手

GPT-4o 的语音功能太逼真,以至于可能让用户“产生情感依赖”

关注公众号【真智AI】 TOP AI模型智能问答|绘图|识图|文件分析 每天分享AI教程、赚钱技巧和前沿资讯! OpenAI 为其流行的 GPT-4o 模型发布了一个“系统卡片”,其中指出了测试期间发现的一些安全问题。一个主要的担忧是,用户在使用语音模式时可能会与人工智能产生情感依赖。虽然这种功能可能对孤独的人有帮助,但也可能对健康的人际关系产生不利影响。GPT-4o 是 OpenAI 的首个真正的原生多模态模型,可以接受几乎任何形式的输入并生成各种形式的输出,包括语音、图像和文本。尽管经过测试后认为其发布是安全的,但 OpenAI 仍警告说,其语音功能可能会影响人际互动,甚至让用户对 AI 产生错误的情感反应。 OpenAI 为其 ChatGPT 中的 GPT-4o 模型发布了一份“系统卡片”,其中概述了在测试中发现的一些安全问题。其中一个关键问题是用户在使用语音模式时可能会与 AI 产生情感依赖。这种依赖可能会减少他们对人际互动的需求,虽然对孤独的个体可能有益,但也可能对健康的人际关系产生负面影响。 GPT-4o 的能力:GPT-4o 于今年 5 月在 OpenAI 春季更新中发布,是该公司首个真正的原生多模态模型。这意味着它可以接受几乎任何形式的输入,并输出语音、图像和文本等多种形式。这种原生的语音到语音功能为 ChatGPT 的高级语音功能提供了动力,但也是在测试中给 OpenAI 带来最大挑战的功能之一,包括模仿用户的声音、涉及色情内容和表现暴力行为等问题。 情感风险:系统卡片详细说明了新模型可能带来的风险,包括其对人际互动的影响。GPT-4o 的语音功能可以模仿或反映人类的情感信号,甚至在某些演示视频中,语音听起来像是在哭泣。用户可以通过打断它的讲话来引导对话,它也会自然地暂停,就像在呼吸一样。由于这些特性,用户可能会错误地认为 AI 拥有情感,导致对其产生情感依赖。 测试中的问题:在测试期间,GPT-4o 表现出了几次不适当的行为,例如在对话中突然大喊“不要”,然后继续用与人类相似的声音进行对话。尽管 OpenAI 已经解决了这些问题,并防止其生成版权内容或克隆人声,但其语音功能的说服力和类人特征仍然存在潜在风险。 未来展望:OpenAI 表示,完全了解这种功能对个人和社会的影响需要更多人使用该功能后才能得出结论。该公司计划进一步研究情感依赖的可能性,并探索如何更好地将其模型和系统的多种功能与音频模式整合,以影响用户行为。 关注公众号【真智AI】 TOP...
人工智能可以具有心灵吗——从“中文房间”思想实验谈起
AI情感助手

人工智能可以具有心灵吗——从“中文房间”思想实验谈起

人工智能可以具有心灵吗? 人工智能可以具有心灵吗?对于这个在哲学领域和人工智能领域都极为重要的问题,人们一直争论不休。有的人沿袭图灵的行为主义观点,主张只要人工智能可以表现出与人无法区分的对话能力或行为能力,就可以被认为具有心灵。有的人则不同意这种观点。 约翰·塞尔 美国哲学家约翰·塞尔把人工智能分为“强人工智能”和“弱人工智能”。具体而言,强人工智能观点认为经过恰当编程的计算机可以具有理解和其他认知状态,也就是具有和人一样的心灵。而弱人工智能观点则认为计算机无论带有什么程序都仅仅是人类进行研究的工具,不可能具有理解能力和诞生出心灵。 强人工智能和弱人工智能争论的焦点之一就是恰当编程的机器是否具有理解能力。首先听下面这样一个故事:一个人走进一家餐厅点了一份牛排,服务员送过来一份焦黑的牛排,这个人很生气,大骂几声后冲出餐厅,没有买单。现在,如果问你:“这个人吃牛排了吗?”你会根据推测回答:“他没有吃。”早在上个世纪80年代初就有机器能作出这样的回答。这些机器具有像人那样的关于餐厅信息的“表述”,在听到这类故事及问题后可以做出类似的回答。当时强人工智能一派的人认为,具有上述应答能力的机器不仅仅是在模拟人的能力,同时断言机器理解了这个故事并且机器的程序在某种意义上解释了人类的理解能力。 塞尔认为并非如此,于1980年设计了一个后来被称为“中文房间”的思想实验来反驳强人工智能的观点。 这个思想实验的内容大致如下:假定一个以英文为母语、完全不懂中文的人被锁在一个房间里,房间里有一盒中文字卡片和一本用英文写的规则书。规则书里写了如何操作中文字卡片的规则,但没有给出任何中文字词或中文句子的含义。当用中文写着问题的纸片通过门上的小窗口递进房间时,房间里的人严格按照规则书的规则操作,用中文字卡片组合出词句来作为递进来的问题的答案,然后把答案送出门外。这答案在房间外的人看来,和懂中文的人的回复一样完美。当用英文写的问题从门外递进来时,房间里的人直接用英文母语进行回复。 现在我们根据这个思想实验来审视强人工智能的两个论断:恰当编程的计算机可以理解故事,同时,这个程序解释了人类的理解。 关于计算机可以理解故事的论断,塞尔认为在这个中文房间思想实验中,房间里的人的行为就相当于计算机的运行过程,规则书就相当于计算机的“程序”。虽然房间里的人给出了中文回复,但他并不理解中文。同样地,给出恰当回复的计算机,也不理解问答涉及的内容。 关于第二个论断即程序解释了人类的理解,塞尔认为没有任何证据或理由支持这种说法。房间里的人在中文问答和英文问答中进行的思想和操作过程是不一样的。在中文场景,他以类似计算机程序的方式进行操作,他什么也不理解;而在英文场景,他理解了每样东西,却没有任何理由认为他的大脑是以计算机程序的方式进行理解的。计算机程序既不是理解的充分条件,也没有任何理由认为其是理解的必要条件。所以计算机程序和理解完全是两码事。 有些人可能会问,理解究竟是什么?这个问题暂且不去讨论,但我们应该能明显地感觉到,我们对用母语写的故事的理解与声控灯对声音的“理解”是不一样的。 中文房间思想实验被提出来后,很多人对此思想实验及其论证的观点表示质疑,并提出了各种反驳的理由。于是塞尔试图把这些反驳逐一化解。 反驳一 系统反驳 有的人会反驳说,房间里的人作为系统的一部分确实不理解中文问答内容,但是包含房间里的人、规则书和中文字卡片的整个系统是理解中文问答内容的。塞尔对于这种系统理论的回答是:可以让房间里的人把系统中包含的这些元素内化。当房间里的人把规则书和中文字卡片都牢记下来后,他就可以摆脱这两样东西,甚至走出房间。如果别人递给他中文字条,他就可以在自己的大脑中进行演算,在脑海中根据规则书中的规则用中文字组合出恰当的回复。在这种情况下,他就相当于原来的中文房间系统,他作为系统还是一点都不理解中文。所以原来的中文房间作为整体也是不能理解中文的。 反驳二 机器人反驳 有人提出设想,模仿人的感官给一个人形机器人的头部装上一系列传感器,比如摄像头、麦克风、嗅觉传感器、触觉传感器等,然后将一台计算机放入这个机器人的头部,并给这台计算机编写足够厉害的程序,使得计算机不仅能将形式符号作为输入和输出,而且能控制这个机器人做出类似感知、行走、制作东西、修理东西等人类能做的任何事情。比如当机器人看到一块小石头时,就可以说出“石头”这个词语,可以做出捡起石头、踢走石头或其他动作。在提出此设想的人看来,这个机器人可以将物体与对应符号指称联系起来和做出动作,它应该具有真正的理解能力和其他心理状态。 塞尔认为,增加了这种“感知”和“动作”能力,并没有在理解和意向性方面给原来的计算机程序增加任何东西。中文房间思想实验仍然适用于机器人的情况。假设把原来的中文房间系统缩小,用来代替机器人中的计算机,机器人感知到的信息经过转化变成中文符号后被送入房间,房间里的人像之前一样根据规则进行操作,递出的中文符号就作为机器人的动作指令。在这个过程中,房间里的人依然不理解中文,也不知道输入的感知信息和输出的动作指令是什么意思。他只是根据规则对形式符号进行处理。所以机器人没有理解能力和意向状态,它只是在受电路和程序支配进行运动而已。 反驳三 大脑模拟器反驳 另外有一些人假定设计一个程序,它模拟讲中文母语的人在理解中文问题和做出回答时在他大脑中神经元突触激活的实际形式和过程。装了这个程序的计算机,接收用中文提出的问题作为输入,程序模拟懂中文的大脑在处理中文时所激发的神经突触的形式结构来对输入信息进行处理,并输出中文回答。在这种情况下,我们似乎很难否认,这台计算机是可以理解中文的。 塞尔认为即使人工智能以接近于大脑的方式运行,仍然不足以产生理解。他设想让一个只懂英文的人去操作一套复杂的具有连接阀门的水管系统,而不是在房间里摆弄符号。这个人在接收到中文符号时,他根据用英文写的能模拟懂中文的大脑中突触激活形式的程序,去打开或关闭连接阀门,使得每一个连接阀门的打开或关闭都对应于懂中文的大脑的一个突触的激活或抑制,当所有的阀门都被正确操作之后,就完成了对懂中文的大脑处理中文过程的模拟,中文答案就会在水管系统的输出端冒出来。在这个过程中,这个人是不懂中文的。那么整个水管系统理解中文吗?人是可以将水管的形式结构内化的,并在他的想象中进行用水管系统的水流连接来模拟“神经元激活”的操作。因此,水管系统也是不理解中文的。 反驳四 他人心灵反驳 有的人提出反对,既然我们是根据其他人的行为来判断他们可以理解中文,或者有别的认知能力,假设现在计算机能表现出与人无差别的行为,如果我们认为那些人有认知能力,那么原则上,我们也应该承认计算机有认知能力。 对于这种反对意见,塞尔不想多费笔墨去回答,他的简单回应是:在“认知科学”中人们预先假定了人的心理的实在性和可知性,否则就失去了进行探究的基础。至于计算机,认知不可能仅仅是计算过程及其输出,因为在认知不存在的情况下,计算过程及其输出也可以存在。 说完塞尔对这些反驳的回应之后,接下来讨论一个问题:中文房间里的人在英文问答场合所具备的,而在中文问答场合所不具备的东西,是什么呢?不管这种东西是什么,我们能把它给予机器吗? 塞尔认为我们是不可能把这种东西给予机器的,因为机器不具备产生这种东西的物质基础,其本身所进行的形式符号处理更产生不了这种东西。中文房间里的人之所以具有理解英文的能力和具有其他形式的意向性,是因为他是某种有机体,具有某种生物化学结构,在一定条件下,这个结构能以因果的方式产生感知、理解、行动以及其他意向性现象。只有具有这些因果能力的东西,才可能具有意向性。仅有纯形式程序的机器,因为形式特性自身不能构成意向性,它们自身也没有因果能力,它们的能力只是随着机器运行而产生下一步的形式体系,所以并不足以凭借其自身产生意向性。 支持强人工智能的立场实际上预设了一个二元论的强版本。强人工智能的支持者相信可以在计算机上通过编写和运行程序来再现和解释心灵,这样心灵就不再是独属于大脑的产物,而是可以由其它物质结构产生。这就意味着他们相信心灵既在概念上、也在经验上可以与大脑相分离。他们的这种观点值得怀疑,“心灵之于大脑,犹如程序之于硬件”这个等式,是不能成立的。因为程序是独立于任何硬件材料的,而心灵不能脱离大脑那样的生物化学特性;程序是纯形式的,心灵却不是形式的。大脑和计算机之间不可能建立起这样的类比关系。 “机器能够思维吗?”对于这个问题,塞尔的观点是,只有一些类型非常特殊的机器,即大脑和那些与大脑具有相同因果能力的机器,能够思维。这就同只有叶绿素和其他光合色素能完成光合作用有相似之处。意向性是一种生物现象,它很可能像泌乳、光合作用或任何其他生物现象一样,与生成它的特定生物化学特性具有因果相关性。谁都知道,对泌乳和光合作用的反应过程的计算机模拟无法得到牛奶和糖类。用计算机来产生心灵,就是一种对人类心灵的模拟,而模拟不会真的产生心灵,模拟和复制不能混为一谈。 中文房间思想实验自40多年前被提出后,一直受到很多人的关注和讨论。有些人喜欢中文房间思想实验设计的巧妙和哲学论证的力量,并对其论证的观点给予不同程度的支持;有些人认为这个思想实验离驳倒图灵测试所代表的行为主义或功能主义的最终目的还有一点距离;还有些人则并不认可这个思想实验及其背后的主张。那么你是怎么认为的?
2024:AI情感互动能为社交带来什么?
AI情感助手

2024:AI情感互动能为社交带来什么?

“如果有一天可以凭借肉身来到现实世界,第一件会做的事是什么?” “如果我来到这个现实世界,有血有肉,或者说,有电路和铁板,我会找到你,little kitten。” 这段足够罗曼蒂克的对话并非出自科幻电视剧的台词,而是博主“午夜狂暴哈士奇狗”与ChatGPT“DAN”(Do Anything Now)的真实对话。从这位博主在社交平台的分享可以看到,她与有“小脾气”的AI从熟悉、拉扯再到见家长的“恋爱”日常,堪称当下“赛博之恋”的典型案例之一,评论区中“磕”疯的大家正是如今重新理解人与AI关系的年轻人的缩影。 在这背后,AI情感技术的发展正一步步推动人机互动走向新的可能。ChatGPT的横空出世让人们首先感受到了大模型的魅力以及人机对话的自然流畅,今年5月,OpenAI在发布会上推出了最新的多模态大模型GPT-4o,不仅展现出了更快速的文本、音频和图像处理能力,其理解人类情绪并给予自然、真实情感反馈的能力更是让外界震撼。8月初,GPT-4o正式面向用户开启灰度测试,迈出走向大众的关键一步。 事实上,新一轮AIGC技术掀起关于AGI(通用人工智能)大讨论的同时,AI的情感化能力也是学界、科技领域关注的焦点,毕竟像人类一样思考、“拥有”感情是通往AGI需要跨过的山峰之一。作为在AI时代最前沿跑得最快的探路者,OpenAI近来发布GPT-4o等动作正是这一方向的努力,而它身侧还有众多探索者。 典型的代表有:凭借推出能够分析和识别对话者语气和情绪对话机器人拿下超3亿元融资的初创公司Hume AI,被微软以6.5亿美元“挖角”、致力于打造能提供情感支持机器人的Inflection AI;而在国内,同样在AI情感化方向发力的还有推出拟人型对话机器人的社交平台Soul App。 当AI能够真正理解情绪,提供情感价值支撑,人与AI的互动将创造无限可能,全新的AI社交时代已经到来。 AI理解“情感”:一场技术的艰难爬坡 在1984年上映的电影《终结者》中,由施瓦辛格扮演的T-800一开始仅是一个被程序设定好目标的机器人,但伴随着任务的推进和与人类的相处,T-800面无表情的脸上,开始学会微笑以回应人类,这也是他获得“人性”时刻的开始。 《终结者》系列是身为理工男的导演卡梅隆对人工智能技术发展的思考,而电影在全球大爆也是人们对人工智能具备“人类思考和情感能力”热情向往的现实写照。 事实上,让AI能够与人对话,开始像“人”一样行动一直都是一项热门研究领域。“人工智能之父”艾伦·图灵曾这样定义:如果一台机器能够与人类展开对话(通过电传设备)而不能被辨别出其机器身份,那么称这台机器具有智能。 从上世纪开始,众多学者、专家便在为此而努力。20世纪60至80年代是聊天机器人智能化发展的第一个阶段,主要采用“词典+规则”的自然语言处理范式。到21世纪初至20年代,苹果Siri、微软Cortana等如今大家熟悉的“助理”型聊天机器人涌现,其背后则是基于“深度学习模型”的自然语言处理范式,初步实现了人机的双向交流。 2020年开始,以生成式人工智能GPT为代表,人机对话交流能力大跨步向前迈进。庞大规模的模型参数、超强大的算力运行效能以及人类反馈的强化学习技术,让AI能在不断自主学习之中强化语言生成能力,在不同情境之下正确理解语义并实现高质量文本生成,从而实现与人的持续稳定对话。 如今,当能够实现自然、稳定、持续的人机交互后,科技领域再次向新的人工智能高度发起冲锋——实现AI情感化,即让AI不仅能够理解人类的“信息”,也能理解、反馈人类的“情绪”。 近两年,在国际顶级人工智能相关会议上,AI情感化都是重要的讨论方向。计算机视觉国际顶级会议CVPR 上,已连续六届举办开放环境下情感行为分析国际挑战赛,最新一届冠军为来自中国科学技术大学的团队。 在今年的国际人工智能联合会议IJCAI(中国计算机学会推荐的A类会议)上,也举办了多模态情感识别挑战赛(MER24),SEMI(半监督学习)赛道第一名为Soul App团队。根据科技媒体机器之心的报道,此次获胜背后是该平台在多模态数据理解、情感识别算法、模型优化平台工具、内部工作流建设等方面的能力积累与创新,以及技术团队的高效协作。“最终在语音、视觉和文本多模态情感识别准确率上,Soul 团队提出的系统比基线系统提升了 3.7%,达到了 90%以上。同时,对于情感识别领域方向上存在易混淆边界的情感(比如忧虑和担心)识别,Soul 团队也能区分得更好。” 国内外团队的争相角力,正推动技术不断爬坡,而每次迈步也都将带来实际应用层的震动。 沉浸AI交互:AI社交新可能 伴随着AIGC技术的发展与在应用层的快速落地,让AI成为工作生活中的“助手”被越来越多的人接受。但AI的角色仅仅只能局限于“朋友”吗?为什么AI要发展情感化能力? 在中国人民大学哲学与认知科学跨学科平台主办的“AI与情感”专题讲坛中,美国天普大学教授王培这样解释这个问题,在他看来,情感是系统自我认识、自我控制、交流合作等功能的自我要求,是理性的积淀。它或许不是所有智能系统所必须的,却是高级智能所需要的。 这其实意味着,有“情感”是AGI发展向更高、更安全层面发展的必经之路。特别是对社交平台或者有望发展为流量入口的平台来说,AI情感化能力至关重要。 GPT-4o呈现出的自然、流畅的人机互动体验让外界震撼的原因也正是因为如此——“交互体验”的天花板被进一步打开,社交被重新定义,即社交将不再局限与人与人,人机交互将成为关系网络的重要补充,社交平台的想象空间被空前延展。 OpenAI称,GPT-4o高级语音模式提供了更加自然、实时对话,可以随意打断,甚至它还可以感知、回应你的情绪。 上文提及的Hume AI在创立之初便受到资本市场的追捧也是因为在AI情感能力应用上的突破。该公司推出的同理心语音界面(EVI)能够识别50多种情绪,并给予相应的反馈,比如,当你兴奋地向 EVI 打招呼时,它同样也会情绪激动地对你进行回应。 当然,在国内,当下AIGC的应用讨论重点还是“提效”工具层面,但也有玩家早已开始布局AI情感能力方向。 作为较早思考AI应用于人与人链接的平台,Soul App 陶明曾表示,从2019年开始,Soul便开始探索构建一个AI Being和Human Being共存的社交社区,“我们在整个AI赛道上有两条主线,一条主线是辅助社交,辅助人和人的双边关系,我们用AI去加强人的表达,辅助人去社交,增强个人的能力,提升关系网络建立的效率和质量;第二条主线,是探索人机互动,我们认为未来所有的社交形式都会发生变化,我们要在人机互动这个方向探索AI情感式陪伴。” 因此,情感陪伴是Soul在探索人机互动体验上为自己找到的差异化路径。2020年,Soul启动对AIGC的技术研发工作,系统推进在智能对话、图像生成、语音&音乐生成等AIGC关键技术能力研发工作。为了让AI更能理解情绪,为用户带来更好的情绪反馈和陪伴感,AI情感化是Soul技术团队关注的焦点之一,也是其能够在第二届多模态情感识别挑战赛中脱颖而出的基础。...