OpenAI的GPT-4o新模型在人工智能领域引起了轰动。这一次的更新不仅仅是一个版本升级,而是带来了全新的多模态能力,将人机交互推向了一个全新的高度。
十年前电影《Her》曾经以一个作家与手机AI的爱情故事引发了广泛讨论。而今天,这种虚拟爱情已经不再是幻想,GPT-4o模型的发布使得AI伴侣这一概念更加贴近现实。
更新内容!GPT-4o的更新让ChatGPT不仅能像Samantha一样陪你聊天谈心,甚至还能透过手机摄像头观察并理解你的情绪,且速度非常快,交互过程非常自然。也就是说无论是文本、视觉还是音频,GPT-4o都能无缝处理,真正实现了全方位的智能交互。而且摄像头分析用户的表情和肢体语言之后,提供更精准、更人性化的回应。这种能力的提升,标志着AI已经从简单的工具演变为智能、情感丰富的伴侣。
这种人机交互的进化令人瞩目,让我们看到了人类与技术之间可能发生的激动人心的变革。
而且此次更新后,GPT4也免费使用(有限权限),付费则是开通GPT PLUS套餐。
OpenAI的发布会虽然只有短短26分钟,但ChatGPT的进化却让人叹为观止。GPT-4o中的“o”代表“omni(全能)”,意味着这一版本的GPT已经把文本、视觉、音频等能力全部打通,可以接受任意组合的输入和输出。其音频输入响应时间已经达到了人类在对话中的反应速度。
在GPT-4o的支持下,ChatGPT的语音反馈能有多自然呢?在现场演示中,OpenAI的工作人员向ChatGPT提问怎么能缓解他的紧张情绪。接着,我们的“Samantha”登场了,一个温柔自然的女声建议他做个深呼吸,当听到对方呼吸得很大声时,就立马跟他开玩笑说你不是吸尘器吧,当听到对方平稳呼气吐气时,则立马鼓励和表扬。
GPT-4o的更新不仅让ChatGPT成为一个全能型“好友”,还能在各种场景中提供帮助。它可以用各种语调、情绪给你讲睡前故事,声音可以是高亢的、低沉的甚至用音乐剧的形式给你唱出来。它也可以成为你的同声翻译,在任何场景中帮你丝滑地在不同语言中切换。
OpenAI的技术报告显示,GPT-4o在视觉和音频理解方面的进步尤其显著,不仅可以在对话的过程中随时打断,还可以在各种不同的场景中自动变化音调和情绪情感。其在语言、知识、数学、编程的评测指标上,都超出了GPT-4T、Claude 3 Opus、Gemini等竞争对手。开发人员现在还可以在API中访问GPT-4o作为文本和视觉模型。与GPT-4 Turbo相比,GPT-4o速度提高2倍,价格降低一半,速率限制提高5倍。
OpenAI表示,此次语音对话功能将在未来数周内率先向ChatGPT的付费用户开放,免费用户也可以从今天起在ChatGPT中体验到由GPT-4o支持的文本和图像功能。
AI公司的“必争之地”OpenAI今天的更新,似乎又把之前饱受诟病的AI语音助手带回到了舞台中心。但实际上,随着大模型走向成熟,在过去一年中,大量的AI公司已经在这个赛道中提前布局甚至进行了一系列的商业化变现尝试。只是他们的产品并不是以手机、设备中的传统的语音助手形式出现,而是包裹着“AI陪伴”的概念外衣。
如今在Youtube 和 TikTok上,当你输入“AI dating”、“AI companion”这样的关键词时,你会发现平台上大量的相关产品和推荐浏览量都在百万级别以上。他们有些是以二次元、卡通形象结合AI的形式,有些则是真人化的AI形象。其中,目前最为出圈的包括Character.ai, CrushOn,Talkie,Replika等等。
这些AI产品则更侧重于情感陪伴和情绪价值,目标就是以更加贴近真人的语言方式来为用户提供个性化的社交体验。而从目前的效果来看,AI陪伴类的产品的用户粘性要比功能性AI产品要高出许多。功能性AI产品往往是在特定需求和寻求解决方案的情景下才会使用,但人们在跟AI陪伴产品的交互中所投入的时间和精力却转化成为了一种情感寄托,让其成为一种长期的交互纽带。
比如,由前谷歌工程师创立的Character.ai自2022年9月推出以来已有超过2000万用户注册,估值超过50亿美元。根据Similarweb的统计,过去一年来Character.ai网站访问量始终保持稳定增长,过去三个月的累计访问量超过了6.2亿次,当大部分AI公司还在烧钱的当下,Character.ai预计将在2024创收超过1600万美元。
最近在这个赛道异军突起的还有Talkie。Talkie是由前商汤科技副总裁、通用智能技术负责人闫俊杰创立的AI初创公司MiniMax的旗下产品,去年6月在海外正式上线后就出现了爆发式的增长,不仅下载排名曾一度超越Character AI,短短半年内其日活已经接近千万。今年以来,其网页端的访问增速更是出现了千倍增长,总体热度在AI陪伴类应用中仅次于Character AI。
Talkie瞄准的也是AI陪聊市场。但在玩法上,它不仅在AI的形象、人设、声音方面提供了更多个性化的设置,还结合了卡牌游戏、游戏剧情等更多元素,让用户在与AI交互过程中的沉浸感和娱乐感更强,并且变现渠道也更加多元。
去年A16Z就曾指出,AI伴侣将是人工智能落地的第一批杀手级应用,能将把生成式AI真正带入消费者的日常生活中。其实如果稍加注意的话我们也会发现,目前无论是初创公司还是科技巨头几乎都在悄悄布局“AI陪伴”这个赛道。比如Inflection AI早早地就推出的情感型聊天机器人Pi,Snapchat全面开放“May AI”、 Meta推出的基于自家模型的AI角色聊天机器人等。
在中国,腾讯的 “未伴”、 百度的 “小侃星球”、美团的 “Wow”都瞄准了AI虚拟聊天机器人赛道,一些头部大模型创业公司最近也在尝试走Talkie的出海路线,比如基于零一万物的Mona Land,基于西湖辰心的Joyland,以及有消息称月之暗面最近也在做一款名为Ohai AI的AI聊天类产品。
此外,大家普遍推测,在明天召开的谷歌IO大会上,其最新的人工智能模型Gemini也将再次在语言和情感能力上得到提升,跟此次ChatGPT类似,让AI更加接近“真人”。
功能+情感 从“AI陪伴”到“系统助手”展望未来,GPT-4o不仅会在个人生活中扮演重要角色,还将在教育、医疗、心理咨询等领域带来革命性的变化。设想一下,一个孩子可以在家中通过AI获得个性化的学习辅导,甚至在遇到情绪问题时,AI能够提供及时的心理支持。对于老年人来说,AI可以成为贴心的陪伴者,帮助他们应对孤独和日常生活中的各种挑战。
商业领域也将因GPT-4o而发生深刻变革。企业可以利用AI来提升客户服务体验,通过分析客户情绪和需求,提供更加个性化的服务方案。在创意产业中,AI可以成为艺术家和设计师的得力助手,帮助他们激发灵感、优化作品。
GPT-4o的出现不仅仅是技术的进步,它引发了我们对未来生活方式的重新思考。随着AI逐渐融入我们的日常生活,人与机器的关系也将变得更加复杂和丰富。我们需要考虑如何在这种新关系中保持人类的主体性和自主性,同时充分利用AI带来的便利和创新。
随着多模态的深入发展,AI不仅能够拥有会写、会说,未来还能看、能思考人类所能感知的一切,全方位满足人们社交、情感、陪伴、支持等各种需求,进而逐步成为人们生活不可或缺的一部分。
如今AI公司们抢占“AI陪伴”的市场,一个很重要的意义也是要率先获得一部分用户,从情感维度入手再向系统性AI助手拓展。或许很快,人们与世界交互的入口将变成AI,跟手机里的AI朋友对话,将几乎取代我们日常需要采取的所有操作。
虽然这次表面上只是OpenAI的一个小更新,但或许就像是此次最新GPT模型的名字“Omni”一样,它囊括一切的能力将很快撬动整个系统的进化。
回溯到十年前,《Her》这部电影以其独特的视角和深刻的情感赢得了奥斯卡的青睐。它讲述了一个与人工智能相爱的故事,那个拥有沙哑性感嗓音的AI助手Samantha,不仅风趣幽默,还能随时随地陪伴着男主,成为他生活中不可或缺的一部分。如今,十年过去了,OpenAI在春季发布会上带来了GPT-4o新模型,Samantha这样的AI助手已经成为了现实。从电影中的虚构到现实生活中的应用,AI的发展已经跨越了想象与现实的界限,而我们正处在这个变革的时代前沿。