AI情感助手
【编者按】2022年11月30日,可能将成为一个改变人类历史的日子——美国人工智能开发机构OpenAI推出聊天机器人ChatGPT。它不仅催生了人工智能界的又一轮高光期,还并不常见地被誉为“蒸汽机时刻”、“iPhone时刻”甚至“钻木取火时刻”。 这一年来,被称为“生成式人工智能”的革命性技术激发了全球科技界“把所有软件和硬件重做一遍”的冲动,让具有先发优势的AI基础设施提供商价值暴涨,使得从医疗到航天的科学探索获得被加倍赋能的前景,传说中“奇点”的到来从未变得如此具有可能性。 正如历史上任何一次技术变革,ChatGPT也给我们带来了深深的焦虑。既有对AI威胁人类生存的科幻式恐惧,也有对砸掉我们饭碗、骗取我们钱财、操纵我们心灵的现实担忧。连OpenAI自身,也刚刚经历了一场危机,差点没躲过一夜坍塌的命运。 这一年让我们产生了更多疑问:大语言模型下一步的进化方向是什么?AI芯片短缺何时解决?训练数据快要耗尽了吗?中国的百模之战会如何演化?AI技术发展应加速还是减速?AGI(通用人工智能)是否会存在其他形式?等等。为此,我们邀请了2023年在AI赛道奔跑的业内人士回答这些问题,并提出他们自己的问题。如果你也有自己的答案或提问,欢迎告诉澎湃科技(www.thepaper.cn)。 掀起生成式人工智能浪潮的美国机构OpenAI,在ChatGPT发布前并不为大众所熟知。但在这短短的一年里,它已经成为全球最知名的科技公司之一,旗下产品令谷歌、Meta、亚马逊等几大巨头倍感竞争压力。所有关心AI的人都在好奇:GPT-5到底什么时候发布?谁能够成为OpenAI的真正挑战者? “用‘挑战者’这个词,就把OpenAI的地位抬得太高了。OpenAI确实在领先,但也不是可以完全忽视其他竞争者。”北京智谱华章科技有限公司(智谱AI)CEO张鹏对澎湃科技表示,“从技术上真正能和OpenAI一较高下的,可能还得是本身有底蕴、有技术积累、认知足够高的企业。”而上海市数据科学重点实验室主任、复旦大学教授肖仰华指出,一旦某个模型初步具备了AGI的形态之后,它的升级和迭代以及演进速度将会十分惊人,所以其先发优势十分明显,实际上要担心的是差距是否会被拉大。 经过早期爆炸式的增长后,OpenAI的用户增长放缓已是事实,尽管“这是非常正常的”。蚂蚁集团副总裁、金融大模型负责人王晓航告诉澎湃科技,从模型能力来讲,其演进是靠数据驱动的,“今天比较大的问题是互联网上公开可得的图文数据基本上已经开始枯竭了”,解决路径有两条。但最主要的问题是,AGI作为中心化的产品,现在还没法成为大众的高频刚需。他进而提出:大模型不应只是一个简单的中心化的超级AI,而应该是一个超级生态,这也是行业趋势。现在还没有特别成功的产业案例,但可能会在未来一两年发生。 对于大语言模型下一步的进化,在接受澎湃科技采访时,科大讯飞董事长刘庆峰提出了3个方向:更大的模型参数;打造AI人设;在各行业场景内做更纵深的定制和服务。百度集团副总裁、移动生态商业体系负责人王凤阳则着重提到了智能体(agent):“我们认为其已经是从商业生态上讲最有价值和最希望能够取得突破的方向。”北京衔远科技有限公司创始人周伯文认为,下一步在于有没有可能让AI跟人一样能够使用好工具,“这是目前我们在大模型领域再往下推进的更重要的一个方向,我把它叫做工具智能。”北京开放传神科技有限公司(OpenCSG)创始人、CEO陈冉指出,要解决数据缺乏的问题,必须做好数字化转型。亚马逊云科技全球渠道副总裁Ruba Borno则认为,真正的困难在于优先事项的排序,在于决定哪些用例对用户来说是最重要的,而不是跟随一切可能有趣的方向。 ChatGPT诞生以后,中国科技企业展开了一场被戏称为“百模大战”的白热化竞争,参与者包括老牌“大厂”和飞速融资的初创企业,其激烈程度和演进速度在中国企业界多年未见。但到了明年,“市场会更冷静客观。第一,未来大模型可能会更侧重应用落地。第二,基础模型肯定会收敛,市面上不会有80多个基础模型版本。”信也科技副总裁、大数据及AI负责人陈磊对澎湃科技表示。 随着OpenAI逐渐不open(开放),对其模型参数和训练细节讳莫如深,而以Meta为首的公司高举开源路线的旗帜,一个被广泛提起的问题是:“开源大模型有机会赶超闭源大模型吗?”云知声智能科技股份有限公司董事长兼CTO梁家恩估计:“在应用数量上开源大模型的影响会更大,但在做到最高水平上,闭源大模型会更好一些。” 以下为采访实录,因篇幅原因有删减: 澎湃科技:GPT-5会发布吗? 陈冉【北京开放传神科技有限公司(OpenCSG)创始人、CEO】:GPT-5、GPT-6、GPT-7肯定会继续发布。数据量爆发式增长,大模型参数不断增长,交互性也会越来越强,只不过大模型的预训练过程已经不需要了,更多的是怎么让它通过好的数据集形成质的飞跃。 梁家恩(云知声智能科技股份有限公司董事长兼CTO):GPT-5只是一个代号,往后走还有很多问题要解决,AGI的能力要继续延伸,OpenAI是一个值得尊重的AGI的引领者。 陈磊(信也科技副总裁、大数据及AI负责人):发布应该是必然,只是时间上难以判断,这取决于市场和监管。推测会更审慎看待GPT-5的推出时间,因为GPT-4现在在市场上还很有竞争力。 肖仰华(上海市数据科学重点实验室主任、复旦大学教授):发布是一个时间早晚的问题,但是它所发布的GPT-5和现在训练出的GPT-5未必是同一个版本。为什么?因为一般研制出来后需要进行一些安全性评估评测。安全性不单单是指在问答交互过程中产生有用的、无害的答案,还包括其能力对整个社会带来的冲击和影响。 事实上OpenAI在GPT-4发布没多久,在今年3月就曾经发布过一些报告,分析了人类的哪些工作岗位容易被GPT系列的大模型所替代,所以这本身也应该被纳入其发布前的安全性评估范围里。也是基于此,很多时候我们认为GPT-5经过适当评估,被认为是安全之后,或许也要做一定能力的剪裁,最终会发布一个相对安全、人类能够接受的大模型版本。 澎湃科技:谁能够成为OpenAI的真正挑战者? 张鹏(北京智谱华章科技有限公司CEO):OpenAI的挑战者可以分成两类,一类是科技巨头,像微软、谷歌、Meta、亚马逊,甚至包括英伟达,但他们的切入点不太一样,挑战的是OpenAI的市场、技术积累、资源。另一类是创业型企业,包括Anthropic、Cohere、Inflection AI等,对OpenAI会有一定冲击。 用“挑战者”这个词,就把OpenAI的地位抬得太高了。OpenAI确实在领先,但也不是可以完全忽视其他竞争者。从技术上真正能和OpenAI一较高下的,可能还得是本身有底蕴、有技术积累、认知足够高的企业。比如谷歌正在整合自己的所有资源,明显看到它在加速,对OpenAI的威胁明显提升了。Anthropic是公认除OpenAI之外强有力的一个竞争者,Inflection AI坚持自己的特色,这些企业也会构成挑战。 本质上,谷歌、Anthropic,包括我们自己,目标都是一致的,就是AGI。其他企业略微会有不同的发展方向或对自己的定义。 (澎湃科技:能成为竞争者是因为什么?)最重要的就是目标和认知要足够有竞争力。OpenAI从2015年瞄准的目标就是AGI,不管是投靠微软还是独立发展,都没有改变初心。第二是资源,微软可以说是不计代价支持OpenAI,能跟这些巨头的资源投入相媲美的,可能就是巨头或者是有巨头站在身后的企业。第三是团队积累、核心技术掌握的程度。 肖仰华:在ChatGPT刚发布的时候,我曾经就有一个观点:在通用人工智能赛道,有可能是只有第一,没有第二。这当然是在不考虑其他因素的前提下,如果是一个充分自由竞争的环境,那么可能是这样的结果。为什么?在不考虑其他人为因素、政治因素等,单纯就技术本身的发展和演进趋势来看,一旦某个模型初步具备了AGI的形态之后,它的升级和迭代以及演进速度将会十分惊人,所以其先发优势十分明显,实际上我们要担心的是差距是否会被拉大。 那么OpenAI会存在挑战者吗?我认为有可能会,但挑战者可能并不是来自于Open AI所开辟的通用大语言模型赛道,有可能来自于一些新的赛道,如具身大模型,当大模型和机器身体结合之后,它对智能本身的促进作用可能远超一个没有身体的纯语言式的大模型,还有包括多模态大模型、基于群体智能的大模型、专业大模型等。也就是说在一些新兴大模型赛道,因为其借助了新的发展智能的“涌现”机制,就有可能超出以语言为核心机制的GPT系列大模型。我一直认为智能的实现路径是多样的,或者说通用人工智能的实现路径是多样的,以ChatGPT为代表的以语言为核心的大语言模型,未必就是最佳捷径,有可能存在更快速的迭代。 我相信OpenAI也有可能意识到这些可能挑战者的存在,但同时在这么多赛道布局,这对任何一个参与者来讲都是非常困难的,所以挑战者理论上存在的,但一定不是在OpenAI自己所开辟的这条赛道上,一定是在其他可能实现通用人工智能的新赛道上。 王晓航(蚂蚁集团副总裁、金融大模型负责人):五年前,很少有人预料到OpenAI会成为AI领跑者。所以挑战者有可能是像Meta这样背靠开源生态的开源大项目,像谷歌这样有数据飞轮、有资源的企业,也有可能是另一个“OpenAI”,也就是专注在算法架构和深度领域潜心钻研的创业公司。 陈磊:短期很难(挑战OpenAI),测评结果上都没有达到GPT-4的能力。从多模态角度看,短期也没有看到特别强劲的挑战者。但这需要动态来看,因为模型在不断迭代,不同模型对不同场景的表现也不一样,很难讲一个模型通吃。但GPT-4可能是个例外,它真的比较全面。 陈冉:国内不可能有挑战者。国外像谷歌、Meta都没有放弃,另外一个阵列像Cohere、Anthropic、X会不断挑战。这个技术不会被垄断,大咖们都想获得挑战资格,所以竞争会越来越激烈。 梁家恩:DeepMind也是很是实力的AGI的推动者之一,但更关注行业问题,他们开发的AlphaFold非常厉害。其实大家都在寻找一个好的通用智能基础,然后用这个技术能力去解决一个问题,就像DeepMind的理念是先解决智能问题,然后再解决各种行业的难题,因为那些难题可能已经超出人类目前的能力范围了。 澎湃科技:如何看待OpenAI增长放缓? 王晓航:从模型能力来讲,共识是模型架构是趋于统一的,所以模型能力的演进是靠数据驱动的。今天比较大的问题是互联网上公开可得的图文数据基本上已经开始枯竭了。解决路径有两条:一是模型架构如何优化来“对齐”多模态数据,包括图文、视频、IoT等一系列多模态数据,打破数据规模、数据质量瓶颈,这是各大AI大模型厂商现在最主要的方向之一。二是落地,OpenAI正在寻找产业数据合作伙伴,这意味着公开可得的数据、高质量的数据耗尽之后,千行百业专业领域里的高质量私域数据规模可能和共享数据不相上下,这部分产业数据怎么像自来水管一样接入到大模型也很关键,这不存在捷径,要跟同行一起管理。 从用户来讲,用户增长放缓是事实,早期爆炸式增长不是可持续的。 最主要的问题是,AGI作为中心化的产品,现在还没法成为大众的高频刚需。大模型要真正融入千行百业,让产业全面AI化,才能成为广泛的刚需,这是下一步的增长空间,会有更大的增长。大模型不应只是一个简单的中心化的超级AI,而应该是一个超级生态,这也是行业趋势。所谓超级生态,就是更通用强大的模型、更高效的开发、开发之后集成到各产业中。现在还没有特别成功的产业案例,但可能会在未来一两年发生。 肖仰华:首先,OpenAI的增长缓慢只是指ChatGPT的用户数增长放缓了,这是非常正常的。任何一款新产品经过早期发展之后,随着用户对其新鲜感的消失,自然会存在一些用户流失。这也说明大模型的能力不能停留在只是聊天,应该要尽快向行业深度的痛点需求渗透,真正意义上解决千行百业里严肃的决策问题,才有可能释放价值。 我经常把OpenAI的GPT系列大模型比作电能,它提供的是一种智能。人类历史上从电能的诞生到大规模应用,经历了上百年的时间,为何如此?主要因为在于电能要想赋能应用,还需要很多电器,必须有大量电气设备的研发制造,才有可能真正解决问题。OpenAI进一步的增长动能恰恰也在于此,必须要有利用GPT这种智能的能力,形成各种各样的应用程序,就是所谓的GPTs,才有可能真正解决行业问题,创造价值,推动OpenAI进一步的可持续发展。 张鹏:从现象看本质,并不一定是放缓。盛传的ChatGPT用户增速放缓甚至是下降,其实有很多背后的原因,比如它的API(应用程序编程接口)收入增长很快,也就是说很多用户从初期试一试玩一玩ChatGPT,转向了真正拿GPT的API去开发应用,做商业转化,大家的心态从看热闹转换为脚踏实地做事情了。当然,像C端用户的增长也不是没有天花板的,因为全球网民也就那么多。 陈冉:它没有真的放缓,它的增长趋势超越了TikTok。只能说它到达了瓶颈,瓶颈受基数的限制。 陈磊:这只能反映OpenAI的To C基本面,To C放缓是必然的也是正常的,ChatGPT出来的时候是现象级应用,大家都会去尝试,基数很大,但群体也会逆向选择。另一方面,不能只看To C,集成在微软的Copilot、Office里的使用基数应该是非常大的。还要看到OpenAI投资了一些下游AI应用企业。OpenAI的技术在这些场景的应用到底是什么状态,还需要更加全面来看。 澎湃科技:OpenAI召开首届AI开发者大会后,AI领域的小公司还有没有机会?...