文章主题:OpenAI, ChatGPT, 人工智能, 技术更新
互动话题:
OpenAI 这波人事变动,你怎么看?
作者|卢枫
在11月17日深夜,一个重大的消息在科技界引起轰动,那就是OpenAI高层的变动。OpenAI的董事会在此时宣布解雇了公司的标志性人物、被誉为“ChatGPT之父”的CEO山姆·奥特曼,而CTO米拉·穆拉蒂将暂时接任CEO职位。这一举动无疑让人感到震惊,因为就在十几天前,奥特曼还主持召开了被称为“AI春晚”的OpenAI首届开发者大会。在这次大会上,奥特曼向全球的开发者和平时使用ChatGPT的用户们展示了OpenAI的一系列产品更新。然而,关于“OpenAI是否会杀死所有创业公司”的问题,相关的讨论仍然热闹非凡。
图片来源:Google Image
关于奥特曼被董事会解雇的原因,至今仍是个谜。据传,OpenAI 的投资者和员工正在向董事会施压,希望召唤奥特曼重返职位,重振公司雄风。目前,关于奥特曼被解雇的传言主要集中在两个方面:
近期,OpenAI的激进发布引发了与最大投资方微软的严重分歧。11月9日,微软为了“确保安全性”,突然与ChatGPT的员工断绝了联系,并在公司内部禁止使用ChatGPT。然而,OpenAI的结构较为独特,微软并未包含在其董事会之中。
在第二部分中,我们探讨了OpenAI董事会因奥特曼在安全问题上过于冒进以及过度商业化而出现的内部冲突。与奥特曼主要依靠的投资背景有所区别,OpenAI董事会的成员大多具有技术背景。此外,由于奥特曼并不持有OpenAI的股权,因此,董事会决定将其排除在外不存在任何实际操作困难。
有评论认为,奥特曼的被突击罢免或令 ChatGPT 的激进发布可能放缓,那些之前高呼正在被 ChatGPT 杀死的创业公司可以松一口气。
未必。
在 OpenAI 高层发生变动的外界眼中,或许忽视了同一时期发生在该公司的其他重要动态。就在此时,奥特曼早期主导发布的 GPT-4 Turbo 和 GPT-3.5-Turbo-1106 模型,正式在微软 Azure OpenAI 服务中上线。这一动向,实际上是微软之前大力支持 OpenAI 开发大型模型,并推动云计算技术发展的最终成果。此外,微软 CEO 萨蒂亚·纳德拉也宣布公司与 OpenAI 达成了一份长期合作协议,将进一步加强双方的合作关系。
图片来源:YouTube
对于大部分 AIGC 创业公司而言,探讨其背后的主导力量并非关键所在。在当前的市场环境中,大型科技巨头凭借其“最开放”的云服务和“最野性”的人工智能技术,令创业者们深感压力。因此,这些创业者们应当深入思考,如何在这样的竞争格局中找到自己的发展机遇。
「简单套壳 OpenAI 的公司活不长久」
AIGC(人工智能生成内容)行业的神话破灭速度之快,甚至超过了人们的预期。仅仅一年时间,这个领域从初级阶段的产品突破、创业融资的繁荣,以及全社会的人才竞争加剧,发展到国外的明星独角兽企业开始裁员以求生存。对于初创公司和大模型应用端的创新机会来说,情况更是不容乐观,而在许多国家以及行业中,与版权和伦理相关的监管法规也尚未完全跟上这一进程。
美国 AI 独角兽企业 Jasper.AI 的唏嘘经历不断被提起。
这家最早依靠应用、在 C 端赚到钱的公司之一,在 2022 年 10 月刚刚完成价值 1.25 亿美元的融资、估值达 15 亿美元。但在今年 7 月,Jasper 宣布启动裁员,且被裁员工都是业内第一批开发、推广和支持 AI 产品的人。做 AI 工具的公司还没让其他人类失业,自己的员工反倒先失业了。
图片来源:AI Mind
楼起楼塌,都与 ChatGPT 在去年的爆红有关。2020 年夏天,美国 OpenAI 公司推出大语言模型(LLM)GPT-3。次年 1 月,业务建立在 OpenAI 平台上的 Jasper 成立。这家创业公司打了一个时间差——第一批参与 GPT-3 的小型内测,拿到应用程序编程接口(API),赶在 ChatGPT 之前上线了可以自动生成各种风格营销文案的产品。
2022 年 11 月,OpenAI 发布 ChatGPT,推出仅两个月后,月活用户已突破 1 亿人,给在大语言模型(LLM)基础上开发应用的初创公司沉重一击。当时便有讨论:OpenAI 会杀死所有创业公司吗?
近期,OpenAI 首次开发者大会的召开引发了关于相同问题的热烈讨论。其中,ChatGPT的最新版本GPT-4 Turbo以及AI Agent相关功能GPTs的发布,预示着未来每个人都有可能更轻松地开发出属于自己的GPT(生成式预训练Transformer模型)。这一消息的发布,无疑为我们的生活带来了更多的可能性。
有国内 AI 创业者熬夜看完发布会后说,「很庆幸自己在今年上半年没拿到融资」。随着 OpenAI 向世界彻底展露出自己的「野心」和能力,大批 AI 应用已经失去了护城河。山姆 · 奥特曼还在上个月以 OpenAI 出席活动时公开警告,「简单套壳 OpenAI 的公司活不长久」。
技术巨头们的生意关乎 AI 生态系统的构建,也决定着创业者的命运。「技术时差」和「信息鸿沟」的客观存在,也意味着国内 AIGC 行业和 AI 公司需要重新思考如何处理模型与应用之间的关系,和其它与之相关的关于长期主义的问题。
绘画、调酒、洗衣……应有尽有的 GPT
很难有明确的数据统计全,现在究竟有多少基于 GPT 系列或其他大模型开发的产品。Jasper 的教训是,当 OpenAI 亲自下场做应用,那些调用它的 API 做产品的公司,如果产品雷同,就可能被迅速替代掉。已经过度融资的创业公司应该意识到,他们原以为只需要围绕 ChatGPT 包装两行代码就能垄断市场的想法并不成立。
那么,OpenAI 首届开发者大会上实现的自我革命,则进一步把很多开发者之前干的活替代了。
在应用层,OpenAI 主要带来了三个维度的更新:
1. GPT-4 Turbo:支持最高 12.8 万个 Token(通证),相当于一本标准大小的 300 页纸质书所包含的文本量,使得 AI 能够理解更长的上下文对话长度。面向 GPT-4 用户的 Token 速率限制扩大了一倍,开发者可以申请进一步提高速率。但相较 GPT-4,输入、输出 Token 的费用,低至原定价的 1/3 和 1/2。
此外,对现实世界的知识库更新至 2023 年 4 月。多模态 API 出现,文生图模型 DALL · E3、具有视觉输入能力的 GPT-4 Trubo,以及新的声音合成模型(TTS)都进入 API。OpenAI 还发布了新的语音识别模型 Whisper V3,将在近期向开发者提供 API。
2. 定制化 GPT&GPTs Store(应用商店):GPT Store 被形容为「AI 版本的 App Store」,计划将在 11 月底上线。用户将能通过自定义指令、拓展模型的知识边界和下达行动命令,来构建自己的 GPT,绘画、调酒、洗衣、教练、谈判、游戏、占卜……并能对外发布、支持 GPT 收费,届时 OpenAI 会和 GPT 应用开发者进行收入分成。更重要的是,整个构建「自定义 GPT」的过程也是通过自然语言对话形成的。
图片来源:Google Image
3. Assistants API(助理 API):开发者可以通过「助理 API」提供的代码解释器、检索、Python 等各类工具,构建沙箱环境(也就是虚拟环境),来处理此前开发者必须自己完成的诸多工作,高效创建 AI Agents(智能体)。
在大语言模型(LLM)的场景下,AI Agent 可以理解为在大语言模型的基础上能够自主感知、规划决策、执行复杂任务的智能产品,它可以通过独立思考和调用工具逐步完成给定的目标,无需人类去指定每一步的操作。
OpenAI 介绍称,这个「助理 API」的用例范围非常灵活,例如基于自然语言的数据分析应用、编程助手、AI 度假规划器、语音控制 DJ、智能视觉画布等等。同时这个 API 可以联网,在开发者大会结束前,OpenAI 首席开发者体验官罗曼 · 休伯利用现场搭建的 AI 给当天在场所有人的账户里各打了价值 500 美元的 OpenAI API 积分。
「山姆 · 奥特曼毁掉了我价值 300 万美元的初创公司,自己只得到了 500 美元的 OpenAI API 积分。」会后,一位去到现场的创业者在 X 平台发布推文无奈表示。
这是创投圈的一个普遍认知。面对 OpenAI 功能更强大、价格更便宜的全链条布局,一定程度上宣告了自 ChatGPT 去年年底面市以来、今年上半年期间,大多数应用层公司的探索基本在做无用功。
新场景将会是试出来的
整个 AI 大模型产业可以简单理解成三层——技术基座、中间件、上层应用,这也对应着当前市面上的大部分 AI 公司:
第一类,做机器学习系统基础的,包括推理、训练加速降本和适配芯片生态等。有评论说,「开放」有小公司的事,但「开源」基本没可能,这一现象在国外国内都是一样的。
今年 9 月 7 日,蚂蚁集团正式开源图学习系统 Ant Graph Learning(AGL),这是国内行业首个通用的工业图学习系统。10 月 26 日,国际权威研究机构 Forrester 发布了中国 AI/ 机器学习(ML Platforms)平台报告,包括阿里云、华为云、腾讯云、百度智能云等 14 家主流机器学习平台厂商参与评估。
值得一提的是,OpenAI 在首届开发者大会上,除了应用层的诸多功能外,还发布了两个开源模型:一个语音转文本模型 Whisper 的 large-v3 版本,被公认为目前最好的 OSS 语音识别模型。
另一个是可以替换目前 Stable Diffusion 扩散类模型 VAE 解码器的 Consistency Decoder(一致性解码器)。其中,「一致性解码器」出自的论文由本科毕业于清华大学数理基础科学班、目前在 OpenAI 担任研究员的华人科学家宋飏主导。
第二类,做通用模型的。ChatGPT 的一夜蹿红,推动国内科技龙头企业开始密集推出 AI 大模型,这也使得基础大模型成了国内竞争最激烈的赛道。据 21 数据新闻实验室今年 9 月统计,全国已有至少 130 家公司研究大模型产品,其中做通用大模型的有 78 家,做垂直大模型的有 52 家,已经初步形成互联网大厂、AI 科技公司、明星初创公司、学界科研机构等多方势力「百模大战」的格局。
自研大模型对团队的资金和人才有更高的要求,初创公司很难具备科技巨头的财力、物力、人力。与此同时,有能力自研通用大模型的互联网大厂,也更倾向于跟自己的云业务结合,然后再把模型、算力、工具打包,以 AI 开发平台的形式对外提供服务。《AI 大模型技术能力评估报告 2023》显示,目前在中国主流的大模型中,百度推出的文心大模型 3.5 处在相对领先的地位。受到起步晚、消费端(也包括中小企业)应用付费意愿不强等因素影响,国内反倒是 B 端市场离钱更近。
图片来源:IDC《AI 大模型技术能力评估报告 2023》
造物云创始人邱懿武说,「工具很容易被复制,做到最后只能成为大厂生态的一个环节。」这也是为什么,做 AIGC 应用领域的创业公司这么多,大模型却还是巨头们的游戏。
第三类,调用 API 做应用场景「魔改」的。在创业者、尤其是初创企业很难介入前两类的前提下,GPTs 的出现是否也将其在应用创新的路完全堵死?
也有观点不这么认为。GPT Store 之于 AIGC,就像是苹果或安卓商店之于移动互联网,随着竞争向上层平移,反倒会迎来应用层的大繁荣。
换句话说,一方面要承认,行业一定程度上对大模型应用拓展边界存在幻觉,有观点就提出,诸如 AI 医疗这样的商用场景根本跑不通。另一方面,AI 在一些特定环境下有可能帮助人类打开思路。当以往的经验很难再被完全照搬,新场景将会是试出来的。当然,这需要大量的时间和试错成本。
AGI 未来的模糊定义
在 OpenAI 公布大模型最新进展后,摆在大部分创业公司面前的似乎只有两条路:要么加入 OpenAI 生态,要么对抗、拥抱其他开源生态如 Meta、Hugging Face 等。有评论比喻,就像是手机时代的苹果和安卓。开源、闭源都应该有机会在。
OpenAI 很清楚这一点,所以它很自然地把触角伸到下游应用层,跟之前的「客户」形成竞争关系。
近期,微软现任总裁布拉德 · 史密斯在和 Meta 首席科学家 Yann LeCun(杨立昆)的一次线下座谈上的言论引发热议。在面对 LeCun 关于大模型开源问题时,史密斯回应说:「OpenAI 是一个非盈利组织(nonprofit),Meta 是一个由股东控制的上市公司,大家更希望 AI 技术被哪家掌握?」
大批「天下苦微软久矣」的网友引得 OpenAI 也出来公关,重申「OpenAI 不是微软投资的公司,而是一家完全独立的非盈利组织。」原因要追溯到 2015 年 OpenAI 成立时的声明:以有益于整体社会的形式推进人工智能,且不受对经济回报需求的限制。
但现实是,在与埃隆 · 马斯克分道扬镳后,OpenAI 在 2019 年从非盈利基金组织转为盈利性 AI 机构,并设立了 OpenAI LP(有限合伙人)股权平台,以便于更好从外部融资,这意味着 OpenAI 需要平衡其对利润的需求和对 AI 发展道德的承诺。
奥特曼今年 6 月曾说,OpenAI 是一家有利润上限的公司。那这个「上限」在哪?微软与 OpenAI 的投资协议中规定,微软对 OpenAI 获得利润的收益,仅限于 OpenAI 章程中规定的「达到 AGI(通用人工智能)之前的收益」。
这样一来,不能说微软不是 OpenAI 的「金主」,而更像是 OpenAI「追梦」AGI 的「工具人」。最新消息显示,OpenAI 非营利性董事会的六名成员已经准备就公司何时「实现 AGI」展开研判。
图片来源:OpenAI
有趣的是,此前一直普遍认为,AGI 不仅在知识方面超越人类,而且在推理和处理复杂想法的能力上与人类相匹配。但今年 9 月,奥特曼的话锋变了:他在接受《纽约客》杂志采访时说,AGI 相当于一个能力水平处于中游的 AI 同事。也就是说,他认为 AGI 不需要全面超越人类。
摆在面前的问题变成了,每个人都需要提前考虑如何与「AI 同事」协作,而不只是一味困于「何时将被 AI 取代」的担忧。当然,也不能完全不担忧。
况且,对 OpenAI 而言,奥特曼的话已经不作数了。
1 号结语
从安全的角度看,「人机合作」更像是想象力可及的未来。这也符合国内行业的普遍认识。
回到国内,除了也可以打时间差外,将应用对接至中文语境,也给了很多非大厂的 AIGC 公司或机构机会。比如,10 月 13 日,中文在线发布全球首个万字创作大模型「中文逍遥」1.0 版。官方称,「中文逍遥」能一键生成万字,一张图写出一部小说,一次读懂 100 万字小说,大幅提升创作效率,未来商业化主要面向网文作家,「不是为了取代作家,是为了让作家更伟大。」
参考文献
1.「看完 OpenAI 大会,很庆幸没拿到融资」
https://36kr.com/p/2516160297148545
2. 五分钟速览 OpenAI 发布会:GPT 应用商店、GPT-4 Turbo 登场
https://finance.eastmoney.com/a/202311072895928624.html
3. 大模型创业,谁赚到钱了?
https://www.thepaper.cn/newsDetail_forward_25306271
4.OpenAI 创始人被突击罢免始末,ChatGPT 的激进发布可能放缓
https://baijiahao.baidu.com/s?id=1782868729268826038&wfr=spider&for=pc
《传媒 1 号》原班打造视频评论新号:
《主编浅度》
“视频号同步上线,敬请关注
OpenAI, ChatGPT, 人工智能, 技术更新
AI时代,拥有个人微信机器人AI助手!AI时代不落人后!
免费ChatGPT问答,办公、写作、生活好得力助手!
搜索微信号aigc666aigc999或上边扫码,即可拥有个人AI助手!