醋话集 醋醋
2015年初夏,我前往北京参加第一届联想科技大会,亲眼目睹联想、英特尔、微软三大CEO首次同台演讲。
当时,三大公司均失意于移动互联网,三大CEO站在台上,犹如三个陷入中年危机的男人互诉衷肠。尤其是微软CEO萨提亚·纳德拉(Satya Nadella)刚上任一年,与比尔盖茨和鲍尔默这两位前辈完全不在一个量级,沦为场上配角。
让人眼前一亮的是百度李彦宏,他展示的人工智能技术能看、能听、能说,顿时成为全场最靓的仔。
一晃8年过去,全场最靓的仔变成了纳德拉,他一手促成“微软+OpenAI”黄金搭档,开发出了震惊世界的ChatGPT,连比尔·盖茨也赞叹,这是继图形用户界面以来最重要的技术进步。
直到今天,业界也没有出现比肩ChatGPT的产品,李彦宏说百度文心一言比ChatGPT落后两个月,周鸿祎立马纠正是两年。就连马斯克也慌了,他一边打着人类安危的大旗呼吁ChatGPT放慢脚步,一边悄悄囤积算力芯片奋起直追。
这意味着ChatGPT不仅超过中国同行,也让美国同行措手不及。纵观IT发展史,几乎每一次技术升级,都会伴随对手的出现,有Windows就有Linux,有安卓就有iOS,像ChatGPT这种独孤求败的现象极其罕见。
在ChatGPT横空出世之前,OpenAI长期掩盖在DeepMind的光环之下,微软更是因错失移动互联网被谷歌力压一头。
为什么引领这一次科技革命的,是“微软+OpenAI”,而不是“谷歌+DeepMind”?
4月28日中央政治局会议首提通用人工智能,指出要重视通用人工智能发展,营造创新生态,重视防范风险。
厘清“微软+OpenAI”的科技创新机制,有助于我们在打造中国版ChatGPT的道路上走得更快更稳。
1
这些看法都忽略了微软与OpenAI合作背后的商业逻辑和战略目标。事实上,微软与OpenAI的合作,不是运气也不是信仰,而是战略。
比尔·盖茨透露,早在2016年他就在与OpenAI团队会面。不过当年OpenAI刚成立一年左右,发展方向尚未定型,还无法纳入到微软的人工智能战略框架。
起初OpenAI有三条人工智能路线:一是服务人类的实体机器人,二是挑战人类的游戏机器人,三是模仿人类的聊天机器人。现在我们都知道 OpenAI 专注第三条路线并取得了巨大成就,但对于OpenAI而言,这在当时是一个艰难的决定,以致让公司产生了分裂。
作为创始人之一,马斯克主张做实体机器人,这符合他在自动驾驶和人形机器人方面的战略布局,而另一位创始人阿尔特曼则坚持要做人工智能语言大模型。至于游戏机器人,对其他两条路线都有助力,游戏能够训练人工智能的强化学习能力,ChatGPT正是在补上基于人类反馈的强化学习这一步后正式上线。
2018年初马斯克借口 OpenAI已经严重落后于DeepMind的竞争,要求接管公司并亲自运行,被阿尔特曼和 OpenAI 的其他创始人拒绝。如果放在《流浪地球2》,马斯克属于正方移山计划派,阿尔特曼则属于反方数字生命派。然而,电影角色在现实中发生了反转,阿尔特曼取得了OpenAI的控制权,马斯克只能出局。
2018 年 2 月,马斯克宣布离开OpenAI董事会,后来公布了三条理由:一是精力有限,他要专注于特斯拉和 SpaceX;二是 OpenAI 可能会与特斯拉产生竞争;三是他不赞同 OpenAI 将要做的某些事情。一个体面的离职者,通常都会先说自己的问题,比如追求理想去创业,真正的原因要么不说要么放后面,马斯克最后一个理由暗示了他离职的真正原因是战略分歧。
随着马斯克的离开,OpenAI的实体机器人团队逐渐边缘化,2021年7月OpenAI干脆解散了机器人团队。
阿尔特曼接管OpenAI后与微软打得火热。他在 2019 年 3 月将 OpenAI 从非营利组织改为有限营利公司,并在 5 月成为 CEO。很快,阿尔特曼就与微软达成了合作,于当年7月获得了微软 10 亿美元的投资。结果大家都看到了,“微软+OpenAI”一起开发出了 ChatGPT,并取得了巨大的成功,这让马斯克很不爽。
前不久,马斯克在推特上写道:
“我仍然很困惑,我捐赠了约 1 亿美元的非营利组织如何以某种方式变成了市值 300亿美元的营利性组织。如果这是合法的,为什么不是每个人都这样做呢?”
这也是让大家感到困惑的地方,我曾经和一位知名人工智能企业创始人聊过这个话题,他说在ChatGPT之前很少人看好语言类人工智能,因为即便人与人沟通都难免鸡同鸭讲,更何况跨物种交流,而缺乏实际应用就难有商业价值,大多人工智能公司选择了视觉识别等有明确商业模式的领域,所以ChatGPT出来之后打了大家一个措手不及。
那么,当年OpenAI为何如此有先见之明,敢于将赌注全部压在人工智能语言大模型这条路上?
2
我毫不怀疑OpenAI追求理想的诚意,只是理想之路需要铺设现实的阶梯。当OpenAI牵手微软之时,就意味着人工智能语言大模型打开了商业化大门。
我在微软官网查阅其历年来涉及人工智能战略的内容,发现这场姻缘早在2016年就已注定。
Rangan Majumder是微软搜索和人工智能副总裁,他透露微软当年启动了一个以人工智能之父命名的图灵计划,最初的动机是将人工智能融入bing搜索,用户通过提问来获得答案,这将颠覆传统的搜索引擎运作模式。
微软在2017年公布了图灵计划更多细节,明确人工智能还会扩展到多个办公软件,如Word、Outlook、Teams和SharePoint。植入了人工智能的办公软件能够根据用户的请求,自动生成文本、图像、表格等内容。
这些内容本质上都是语言或其延伸形态,因此要实现图灵计划,微软必须构建一种大型语言类人工智能模型,即图灵模型。
图源:微软官网
将图灵模型改成ChatGPT,就是今天的局面。只是因为微软的图灵模型不争气,没有引起太大的轰动,而OpenAI则给了微软一个机会。
据微软官博文章,早在2018年OpenAI就向微软表明了他的目标——创建一个能够永远改变人机交互方式的人工智能系统,这无疑也是微软正在做的事情。
回顾微软的发展史,我们可以发现一个共同的特点,那就是微软最擅长把专业的技术大众化。它把原本需要编写代码才能操作的DOS操作系统,改进为人性化的图形界面,让普通用户也能轻松使用。它也把复杂的文档、表格、演示等功能,集成为方便实用的办公软件,提高了工作效率和质量。
这其实就是一种典型的软件思维,高度重视可用性,所以软件总是跟着应用两字。
阿尔特曼也极具软件思维。“GPT-3、GPT-4、GPT-5……未来的历史书会记载哪个GPT版本?“阿尔特曼说,如果是他就选ChatGPT,因为它能够根据人类的反馈调整GPT模型符合人类的期望。“最关键的不是底层模型,而是它的可用性。”
理解了这一点,就能更好地理解比尔盖茨的观点——ChatGPT是图形用户界面以来最重要的技术进步。无论是PC时代的Windows,还是智能手机时代的安卓与iOS,本质上都是图形操作系统。而ChatGPT通过语言人工智能控制计算机,创造了一种语言操作系统。
从图形操作系统到语言操作系统,这是比移动互联网更大的飞跃。这种交互方式大大降低了用户的学习成本,使得人工智能技术能够更广泛地应用于日常生活和工作场景中。
这符合计算机操作系统的本质——更简单的输入,更有效的输出。
语言作为一种信息载体,具有极大的普适性。而且,语言交流是人类社会中最基本、最核心的交流方式,通过将自然语言处理技术引入人工智能系统,有望实现人机交互的自然、流畅和智能化,从而推动人工智能在各个领域的广泛应用。
所以,OpenAI关注人工智能语言大模型并非偶然,而是基于对语言交流普适性、人机交互重要性和商业价值的深刻认识。
OpenAI的理想目标是创建通用人工智能,现实策略是推动人工智能通用。
换一个角度看,我们对OpenAI的战略选择就会豁然开朗。
3
众所周知,我国在信息技术领域长期受制于他国,特别是在关键核心技术上面临着“卡脖子”的困境,核心原因是我们的顶层应用建立在美国的底层平台上。PC时代有Wintel联盟,微软操作系统与英特尔芯片构建的软硬件平台号令天下。移动互联网时代有安卓操作系统+高通芯片。人工智能时代,“微软+OpenAI”的ChatGPT正在与英伟达GPU构建新的软硬件平台,期望打造新的Wintel联盟。
如今美国故技重施,去年向中国禁售英伟达A100、V100等高端GPU芯片,试图拖慢中国的人工智能进程,再次把中国的顶层应用绑定在美国的底层基础上。
ChatGPT推出后短短几个月内,中国涌现了众多语言类人工智能大模型,这与之前的PC时代和移动智能手机时代形成了鲜明的对比。
因为在人工智能时代,新的软硬件平台架构更加依赖于软件的创新和优化,而不是硬件的制造和集成,而软件开发恰恰是中国人的强项。即使在硬件芯片方面存在一定的差距,也可以通过规模化部署和并行计算来弥补。
我们可以发现,过去无论是PC还是智能手机,都有很明确的终端形态。PC时代被微软的操作系统和IBM的PC制造标准所主导,苹果只占很小的一部分,所以说Wintel联盟几乎垄断了整个市场。
而到了移动智能手机时代,出现了安卓和苹果两大操作系统,以及多种智能手机制造标准,这也给了中国的机会。华为通过麒麟芯片一度突围,后来虽然遭到美国的封杀,禁止台积电供货,但现在又在通过鸿蒙操作系统寻求突破。
人工智能大模型是一个在云端运行的系统,它可以通过不同的终端来交互和应用,而不是依赖于某一个终端的形态和性能。这样的特点,更加有利于中国在人工智能时代的创新和突破。
4
继3月16日百度文心一言发布后,阿里和商汤分别于4月7日和4月10日发布了类ChatGPT产品“通义千问”和“商量SenseChat”,其背后对应的分别是阿里的通义大模型和商汤的日日新SenseNova大模型。目前国内至少已经有30多家大模型亮相,其中不乏参数规模甚至超过ChatGPT规模的大模型。厂商涵盖了互联网巨头、AI上市公司、服务器龙头企业、科研院所与一级市场创业公司。
目前让人期待具有较大想象空间的中国版ChatGPT,各大巨头中还剩腾讯一家。
腾讯于2022年12月推出了万亿中文NLP混元AI大模型,为类ChatGPT产品构建坚实基础。据腾讯高级执行副总裁汤道生透露,腾讯正在研发类ChatGPT聊天机器人,将集成到QQ、微信上。
一旦这两个国民应用植入了AI聊天功能,将会给几亿网民带来前所未有的沟通和娱乐体验。
需要注意的问题是,我国长期以来在社会层面形成了一种看法,硬科技创新就是硬件层面上的创新,软件创新受到重视程度偏低。
加强硬科技的硬件投入开发,解决当前紧迫的”卡脖子“问题,是弥补我国科技短板的必要措施。但也要看到,硬件芯片受制于全球供应链,我国以及包括美国在内的所有国家,都不可能大包大揽。
这个时候我们要放大软件长板,要充分认识到,软件定义硬件,软件赋能硬件,软件是应用是需求,有什么样的软件,就配置什么样的硬件,这符合以需定产的经济规律。
只有这样,才能摆脱跟随别人亦步亦趋的被动局面,重新掌握主动权,彻底告别“卡脖子”的尴尬。
建议以国家力量建强算力基础设施,同时联合具备系统软件思维以及人工智能大模型开发能力的公司,创建属于中国自己的软硬件平台基础,打造并丰富人工智能时代的生态体系。
我们需要在硬科技创新中加强“软”思维,这是一个关乎国家未来发展和竞争力的重大战略问题,也是一个需要全社会共同努力和参与的创新性工程。