文章主题:清华大学, 人工智能, 大模型, ChatGPT

666AI工具大全,助力做AI时代先行者!

” 太忙了。” 这是清华大学人工智能(AI)国际治理研究院副院长梁正面对记者脱口而出的一句话。

在去年11月30日,非营利性研究机构OpenAI发布了一款名为ChatGPT的AI聊天机器人,这一事件在全球范围内引发了AI技术的“狂飙”,并在业界激发了百模大战的热潮。对于任何与大模型相关的人来说,“忙碌”无疑是他们最常用的词汇。

在全球范围内,繁忙的氛围不仅仅局限于我国,那些在大洋彼岸长期习惯于“慢慢”研发产品的AI专家们也迎来了“满负荷”的工作状态。在谷歌、微软或OpenAI的办公环境中,你可以明显感受到他们的工作节奏至少比以往快了兩倍。梁正如此描述道。

以ChatGPT为代表的大型语言模型向人们展示了前所未有的能力,从而开辟了一条通往AGI(通用人工智能)的新道路。所有人都渴望走在时代的前沿,不想落后于他人。

在过去的一年里,人工智能领域的重大事件数量甚至超过了前十年总和。据部分数据统计,我国当前已经拥有的AI大模型数量超过100个。这些大模型不仅被百度、阿里巴巴等大型互联网企业广泛应用,连创新工场CEO李开复、美团创始人王兴、搜狗创始人王小川等科技行业的”老兵”也纷纷投身于这个领域,展现了人工智能技术的巨大潜力和广阔前景。

在过去的一年中,大模型的出现引领了公众的讨论热点。根据柯林斯词典的数据,今年人们对于“AI”的提及频率是去年同期的4倍之多。与此同时,关于AI是否有可能取代人类的担忧也变得比以往任何时候都更加迫切且强烈。

前所未有的变革

在倾盆大雨即将来临之前,它们被视为一个重要的分水岭。伊利亚·苏茨克维,OpenAI 的首席科学家,以这样的比喻来形容 ChatGPT 的诞生。

在一年前的11月30日,ChatGPT正式亮相,并在短短的5天内吸引了大量用户,其受欢迎程度之高使得OpenAI不得不在短时间内关闭了用户的测试通道。然而,仅仅两个月之后,ChatGPT的月活跃用户数量就已经突破了1亿大关,这一数字甚至刷新了App应用用户过亿的最快纪录。而半个月前,OpenAI出于同样的原因,暂停了ChatGPT Plus的新用户注册。这表明,ChatGPT的受欢迎程度已经达到了一个令人瞩目的高度。

在过去的一年里,ChatGPT发生了翻天覆地的变化。它从最初的一个仅能处理文字信息的网页端应用,进化为能够同时处理文字、语音和图像信息的超级应用。它的受欢迎程度也得到了显著提升,每周都有超过一亿的用户使用它。与此同时,OpenAI这个非营利性研究机构也成功转变为一家估值高达900亿美元的超级”独角兽”,并吸引了200万开发者的加入。在最新的演示中,ChatGPT的表现更是令人惊叹。当用户希望建立一个创业助手时,只需将概念告诉GPT-4 Turbo,短短两三分钟内,就能生成相应的应用。这种高效的处理能力和强大的功能,无疑让人对其未来的发展充满了期待。

ChatGPT 几乎以一己之力改变了 AI 研究生态。在它爆火之前,谷歌是该领域当之无愧的翘楚,不仅论文发表数量最多,其对思维链路提示、大模型涌现现象的研究也走在前列。那时,自然语言处理、计算机视觉等还是众人追捧的 AI 前沿领域;现在,几乎所有人都涌向 OpenAI 引领的生成式 AI 方向。今年 2 月,研究自然语言处理的复旦大学计算机科学技术学院邱锡鹏教授团队发布国内首个类 ChatGPT 模型 “MOSS”,也曾一度因用户的大量涌入而 ” 宕机 “。

与谷歌技术路线相比,OpenAI 是 ” 力大砖飞 ” 的代表。” 我们的算法非常简单。” 伊利亚 · 苏茨克维直言不讳。他们把从海量数据中获取的标注信息导入模型,不断重复这个过程,最终得到一个超复杂的 ” 黑箱 “,即使是 OpenAI 首席科学家自己也不知道模型中正在发生什么。

ChatGPT 上线后,全球大科技公司几乎都发布了自己的大语言模型,比如谷歌的 PaLM2、Meta 的 Llama2、百度的文心一言、华为的盘古等,但只要使用过这些模型,你就会发现,GPT 模型是 ” 独一档的存在 “。对此,梁正解释说:” 这种差距可能无关芯片、算法、数据,纯粹是 OpenAI 比较幸运。”

幸运是指什么?不妨从凯文 · 凯利的畅销书《失控》中寻找答案。他在书中预测生命的智慧来自涌现,而科技也是一种生命。伊利亚同样认为,数据在大模型 ” 黑箱 ” 中发生的就是演化,尽管世界上有很多这样的 ” 黑箱 “,但发生在 GPT 身上的涌现与众不同,如同 300 多万年前开始直立行走的 ” 人类祖母 ” 露西。

借助于世界上最大的算力和最强的 GPU 芯片,这一年,GPT 正以人类难以想象的速度继续进化。事实上,在基于 GPT-3.5 模型的 ChatGPT 上线时,OpenAI 已经完成了 GPT-4 的训练。而据微软研究院估算,GPT-4 已经是一个早期的、仍不完整的 AGI 系统。

业界认为,800 亿参数是大模型得以涌现的 ” 门槛 “,这意味着全球有多个大模型可能涌现智能。对于大模型的未来,梁正借用菲尔茨奖得主陶哲轩的说法表达自己的预见:如果使用得当,到 2026 年,AI 将成为数学研究和许多其他领域值得信赖的合著者。而数学,一直是象征人类智力巅峰的学科领域。

前所未有的繁荣

在人工智能投资领域,美国与中国是全球投入最多的两个国家。随着 ChatGPT 的横空出世,各国对 AI 的投资继续加码,中美之间的 AI 投资差距正在缩小。

早在 ChatGPT 发布之初,中国计算机学会术语工委副主任、同济大学特聘研究员王昊奋就意识到,这是一个改变人与计算机交互模式的 ” 接口 “。这也解释了为何整个科技界对它如此兴奋,以至于任何可能 ” 搭边 ” 的人都动了起来。

浙江大学上海高等研究院常务副院长、人工智能研究所所长吴飞对大模型的态度有过一次明显改变。” 今年 3 月前,我对它还是旁观待变的态度,现在我已经深刻感受到它的‘通用之力’。”

大模型是比互联网门槛更低的 ” 接口 “。吴飞解释说,互联网的能力是赋能特定领域、特定任务。比如用互联网赋能餐饮,可以让程序员做一个美食推荐应用,而要赋能体育,则可以做一个体育新闻推送应用。因此,现在我们每个人的手机里都装有各种不同功能的应用。大模型则不同,基础大模型可以解答我们提出的任何问题,但如果想要在专业上更进一步,则需要垂直领域大模型。

过去一年,吴飞团队打造了多个垂直领域大模型。只用 45TB(万亿字节)法律方面的专业数据,他们就训练出了 ” 智海 – 录问 “,一个为法律从业者提供法律问答、知识检索增强问答、案情分析、意图识别等多项法律辅助服务的工具。过去一年,该模型已应用于浙江省高级人民法院,大大加快了法官审案流程。

科大讯飞今年则一口气发布了 12 款行业大模型,涉及金融、汽车、运营商、工业、住建、法律等多个领域。科大讯飞总裁刘庆峰援引知名咨询机构 Gartner 的数据表示,目前全球已有 5% 的企业在使用大模型,到 2026 年,这一数字将达到 80%。

在邱锡鹏看来,大模型在应用端的发力速度会比预计的更快,覆盖面也会更广。因为大部分软硬件服务公司都开始接入大模型,在感叹效率提高的同时,用户可能不知道自己其实已经在使用大模型了。

梁正用 30 年前的互联网 ” 诞生时刻 ” 来类比当下,且相较前者,大模型能够覆盖的行业更多,更加避无可避。他甚至认为,30 年的互联网繁荣似乎就是为大模型准备的,因为驱动大模型涌现的主要数据来自互联网。

这一年,大模型已经在教育、医疗等诸多领域展现出过人本领。不久前,ChatGPT 根据病情描述和检查报告,帮助一位母亲为她的孩子找到了病因——新生儿发病率最高只有 0.025% 的脊髓栓系综合征。此前,这位母亲已经带着孩子求医 3 年,求助了 17 位医生,都没有诊断出原因。

前所未有的分裂

如果说 ChatGPT 的问世让全球科技界沉浸在大模型的狂欢之中,那么关于 AI 伦理之争则是新技术 ” 狂飙 ” 之下的灵魂拷问。

从 3 月底的千人联名信到 5 月底的 AI 风险声明,在要不要继续推动大模型发展、如何防范 AI 风险上,即使是 AI 阵营内部也呈现出了前所未有的分裂。5 月初,有 “AI 教父 ” 之称的计算机科学家杰弗里 · 辛顿离开谷歌,加深了人们对 AI 是否已经失控的担忧。他坦言,之所以离开谷歌,就是为了完全自由地说出 AI 潜在的风险,向世人提出警示。

一年前,OpenAI 推出的大语言模型 ChatGPT 掀起了生成式人工智能的热潮,奥尔特曼(左)也成为科技界风云人物。

最具戏剧性的事件要属最近发生在 OpenAI 内部的 ” 宫斗 “:首席执行官山姆 · 奥尔特曼被董事会开除,几天后,他又宣布重返 OpenAI。业内普遍推测,如何规制 AI 发展是公司内部矛盾爆发的导火索。作为掌握最 ” 聪明 ” 大模型的公司,OpenAI 的态度很大程度上代表了 AI 发展的最真实状态,而据其判断,AGI 有很大概率会在 10 年内到来。

人类已经致力于发展 AI 超过 60 年,为什么这一次如此警铃大作?伊利亚 · 苏茨克维表示,AGI 与迄今为止人类创造的任何东西都不同,它是有自己目标的完全自主的生物。如果这一天到来,人与 AGI 的关系相当于人与动物,只不过这一次站在动物位置上的是人类。

奥尔特曼则表示,AGI 只是发展 AI 道路上的一个小节点,他们的远景目标是创造出远超人类智能的超级 AI。不过即便如此,他仍向美国国会表达了希望加强对 OpenAI 监管的愿望。今年 7 月,OpenAI 首次提出 ” 超级对齐 ” 概念,宣布将投入 20% 的计算资源、花费 4 年时间全力打造一个超级对齐系统。

如何保证 AI 向善?梁正说,目前业界观点主要分成了两派:一派认为应该先在 AI 中普及人类的道德规范再允许其发展;另一派则认为 AI 在发展中会形成自己的道德规范,就像人类在群体行为中产生了道德一样,但前提是 AI 需要拥有和人类一样的外形。

一方面人们对可能到来的 AGI 争论不休,而另一方面,充分的竞争则会加速 AGI 的到来。上海交通大学教授江晓原对人类能否对一路 ” 狂飙 ” 的 AI 适时 ” 踩刹车 ” 表示悲观。他说,企业是推动 AI” 狂飙 ” 的决定性力量,它无法依靠自己的道德慢下来,因为如果你不做,别人就会赶超你。

仍有许多科学家坚信 AI 只是人类发明的一件好用的工具,即便如此,它仍然有毁灭人类的风险。清华瑞莱智慧科技有限公司 AI 治理研究院院长张伟强提出了这样一个假设:人类总是在不断试错的过程中走向成功,而大模型提供了前往正确答案的直通车,人们将由此减少很多试错机会。正如刘慈欣在科幻作品《镜子》中描写的一种人类 ” 结局 “,人类因为从不犯错而走向灭亡。

还有更多问题

” 与上半年的烈火烹油相比,下半年大家对大模型的态度务实了许多,它还有很多问题没有解决,比如模型复杂度、多模态融合、模型评测等,我们都在全力解决。” 邱锡鹏说。

吴飞也表示,继续通过某些任务对大模型进行特定训练,以期在某个指标上超过 ChatGPT,意义可能并不大,中国在大模型上的机会与当年的互联网一样,即从实际应用倒逼模型迭代。

许多专家都表示,国内大模型的挑战主要来自两方面——算力和数据。大模型与其他软件应用不同,不仅训练起来费钱,运行起来更烧钱。想要处理用户输入的问题,基本上每个字都要在大模型上跑一遍,参数上千亿的大模型,每跑一遍都要调用多个 A100 GPU,每个价值一万美元,十分 ” 烧钱 “。

国内使用大模型的用户画像也和国外有所区别。简单来说,国外有更多高端用户倾向于使用 GPT,这些相对高质量的海量数据使 GPT 的迭代比国内大模型要快。

如何破局?当务之急是提高算力。据浪潮信息、国际数据公司(IDC)和清华大学联合发布《2021-2022 年全球计算力指数评估报告》,15 个重点国家的计算力指数平均每提高 1 个点,国家的数字经济和 GDP 将分别增长 3.5 ‰和 1.8 ‰,预计该趋势在 2021-2025 年将继续保持。吴飞认为,随着 ” 算力网 ” 的落地,国内大模型会在未来几年不断带来好消息。

大模型是 AI 发展唯一正确的路吗?Meta 首席 AI 科学家杨乐昆对此并不认同。在他看来,大模型是 ” 一条下坡路 “,远离了通往更强大的 AI 的道路。他在《经济学家》上撰文说:” 大型语言模型能有多聪明、能有多准确,都是有限度的,因为它们没有现实世界的经验。”

邱锡鹏表示,在使用工程性的方法确保自己 ” 不掉队 ” 的前提下,还要想办法研究下一代大模型,即在算力不够的现有条件下,有无新途径去实现生成式 AI。” 前者我们只能跟随,后者则有几率超越。” 他透露,MOSS 正朝着这一目标努力。这一年来,它在架构上有所创新,规避了现有系统的一些缺陷;在 ” 对齐 ” 上采用了更人性化、更多维度的幻觉数据集,使内容生成更安全;在学习能力上也更加主动。

面对大模型高昂的成本和耗能,整个行业也在寻找解决办法。一些科技巨头亲自下场研发芯片,比如谷歌、亚马逊、微软,甚至 OpenAI 都在考虑针对 AI 运算自研芯片,或是让消费者购买更适合大模型计算的手机和电脑,分担算力成本。

” 开源会让创新速度更快。” 上海对外经贸大学人工智能与变革管理研究院副院长、上海开源信息技术协会秘书长张国锋说,目前国内大模型的开源方式都以企业为主导,并且只开源了整个大模型生态的一小部分,从而出现了算力分散、算力资源浪费等问题。他建议整合政府、高校、企业等优质的大模型生产要素数据、算法和算力,采用开源项目的协作模式和治理方式降低成本,建立大模型时代的 “Linux” 生态位。

本报记者 孙欣祺编译整理 制图:张继

作者:沈湫莎

文:本报记者 沈湫莎 图:视觉中国 编辑:施薇

转载此文请注明出处。

查看原文

清华大学, 人工智能, 大模型, ChatGPT

ChatGPT引发的AI狂飙:2023年AI趋势预测

AI时代,拥有个人微信机器人AI助手!AI时代不落人后!

免费ChatGPT问答,办公、写作、生活好得力助手!

搜索微信号aigc666aigc999或上边扫码,即可拥有个人AI助手!