文章主题:科技圈, 微软, 裁员, macro经济状况
🎯微软官方发布声明,计划于2023年3月底前全球裁员约1万名员工,占公司总人数的5%左右。此举旨在应对当前宏观经济形势以及客户需求的变化。然而,这一决定并未影响微软在人工智能领域的重要投资,如对OpenAI的新一轮融资。遵循科技行业的最新趋势,微软做出了这个重大决策。此次裁员将主要影响公司的运营效率,但并不会影响到其在人工智能领域的长远发展。尽管如此,这一消息仍然引起了广泛关注,让人们担忧企业的未来走向。尽管如此,微软仍然坚定不移地推进其战略目标,包括投资OpenAI等创新技术,以保持竞争优势并满足客户的需求。这一举措表明,微软将继续致力于推动科技行业的发展和创新,并为全球经济带来更多的价值。
根据Semafor的报道,微软将投入100亿美元资金助力OpenAI,并将在其实现盈利前获得OpenAI公司75%的收益。一旦投资回收,微软将拥有OpenAI的49%股权。
💰投资OpenAI的背后,源于ChatGPT所引发的一连串行业反应。ChatGPT不仅助力微软加强在搜索市场的竞争地位,同时也为其在通用人工智能和自然语言处理领域内的商业化为可能。原本,这个市场被谷歌AI所主导。
ChatGPT在2022年11月30日向客户端正式推出,仅仅两个月过后,基于该模型的工具平台月活跃用户数量便已经达到了1亿。近期,ChatGPT还推出了Plus增值版,价格为每月20美元,旨在为更多的企业和学生提供会员服务。与此同时,摩根士丹利的一份研究报告正在探讨ChatGPT是否会對谷歌构成威胁,报告中指出:“这种语言模型有可能占据一定的市场份额,并颠覆谷歌作为互联网用户入口的地位。”
近年来,深度学习技术的广泛应用及其在自然语言处理(NLP)领域的突破性进展,使得许多新的应用场景得以解锁。尽管如此,这一领域尚未实现商业化突破的关键时刻。最近,OpenAI与微软土财主的联合投资,无疑引发了NLP技术企业的新一輪集体焦慮。
ChatGPT的过去与现在ChatGPT 是基于微调后的 GPT-3.5 模型开发的。它与 ELMO、谷歌的 BERT、ALBERT、百度的 ERNIE 和达摩院 M6 等早期自然语言处理预训练大模型一样,成为了 NLP 大模型的典范。这表明,无论是知识检索、人机交互、语言翻译还是文学创作等任务,预训练模型都表现出了强大的能力。
但不同的是,ChatGPT这次还提供了客户端界面,用户可直接通过客户端基于模型训练出的“机器人”进行交互,并且实现WebUI免费版。这种做法也让许多C端用户可以迅速调用ChatGPT,如构思小说框架、写论文、辅助课程设计、为程序debug等操作花样百出。
在GPT3.5之前,OpenAI已经连续发布三个版本的GPT模型,尤其以GPT-3最为著名。在此期间,GPT模型就开始疯狂通过增加可训练参数、增加训练样本等方式进行改进。但暴力拆解方式下,GPT-3依然会经常产生错误,曾有专家指出,“如果没有大量复杂的工程调试,GPT-3还无法真正投入使用。”
另一方面,GPT-3,其参数量就已经达到1750亿,并使用了45TB的训练样本。这意味着当AI任务训练效果提升的同时,也对模型训练成本和时间带来了巨大挑战。业内有人曾估计仅训练GPT-3模型就需要1200万美元,如果用一块非常先进的英伟达GPU训练GPT-3,大概需要100年。
在Transformer思潮的推动下,语言模型进入“巨量”时代,大模型已经在产业界带来了一系列连锁变化。而NLP领域又并非是一个独立的技术范畴,依然需要有底层算力、大数据、知识图谱、迁移学习等核心技术的支撑。
如果GPT按照以往的发展逻辑,将会逐渐通过开源方式让科研与工程界共享技术红利。但在商业世界,绝非如此简单。
微软的神来一笔2019年,在联合创始人马斯克转身离开后,OpenAI宣布重组,成为有利润上限的盈利机构,股东的投资回报被限制为不超过原始投资金额的100倍。同年7月,微软以10亿美元注资,并获得了OpenAI GPT-3的独家授权,而OpenAI则可借助微软的Azure云服务平台解决商业化问题,缓解高昂的成本压力。
过去几年,OpenAI与微软的合作节奏逐渐加快。2021年,OpenAI与代码托管平台Github(被微软收购)合作推出Copilot AI智能代码生成平台,可将文字语言提示词转化为代码,目前是为了提升开发者编码效率。
2022年,OpenAI先后推出图像生成器DALL-E 2和文本生成器ChatGPT,微软也迅速将其整合到自身产品套件,如搜索引擎Bing、Office办公全家桶、会议视频产品Teams Premium均已经计划应用ChatGPT。
而如今,微软不仅希望进行新一轮百亿美金投资,还表示将在Azure云平台中整合ChatGPT,实现Azure OpenAI服务全面上市,通过该服务可访问OpenAI开发的AI模型,届时微软的每个产品都将具备相同的AI能力。
与OpenAI的合作,成为微软到迄今为止在AI领域一笔成功的买卖,对微软在搜索引擎、办公、会议视频,以及云市场引发了强烈冲击,而这也让外界“期待”有望在2023年发布的GPT-4。
热闹的背后据外媒CNBC爆料,谷歌最近正在加快研发一个名为“学徒巴德”(Apprentice Bard)的聊天机器人,其基于LaMDA语言模型。显然,谷歌于去年12月针对ChatGPT的“红色警报”已经拉响。而除了LaMDA之外,谷歌也已经计划将图像生成模型Imagen对抗OpenAI的DALL·E 2。
而据百度披露,今年1月初,百度搜索将升级“生成式搜索”能力,基于百度自研的生成式模型能力,为用户开放式的搜索提问或定制化的信息需求“创作答案”。此外据路透社报道,百度曾计划于3月将该服务作为独立应用推出,再逐步将其集成到搜索引擎中。
无论在当下关注度较为集中的搜索领域,还是其他潜在领域,受ChatGPT的强烈刺激,包括谷歌、百度在内的AI主力梯队已经快速跟进起来。不过,源自GPT本身涉及的伦理问题与技术难点依然存在。
如Stack Overflow已经宣布禁止将ChatGPT所产生的问题用于回答社区问题,并给出违规者最多可被封禁30天的惩戒措施。当不少大学生开始用ChatGPT写作业,纽约大学等高校的教授及学者们也发出警告,将AI视为作弊行为。
在技术层面,GPT-3曾经会犯的错误,在ChatGPT上也并未解决掉,如只能计算精通十以内的加减法,甚至还会“一本正经地胡说八道”。这与ChatGPT的训练语料库有一定关系,其喂养的数据还是来自2021年前来自互联网的数十亿个文本示例。例如在专业知识领域或者信息更新快的IT领域,模型训练任务和训练效果往往会受其制约。
而在训练成本上,小冰公司CEO李笛此前表达,“ChatGPT主要是研究性质上的突破。它有非常好的创新,即证明了在原有的大模型基础之上,进行一些新的训练方法,可以更好地提高对话质量。但如果小冰用ChatGPT的方式来运行系统,现在小冰每天承载的交互量就需要花近3亿人民币的对话成本,即使ChatGPT可以把成本优化到现在的10%,也赚不回来。”
据外媒披露,微软此前的融资就以现金+Azure云算力的方式作为兑付,模型训练最消耗的也恰恰是算力成本。这也难怪分析机构预测,ChatGPT使用量的快速增长可能使英伟达在12个月内销售额达到30亿至110亿美元。长期来看,这也将是微软应对算力高投入与ChatGPT高增长可预见收益下的一种对冲策略。
其实,ChatGPT出现之前,基本国内大的AI玩家就已经在涉足构建出类似于GPT、但主要基于中文语料库的预训练大模型。大模型在落地过程中呈现出了与以往模型不同的技术特征,也带来了更好的智能化水平。
“但是大模型想要在某个方向上训练得更好,智能化水平更高,需要在具体落地场景引入额外的领域知识,才能解决实际问题。AI大模型有其自身特点,训练时使用的数据集主要来自互联网,在通用知识和领域知识的分布上存在不均,会影响其在具体行业的应用。”浪潮信息AI软件研发总监吴韶华对钛媒体App表示。
对于更多的创业公司而言,大模型做微调或二次开发的方式,且不说仍需要大量算力的支持,在实际场景中,能不能等到成熟落地也需要时间成本。
在ChatGPT之后,势必会有更多的AI团队试图给出算法更加精准、训练成本更低、对于用户而言调取更方便的模型,它可能依然会结合Transformer,也可能运用新的机器学习方法,提出对语言翻译、文本生成、甚至情感分析等NLP通用场景下的解决思路。
尤其对于中国的AI团队,也会在ChatGPT的这场狂欢中继续回答一个老问题:当技术的风口再次来了,如何避免走过去商业目标不清晰的老路?(本文首发钛媒体APP 作者 | 杨丽)
AI时代,拥有个人微信机器人AI助手!AI时代不落人后!
免费ChatGPT问答,办公、写作、生活好得力助手!
搜索微信号aigc666aigc999或上边扫码,即可拥有个人AI助手!