文章主题:人工智能, 自然语言处理, 大语言模型, ChatGPT
1.本轮人工智能革命的起因和意义
本轮人工智能革命的起点可以追溯到微软旗下的OpenAI发布的ChatGPT模型,它在自然语言处理领域表现出了惊人的能力。这个模型的基础技术源自谷歌在2017年提出的Transformer算法,这一算法的核心理念是赋予机器充足的参数和自由度,并结合海量的数据进行强度的训练,以此来达成”涌现(Emergent)”效应,即通过量的积累引发质的飞跃。
Emergent 能力的三个示例:执行算术、参加大学水平考试和识别单词含义
作为一篇具备专业水准的文章,我会重新组织原文内容,使其表达更为精准与丰富。在这篇文章中,我们将探讨大型语言模型所具备的潜在能力,这些能力在2022年的研究中被广泛认可。大型语言模型,尤其是深度学习模型,已经在自然语言处理领域取得了显著的成果。这些模型能够从大量文本数据中自动提取有意义的信息,并生成连贯的文本。此外,大型语言模型还能够通过预训练和指令微调等方法,针对特定任务进行优化,从而在各种应用场景中发挥重要作用。根据Emergent Abilities of Large Language Models(2022)的研究报告,大型语言模型所具备的这些能力不仅限于自然语言处理领域。实际上,这些模型还在计算机视觉、语音识别和推荐系统等领域发挥着重要作用。这主要得益于大型语言模型具有强大的表示学习和抽象能力,能够在不同任务之间进行有效的迁移和学习。尽管大型语言模型已经取得了显著的成果,但仍然存在一些挑战和限制。例如,这些模型的可解释性较差,难以理解它们如何生成特定的输出结果。此外,由于这些模型通常需要大量的计算资源和存储空间,因此在实际应用中可能面临一定的限制。总之,大型语言模型所具备的潜在能力在自然语言处理和其他领域都具有重要意义。尽管目前仍存在一些挑战和限制,但随着技术的不断发展和创新,我们有理由相信,这些模型的潜力将得到更好的释放和利用。
语言,作为人类独特的交流工具,承载着思想和情感的低维度映射,展现了人类的抽象和概括才华。因此,自然语言处理技术被赞誉为“人工智能领域的璀璨明珠”。不同于传统的人工智能模型,大语言模型在对话过程中展现出类似于人类的理解、推理、演绎和类比能力,也就是我们所说的“思维链”。过去,这种能力被认为是人类与机器学习之间的本质差异。得益于“思维链”的推理能力,模型无需经过繁琐的训练,只需在提问时给出提示,便可得出正确的结果。这充分显示了人工智能模型对人类高级思维能力的模拟,从而极大地扩展了人工智能的应用范围。就如同iPhone将手机转变为“人类器官”,并让互联网变得触手可及一样,ChatGPT作为一种终极的调用算力和数据的接口,可能推动人工智能从仅能完成特定任务的范畴延伸至几乎能替代或协助人类进行所有思考任务。正如黄仁勋所言,这将是一场人工智能的“iPhone时刻”。
自2017年ChatGPT背后的Transformer架构被提出以来,理论上其已经具备了显著的提升性能的能力。然而,即使面对这一革命性的技术变革,各大巨头依然保持着谨慎的投资态度。直到ChatGPT的出现,行业才达成了一个共识:只有通过海量数据的训练,构建出参数足够大的模型,才能够实现令人瞩目的性能飞跃。
在我国,人工智能大型模型的长期发展一直较为缓慢,然而自从 ChatGPT 面世以来,短短几个月时间便出现了多个与之匹敌甚至超越 GPT-3 的大型模型。
2.算力、应用等环节的机遇与挑战
大模型对产业链的拉动主要体现在上游的算力环节和下游的应用环节。
在计算能力方面,主要的收益来源于模型的规模扩展。近年来,我们看到了大型语言模型(LLM)规模以每年翻十倍的速度增长。以2018年BERT的1亿参数为例,到2020年,GPT-3已经达到了百亿参数级别,而在2022年初发布的GPT-3.5更是达到了惊人的1750亿参数(数据来源:《Large Language Models: A New Moores Law?》,Julien Simon,Hugging Face)。即便不考虑训练数据集的扩增,参数量的增加也催生了训练计算能力需求的迅速上升。同时,伴随着更多应用场景和大模型结合的出现,推理阶段的计算需求有望呈现爆发性增长。根据TrendForce集邦咨询的预测,到2023年,AI服务器出货量将达到近120万台,同比增长38%。2022年至2026年,硬件设备及AI服务器出货量的年复合增长率预计将达到22%,而AI芯片预计将在2023年实现46%的增长。
人工智能模型的算力需求呈现指数级增长
作为一篇专业的文章,我必须引用并标注我的信息来源。在这篇文章中,我引用了《Compute Trends Across Three Eras of Machine Learning》(2022)这篇文章作为我的信息来源。
AI给逻辑芯片带来的增量测算
资料来源:上银基金权益投研部
在应用层面,人工智能可能带动传媒影视、游戏等行业的爆发式增长,同时也会促使机器人等新应用落地。
以机器人为例,执行一个看似简单的“拿薯片”指令,实际上却涉及到多个精心设计的计划步骤:首先,机器人需要走到抽屉旁边;接着,它需要打开距离最远的抽屉;然后,在众多薯片之中,它精准地挑选起绿色那一片;最后,将选中的薯片轻轻放置在柜台上。对于传统机器人来说,完成这样的复杂任务面临两大挑战:一是难以协调各个动作的执行顺序,二是无法精确控制每个动作的力度和速度。
首先,传统机器人的操作流程通常从工程师开始,需要不断编写新代码和规则来纠正机器人的行为。这个过程缓慢、昂贵且低效,需要多次交互才能使机器人正常运行。
其次,机器人通常在明确具体任务和奖励的情况下表现最好,但在学习执行多步骤任务和推理抽象、模棱两可的指令方面存在困难。
然而,以ChatGPT为代表的大模型开启了一种新的机器人范式。一方面,大模型允许非技术用户参与控制回路,可以直接为机器人场景生成代码,在没有任何微调的情况下,利用大模型的知识来控制不同的机器人动作,以完成各种任务。另一方面,大模型也能够理解微妙的语句,例如“我刚刚锻炼过,可以给我拿一份健康的零食吗?”
类似的人工智能技术也有望在传媒影视、游戏等领域带来爆发式增长,比如通过大模型的智能和创造力,实现更出色的艺术创作。
大模型的出现改善了机器人对环境的适应性
资料来源:微软
然而,大模型的落地也面临一些挑战。
首先,大模型对计算资源的要求很高,需要大规模的计算设备和存储空间,这对企业和组织的投入提出了挑战。
其次,大模型的训练和部署需要处理大规模的数据集,而数据的质量和隐私问题也是需要考虑的重要因素。此外,大模型的复杂性也增加了模型可解释性的难度,这在某些领域,如法律和医疗等敏感应用中尤为重要。
总的来说,上银基金认为,算力和应用环节在大模型发展中具有重要地位。算力需求的增长将推动硬件产业的发展,并催生出更多高性能的AI服务器和芯片。同时,大模型的广泛应用将为各行各业带来创新和突破,但也需要应对算力、数据、模型解释性等方面的挑战,以实现大模型技术的可持续发展和应用的成功。
3.国内人工智能相关投资机会的展望
从投资角度来看,上银基金指出,算力板块直接受益于产业趋势,随着海量数据的收集、清洗、计算、训练和传输需求的增长,将带来算力和网络的迭代升级,利好AI数据中心和边缘高速计算所使用的GPU、CPU、FPGA、ASIC、HBM存储器、3D NAND、光芯片等。国外GPU的严重缺货,以及供应链的多元化需求也为国产AI芯片、服务器带来了适配机会。大模型的发展阶段是黄金窗口期,国内的算力芯片厂商具备良好的入局机会,相关的龙头企业有望明显受益。
此前,由于商业模式的缺陷,传媒影视、游戏和互联网软件等应用板块的估值普遍较低。因此,上银基金表示,AI应用行情的核心逻辑是用AI改造传统的商业模式,实现业绩与估值的戴维斯双击:需求端通过AI赋能提升用户体验,带来渗透率/斜率加快,供给端降本增效,释放更多产能,业务结构端提升软件算法平台权重,提升估值。当前,应用板块的估值修复基本完成,行情将进入逻辑驱动和业务驱动的第二阶段。在这个阶段,投资者应重点考虑业务的可持续性以及人工智能使用成本与客户需求的匹配度。
尽管目前人工智能仍处于产业趋势形成阶段,大模型和应用的格局不易判断,受事件催化影响较大,但该阶段正是成长股投资的最佳阶段,格局清晰后有望进入成长股的“价值投资”阶段,因此,上银基金认为,可以密切关注算力上游芯片放量以及下游AI服务器客户需求情况,并关注应用领域的真实客户需求;同时,投资者可以对机器人等具有现象级潜力的产品的落地保持期待,并结合行业发展动态理性投资决策。
人工智能, 自然语言处理, 大语言模型, ChatGPT
AI时代,拥有个人微信机器人AI助手!AI时代不落人后!
免费ChatGPT问答,办公、写作、生活好得力助手!
搜索微信号aigc666aigc999或上边扫码,即可拥有个人AI助手!