文章主题:聊天机器人, 人工智能, 自然语言处理, 生成式人工智能
编程、编写剧本、解决难题……自从2022年底ChatGPT聊天机器人程序由OpenAI推出以来,它在全球范围内迅速引起了高度关注。这一现象引发了新一轮的生成式人工智能(AIGC)热潮。相较于过去的聊天机器人,ChatGPT的智能化水平有了显著提升,使得人们能够更便捷地与计算机进行交流和对话。ChatGPT具备了机器翻译、摘要截取和情感分析等多种功能,使其具有类似真人的语言理解能力。在效率方面,ChatGPT的表现甚至超过了人类。这一创新性的人工智能助手不仅为人们提供了便捷的沟通途径,还推动了AIGC领域的快速发展。
ChatGPT的诞生无疑是AI时代的重要里程碑,也预示着新一轮人工智能技术革命正在加速来袭。
01
“跨越山和大海”的人工智能
🤖人工智能被定义为通过电脑模拟人类思考的过程,它主要用于描绘模仿人类及其他与人类思维有关的”认知”功能,例如学习和解决问题。自概念提出以来,人工智能已经经历了六十多年的发展历程,逐渐引发了一场全球范围内的热潮。
在人工智能1.0的时代,技术从零到一的诞生阶段得以展开。为了应对人工神经网络中的”结构复杂性”问题,1956年,包括麦卡锡、马文·明斯基等在内的从事数学、心理学、计算机科学、信息论和神经学研究的青年学者们齐聚达特茅斯学院,举行了人类历史上首次人工智能研讨会。在这个重要的会议上,人工智能的概念被正式提出,而那一年也因此被誉为人工智能的元年。
在AI科技系统中,涉及到的子系统错综复杂,只有当相关元素的累积达到一定程度时,才能引发质变。2012年,AI产业迎来了首次爆发,其标志性事件是AlexNet模型的诞生,这标志着卷积神经网络(CNN)在图像识别领域得到了广泛应用。到了2015年,机器识别图像的准确率首次超过了人类(错误率低于4%),这一突破开启了一场计算机视觉技术在各行各业广泛应用的浪潮,也催生了人工智能1.0时代的创新周期。在此阶段,“AI”开始赋能各行各业,推动效率的提升。然而,人工智能1.0时代同样面临诸如模型碎片化、AI泛化能力不足等问题。
在当下的时代背景下,人工智能已经步入了2.0版本,标志着从1到10的技术创新周期的开启。2017年,Google Brain团队提出了Transformer架构,这一创新性的设计为大模型领域奠定了主流算法的基础。自2018年起,大模型的应用迅速普及,其中谷歌团队在2018年的模型参数首次超过1亿,而到了2022年,这个数字已经上升至5400亿,展示了模型参数的指数级增长。这一成果的实现,有效地解决了中国人工智能在1.0时代的泛化能力不足的问题。目前,新一代的AI技术已经开始崭露头角,预示着可能带来新一轮的技术创新周期。
🚀近年来,得益于科技飞速发展,我国人工智能行业正踏上快速发展之旅,企业注册数量持续攀升。根据天眼查数据,截至训练时间,我国人工智能相关企业总数接近267.4万家。2023年第一季度,新增注册企业达到17万家,同比增长6.8%。地域分布方面,广东以39.9万家企业位居榜首,江苏和北京分列二、三两位,各有22.4家和21.8万家。从成立时间来看,53.6%的企业成立于1至5年内,其中,成立于1年以内的企业占比27.7%。此外,自2023年1月起,人工智能产业共发生143起融资事件,总融资金额超过800亿元。
02
市场需求大增!小众“数据标注”逐浪AIGC
人工智能是一门多学科的复杂性科学与产业,需要多个子产业共同努力,合力完成产业发展。而数据、算法、算力作为最核心的三个相关子产业,其发展程度被视为人工智能产业的“风向标”。
作为将人类智能转化为机器智能的“原材料”,数据在业内被称为“新的石油”,是实现人工智能技术与产业结合能力的必要条件。值得注意的是,目前市场上90%以上的数据是非结构化数据,被有效利用的不足10%,对于这些非结构化的数据只有经过标注处理才能激活其价值。如今,AIGC的东风进一步拉动了市场对于数据标注处理的需求。
据天眼查不完全统计,2018年至2020年是数据标注企业注册数量大幅提升的3年,分别新增26、21、21家。从地域分布来看,广东以25家位列区域首位;河南、山东分列二、三位,分别是12家和9家。自2023年1月以来,数据标注有关的专利申请已有34项,均属于发明专利。如今,这类工作量极大、过程极其枯燥且耗时的手动数据标记过程,已经成为AI经济体系中的重要组成部分。
算法之于AI就像是烹饪所采用的“方法”,使之可以根据数据模型和算法模型进行自主学习和自我优化,以实现人工智能的目的。自2020年OpenAI推出GPT-3后,谷歌、华为、智源研究院、中科院、阿里巴巴等企业和研究机构也相继发力,陆续推出超大规模预训练模型,当前,预训练模型参数数量、训练数据规模按照300倍/年的趋势增长,增大模型和增加训练数据仍是短期内演进方向;跨模态预训练大模型逐渐普遍,如今已经能够处理文本、图像、语音三种模态数据,未来能够使用更多类型数据的预训练模型将会涌现。
天眼查数据显示,2022年新增人工智能算法注册企业3.6万家,较去年增加37%,从地域分布来看,广东以2.6万家位列区域首位;福建和浙江分列二、三位。
算力之于AI就像是烹饪所需的“柴火”。从发展趋势来看,AI时代所需要的算力更多的是“智能算力”、是新算力。
当前,基于GPU的训练芯片持续增多,面向GPU创新的企业开始发力,出现了摩尔线程、天数智芯、壁仞科技等一批专注GPU赛道的初创公司。基于ASIC等架构云端训练芯片能力提升显著,寒武纪的思元370、原科技的“邃思2.0”以及百度的昆仑2等相对上一代产品均有3-4倍以上的算力提升。
天眼查数据显示,2013年新增人工智能算力注册企业7128家,2022年为11.3万家,数量增加了近15倍。从地域分布来看,广东以17.1万家位列区域首位;福建和江苏分列二、三位。另据天眼查不完全统计,人工智能算力产业在近两年分别发生456和418项融资事件,较2020年的296项有大幅提升。
03
顺应变革大周期,与AI共舞
近年来,国家推出多项政策,保障我国人工智能产业长期发展。数据要素层面,十四届全国人大会议提出成立国家数据局、重组科学技术部等有力举措。国家数据局的成立有望加速数据要素市场化。自主创新层面,重组科学技术部、健全新型举国体制也有利于推动我国科技自主创新发展。
以AIGC为契机的变革改变了内容生产的方式,从内容-交互-流程,实现了内容创作过程中大量重复性工作的“工程化”处理,这也引发人们对于工作岗位面临被机器取代的担忧。天眼查研究院认为,机器学习、深度学习、大模型等让人望而却步的概念不过是机器理解世界的范式,AI的进化不会停止,只会加快步伐。任何时候,AI对齐的追求是使得人工智能系统成为有益的工具,学会利用这一工具,释放更多人力在创新思考等更高级的工作上才是“拥抱变化”的关键。
AI时代,拥有个人微信机器人AI助手!AI时代不落人后!
免费ChatGPT问答,办公、写作、生活好得力助手!
搜索微信号aigc666aigc999或上边扫码,即可拥有个人AI助手!