文章主题:聊天机器人, 人工智能, 自然语言处理, 生成式人工智能
自2022年底诞生以来,OpenAI推出的聊天机器人程序ChatGPT在全球范围内引发了高度关注。这款程序不仅能够编写代码、编制剧本,还能解决各种难题,甚至还能进行绘画创作。相较于传统的聊天机器人,ChatGPT的智能化水平有了显著提升,使得人们可以更加便捷地与计算机进行交流和互动。此外,ChatGPT还具备了机器翻译、摘要截取和情感分析等技能,使其具有类似真人的语言理解能力。在一些方面,ChatGPT甚至超越了人类,展现出了更高的效率。这一现象不仅引发了新的一轮生成式人工智能(AIGC)热潮,也对传统的人工智能领域产生了深远影响。
ChatGPT的诞生无疑是AI时代的重要里程碑,也预示着新一轮人工智能技术革命正在加速来袭。
01
“跨越山和大海”的人工智能
人工智能,简而言之,是一种模拟人类思维过程的技术,其主要目标是描绘与人类思维紧密相连的“认知”功能,如学习和解决问题。自其概念首次提出以来,人工智能已走过六十多年的发展历程,逐渐引发全球范围内的关注和热情。
在人工智能1.0的时代,技术的发展还处于萌芽阶段,从无到有的创新过程。为了克服人工神经网络的”结构复杂性”问题,1956年,以麦卡锡、马文·明斯基等人为代表的一群从事数学、心理学、计算机科学、信息论和神经学的年轻学者,聚集在达特茅斯学院,举行了人类历史上首次人工智能研讨会。在这个重要的历史时刻,人工智能的概念被正式提出,而那一年也被赋予了人工智能的称号,成为了人工智能的元年。
AI技术系统的复杂性使得其所需的量变积累达到一定程度后才能引发质变。2012年,AI产业迎来了首次爆发,这要归功于AlexNet模型的诞生,它开启了卷积神经网络(CNN)在图像识别领域的广泛应用。到了2015年,机器识别图像的准确率首次超过了人类(错误率低于4%),这标志着计算机视觉技术在各行各业的广泛应用正式开启,从而引发了人工智能1.0时代的创新高潮。在这一时期,“AI”开始赋能各个行业,推动效率的提升。然而,人工智能1.0时代也面临着诸多挑战,其中最为突出的问题就是模型碎片化和AI泛化能力的不足。
目前,我们正处于人工智能的2.0时代,这个时代标志着从1到10的技术创新周期的开启。自2017年Google Brain团队提出Transformer架构以来,大模型领域的主流算法基础得以奠定。自2018年起,大模型的应用迅速普及,其中谷歌团队的模型参数首次突破1亿大关,而在短短四年后的2022年,模型参数已达到惊人的5400亿,呈现出指数级的增长。这一成果的实现,有效地解决了他人在1.0时代AI泛化能力不足的问题。如今,新一代的AI技术正在预示着一场全新的技术创新周期的来临。
在科技的推动下,我国的人工智能行业正以迅猛的速度向前发展,企业的注册数量也在持续增长。根据天眼查的数据,截至2023,我国人工智能相关的企业数量已经接近267.4万家。在2023年第一季度的数据中,新增的企业数量达到了17万家,相较于2022年同期,涨幅达到了6.8%。在地域分布上,广东以39.9万家的企业数量位居全国之首,江苏和北京紧随其后,各有22.4家和21.8万家。而在成立时间方面,超过一半的企业是在1到5年内成立的,其中1年以内的企业占比高达27.7%。此外,自2023年1年以来,人工智能产业的融资事件总共发生了143起,融资的总额超过了800亿元。这些数据显示了我国人工智能行业的繁荣和发展潜力。
02
市场需求大增!小众“数据标注”逐浪AIGC
人工智能是一门多学科的复杂性科学与产业,需要多个子产业共同努力,合力完成产业发展。而数据、算法、算力作为最核心的三个相关子产业,其发展程度被视为人工智能产业的“风向标”。
作为将人类智能转化为机器智能的“原材料”,数据在业内被称为“新的石油”,是实现人工智能技术与产业结合能力的必要条件。值得注意的是,目前市场上90%以上的数据是非结构化数据,被有效利用的不足10%,对于这些非结构化的数据只有经过标注处理才能激活其价值。如今,AIGC的东风进一步拉动了市场对于数据标注处理的需求。
据天眼查不完全统计,2018年至2020年是数据标注企业注册数量大幅提升的3年,分别新增26、21、21家。从地域分布来看,广东以25家位列区域首位;河南、山东分列二、三位,分别是12家和9家。自2023年1月以来,数据标注有关的专利申请已有34项,均属于发明专利。如今,这类工作量极大、过程极其枯燥且耗时的手动数据标记过程,已经成为AI经济体系中的重要组成部分。
算法之于AI就像是烹饪所采用的“方法”,使之可以根据数据模型和算法模型进行自主学习和自我优化,以实现人工智能的目的。自2020年OpenAI推出GPT-3后,谷歌、华为、智源研究院、中科院、阿里巴巴等企业和研究机构也相继发力,陆续推出超大规模预训练模型,当前,预训练模型参数数量、训练数据规模按照300倍/年的趋势增长,增大模型和增加训练数据仍是短期内演进方向;跨模态预训练大模型逐渐普遍,如今已经能够处理文本、图像、语音三种模态数据,未来能够使用更多类型数据的预训练模型将会涌现。
天眼查数据显示,2022年新增人工智能算法注册企业3.6万家,较去年增加37%,从地域分布来看,广东以2.6万家位列区域首位;福建和浙江分列二、三位。
算力之于AI就像是烹饪所需的“柴火”。从发展趋势来看,AI时代所需要的算力更多的是“智能算力”、是新算力。
当前,基于GPU的训练芯片持续增多,面向GPU创新的企业开始发力,出现了摩尔线程、天数智芯、壁仞科技等一批专注GPU赛道的初创公司。基于ASIC等架构云端训练芯片能力提升显著,寒武纪的思元370、原科技的“邃思2.0”以及百度的昆仑2等相对上一代产品均有3-4倍以上的算力提升。
天眼查数据显示,2013年新增人工智能算力注册企业7128家,2022年为11.3万家,数量增加了近15倍。从地域分布来看,广东以17.1万家位列区域首位;福建和江苏分列二、三位。另据天眼查不完全统计,人工智能算力产业在近两年分别发生456和418项融资事件,较2020年的296项有大幅提升。
03
顺应变革大周期,与AI共舞
近年来,国家推出多项政策,保障我国人工智能产业长期发展。数据要素层面,十四届全国人大会议提出成立国家数据局、重组科学技术部等有力举措。国家数据局的成立有望加速数据要素市场化。自主创新层面,重组科学技术部、健全新型举国体制也有利于推动我国科技自主创新发展。
以AIGC为契机的变革改变了内容生产的方式,从内容-交互-流程,实现了内容创作过程中大量重复性工作的“工程化”处理,这也引发人们对于工作岗位面临被机器取代的担忧。天眼查研究院认为,机器学习、深度学习、大模型等让人望而却步的概念不过是机器理解世界的范式,AI的进化不会停止,只会加快步伐。任何时候,AI对齐的追求是使得人工智能系统成为有益的工具,学会利用这一工具,释放更多人力在创新思考等更高级的工作上才是“拥抱变化”的关键。
AI时代,拥有个人微信机器人AI助手!AI时代不落人后!
免费ChatGPT问答,办公、写作、生活好得力助手!
搜索微信号aigc666aigc999或上边扫码,即可拥有个人AI助手!