ChatGPT一周年|AI应用如何赚钱?大模型等待“瓦特时刻”澎湃新闻2023-12-05 09:05澎湃新闻2023-12-05 09:05
AI情感助手

ChatGPT一周年|AI应用如何赚钱?大模型等待“瓦特时刻”澎湃新闻2023-12-05 09:05澎湃新闻2023-12-05 09:05

【编者按】2022年11月30日,可能将成为一个改变人类历史的日子——美国人工智能开发机构OpenAI推出聊天机器人ChatGPT。它不仅催生了人工智能界的又一轮高光期,还并不常见地被誉为“蒸汽机时刻”、“iPhone时刻”甚至“钻木取火时刻”。 这一年来,被称为“生成式人工智能”的革命性技术激发了全球科技界“把所有软件和硬件重做一遍”的冲动,让具有先发优势的AI基础设施提供商价值暴涨,使得从医疗到航天的科学探索获得被加倍赋能的前景,传说中“奇点”的到来从未变得如此具有可能性。 正如历史上任何一次技术变革,ChatGPT也给我们带来了深深的焦虑。既有对AI威胁人类生存的科幻式恐惧,也有对砸掉我们饭碗、骗取我们钱财、操纵我们心灵的现实担忧。连OpenAI自身,也刚刚经历了一场危机,差点没躲过一夜坍塌的命运。 这一年让我们产生了更多疑问:大语言模型下一步的进化方向是什么?AI芯片短缺何时解决?训练数据快要耗尽了吗?中国的百模之战会如何演化?AI技术发展应加速还是减速?AGI(通用人工智能)是否会存在其他形式?为此,我们邀请了2023年在AI赛道奔跑的业内人士回答这些问题,并提出他们自己的问题。如果你也有自己的回答或提问,欢迎告诉澎湃科技(www.thepaper.cn)。 在生成式人工智能“喧闹”了一年后,到底有多少企业因为该技术的应用赚到了钱? “国内应用都在试图产生价值,但很少实现盈利,做数字人的‘小作坊’倒是真挣钱了。”北京开放传神科技有限公司(OpenCSG)创始人兼首席执行官陈冉告诉澎湃科技。信也科技副总裁、大数据及AI负责人陈磊认为,在国外企业中,与OpenAI深度合作的微软公司“营收应该有比较大的起色”。云知声智能科技股份有限公司董事长兼CTO梁家恩则表示,“AI图像生成公司Midjourney据称已经做到1亿美元的营收了”,但是“还看不到真正的AGI-Native(AGI原生)应用”。 “目前仍处于刚刚开始的阶段,如果计算成本投入和收益,现在盈利的行业还不多见。”上海市数据科学重点实验室主任、复旦大学教授肖仰华表示,大模型在很多行业都取得了显著效果,但取得效果并不代表能盈利,这涉及到很多因素,尤其是成本因素,大模型的炼制需要巨大的成本。 如果换一种问法:大模型最先落地或者落地最成功的产业有哪些?蚂蚁集团副总裁、金融大模型负责人王晓航认为:“有两类,一类是创造型产业,比如设计、文娱、游戏;另一类是高知识密集型行业,比如金融、医疗、法律。”但是,医疗、金融等强监管行业对可靠性要求极高,不只是“幻觉”,还有金融的合规性、每个行业的价值主张。如果这3个问题不解决,大模型在严谨产业里落地时潜力就无法发挥。 具体到医疗领域,科大讯飞董事长刘庆峰向澎湃科技介绍了“医疗大模型可以完成90%的不合理用药提醒”,英矽智能联合首席执行官兼首席科学官任峰则直言:“好像一夜之间,以前做不到的事情忽然就可以做到了。”比如,直接与大模型对话,提问“帮我找到治疗某个癌症的靶点”就可以得到相关结果。 在金融领域,王晓航表示,在很多场景里意图理解、定性分析、量化分析等领域已经超过人工,“未来的服务要通过多模态的交互、语言的交互来完成,怎么跟移动互联网的图形界面融合,形成一种新的界面和体验,可能是未来两年会发生的。” 对于未来一年是否会出现现象级的应用,受访者观点不一。百度集团副总裁、移动生态商业体系负责人王凤阳认为现象级的生成式AI应用一定会出现,而且会超出大家的预期。IDEA(粤港澳大湾区数字经济研究院)AI安全普惠系统研究中心讲席科学家王嘉平则表示,“会比原来互联网的现象级应用来得更快”。阿里云科技和研究中心主任安筱鹏持谨慎乐观的态度,并指出,对于中国应用场景丰富的说法,前提是特定行业的数据积累足够多。此外,需要底层算力、开源模型以及各种各样的工具才能把整个生态搭建好,把技术门槛、应用门槛及成本降下来。 “任何一次重大技术变革带来的产业革命拐点,一定来自成本的拐点。”安筱鹏说,蒸汽机最开始被发明出来,是为了把矿井里的水抽上来,它的成本很高,会经常坏。“瓦特做了什么?他大幅提高了蒸汽机的稳定性、安全性、可靠性,降低了成本,所以蒸汽机从一个专用的、只能抽水的机器,变成了一个通用的、可以拉着火车向前跑的机器。” 以下为采访实录,因篇幅原因有删减: 澎湃科技:目前因生成式AI的应用而实现盈利的企业或行业有哪些? 陈磊(信也科技副总裁、大数据及AI负责人):我们看到很多估值、用户体量或营收涨了很多的企业。微软因为生成式AI对Office体系的加持,营收应该有比较大的起色,市值又回到了万亿规模。未来应该会有企业因为生成式AI盈利。 张鹏:每个场景下都有。客服工作可以由AI来取代一部分,或者由AI提升质量。在科研场景中,AI帮助阅读文献、查找资料、数据分析,提升科研工作效率,甚至提供一些关键性的研究创意。 陈冉【北京开放传神科技有限公司(OpenCSG)创始人、CEO】:国内应用都在试图产生价值,但很少实现盈利,做数字人的“小作坊”倒是真挣钱了。国外的应用已经非常适配了,比如Copilot辅助开发代码,做陪伴的汤姆猫也比较成功。在未来,数据已经准备好的、马上可以用起来的、使用比较多的、给大家带来很多价值的应用会马上形成产业链。 梁家恩(云知声智能科技股份有限公司董事长兼CTO):AI图像生成公司Midjourney据称已经做到1亿美元的营收了。过去UGC(注:用户生成内容)只是文本为主,有了这种多模态工具,UGC会更加丰富多彩。所以这块的应用可能会比较快,因为它相当于给我们生成了很多候选,再由人协同处理。如果直接让机器百分之百生成一个非常好的结果,所有AIGC(注:人工智能生成内容)目前都做不到。 肖仰华(上海市数据科学重点实验室主任、复旦大学教授):是否盈利取决于成本和收益。大模型应用的成本问题目前已经非常突出,大模型的炼制需要巨大成本,大模型的应用也存在成本。考虑到成本因素之后,收益是否足够显著,相对于成本付出是否值得,这也是大模型行业赋能千行百业中的关键问题。 目前仍处于刚刚开始的阶段,如果计算成本投入和收益,现在盈利的行业还不多见。如果换个问法,大模型取得应用效果的行业和企业有哪些,那么我想答案非常明确,大模型在很多行业都取得了显著效果,比如大量的虚拟主播基于大模型,普通翻译员的大部分工作一定程度上可以被大模型所代替。还是仍然要强调,大模型能取得效果并不代表它能盈利,这涉及到很多因素,尤其是成本因素。大模型虽然能够达到普通人的一些能力和水平,但是成本未必更低,所以这完全是另外一个问题。 澎湃科技:大模型最先落地或者落地最成功的产业有哪些?有哪些难点? 王晓航(蚂蚁集团副总裁、金融大模型负责人):有两类,一类是创造型产业,比如设计、文娱、游戏;另一类是高知识密集型行业,比如金融、医疗、法律。大语言模型是强大的世界知识图谱容器,它能媲美、赋能,甚至某种程度上替代一部分知识型工作者。 大模型是基于全网可得的公开数据所训练的,理解和生成能力非常强,但遇到专业严谨的行业时有非常多挑战,通用大模型在专业通识方面是短板,比如金融专业性很深。各种金融决策的复杂性和严谨性要求很高,医疗行业更加复杂严谨,比如做家庭资产配置保障计划不是简单推荐,而是计算偏离度、风险集中度、风险等级、承受能力,像这样的决策不是大模型擅长的,它无法学习,即使有足够的数据,它的严谨梳理和计算也远远达不到今天的行业要求。 医疗、金融等强监管行业对可靠性要求极高,我讲的可靠性不只是“幻觉”,还有金融的合规性、每个行业的价值主张。如果这3个问题不解决,大模型在严谨产业里落地时潜力无法发挥。如何解决这3个问题?一是大模型要跟专业领域的小模型结合,比如资产配置,在理解用户需求后调动资产配置工具,而不需要重新计算资产该怎么配置。二是结构化的知识图谱很重要,比如我们为了做好医疗理赔工作,要建非常完备的医疗和保险知识图谱,在大模型训练过程中注入,降低幻觉,提高专业性,在应用过程中优先考虑知识图谱跟大模型怎么结合。检索增强技术也非常有效,在专业领域中进行内容定位以后进行解答,就像从一本专业书籍中找答案,这些技术都可以大幅提高大模型专业性和事实性。这是一个系统工程。 澎湃科技:什么样的大模型应用能够真正产生价值? 张鹏(北京智谱华章科技有限公司CEO):一个技术在应用中会产生几种价值,降本、增效、提质、创新。更具体一点来说,比如能做到人做不到的事,帮人做简单、重复的工作,把人从这种工作中解脱出来,在数字化时代提升数据流动、交换、处理的效率和效果。 陈冉:应用最终要解决痛点、服务人类,人类为产生价值的过程付费。现在的很多应用不会马上跳跃式形成下一代应用,中间阶段是让现在的应用AI化,最终变成原生应用,也就是说甚至不用到网页上点了,这些应用涉及购物、旅游、餐饮、服装等。 梁家恩:目前还看不到真正的AGI-Native(AGI原生)应用。就像当时移动互联网刚出来时,大家的想法是把PC应用改小了,装进手机就完了,目前大模型应用还停留在这个阶段,真正的AI-Native(AI原生)应用还需要迭代。 但不管最终形态如何,还是要回答一个问题:帮助用户解决了什么问题。比如在医院里,用户最希望的是有一个超级医生,所有问题都能解决,连医院都不需要去了。但在这种严肃场景里,要一步到位不太现实。我们现在可以给医生提供一些工具,帮助医生提升效率和质量,基础性的工作让机器完成,更好释放更多优质医疗资源。人跟机器的协同过程中,人在适应机器,机器也在学习人的过程中不断提升。最终它有可能达到专家的中上水平。但未来可能还会剩下一些疑难问题,需要人来协同解决。 医疗是我们的重要方向之一,这是一个知识非常密集的行业,光靠在互联网上抓取医疗相关的数据,精准度和质量达不到好的医疗专家水平。所以我们还会补充相关数据,针对性优化相关应用。最终还是以解决问题为导向,才能找到最终的AI-Native的形态。 澎湃科技:AI如何应用于智能医学、生命科学,如何考虑隐私和伦理因素? 刘庆峰(科大讯飞董事长):居民用药中非处方药占45%(2022年我国非处方药市场规模为1951.7亿元,占零售药品市场的45.4%),但在基层6亿多的复诊案例中,出现4000多万例疑似不合理用药。很多人有基础疾病,容易出现用药不当的问题。我们身边就有一位85岁老人,患有阿尔兹海默病,服用相关药后牙疼,吃了一个常见的消炎药后就开始不吃饭,连续将近20天,此后在省立医院就诊后才慢慢恢复。后来发现原因在于不知道这款消炎药与原来用药相互之间有反应,除此之外还有些用药禁忌,老百姓不知道,药房里的销售人员也不知道,也不可能每一个病都去问医生。那么,这个需求如何满足? 我认为我们的医疗大模型可以完成90%的不合理用药提醒。同样的,很多人拿到体检报告后看不懂有没有深层次问题,但又不是每个人都能有机会咨询医生。科大讯飞在内部尝试了几千个抽样例子,可以看到有40%的样本应该给予更多提醒,有的要马上就医,或者要注意各种各样的禁忌,还有百分之三点多则提醒要马上处理。 不过,最好的医生也不可能百分百都对,模型就算比医生更专业,也不可能百分百正确。所以我们希望社会对这样的业务,一方面要严格、谨慎,依法,绝不能随便推荐处方药,也绝不能随便下定论,一旦发现有问题一定要提醒“就医要到医院”。模型的任务是让患者心中更清楚,不是替代医生,而是帮助患者将来更好地了解情况,以便更好地和医生沟通。 任峰(英矽智能联合首席执行官兼首席科学官):ChatGPT出现之后,我们用内部数据基于其进行了二次训练,使模型能够支持生物医药的专业精准的信息问答。之前传统方式是每个靶点的生物学机制都需查阅大量文献,现在可以直接与大模型对话,比如提问“帮我找到治疗某个癌症的靶点”就可以得到相关结果。这对我来说印象深刻,好像一夜之间,以前做不到的事情忽然就可以做到了。 我们目前已经在用由AI辅助决策的自动化实验室,把人工智能与自动化、机器人和生物学能力融合,既可执行单一任务,如高通量筛选、高内涵成像、二代测序等,也可以实现一体化串联流程,比如在14天内完成靶点发现和验证的全自动化干湿实验闭环。效果如何呢?以药物研发的DMTA(Design、Make、Test、Analyze)为例,以前每一轮合成大约需要一名化学家3到6周的时间来制造、纯化、量化和鉴定所需化合物,再进行一系列生物分析。而自动化实验室可以24小时处理,反应可以在任何时间进行,还有可能将合成时间从3到6周缩短到3到10天。除了研发的角度以外,对于医院、医生以及患者,AI的赋能都是全方位的,比如辅助诊断、以智能的方式追踪患者情况变化等。 陈冉:我们看到多模态分子大模型、影像大模型都在做,需要人类高智商的领域和行业就是大模型的发展方向,医院里的主任就是稀缺资源。 梁家恩:我们最早做的是病历的书写和审核,我们会帮医生检查诊疗有没有存在风险隐患的地方、哪些不符合医保规范。我们要守住的底线是保护用户隐私,我们和客户相关的数据都是脱敏数据。 澎湃科技:AI会引发哪些具体的教育变革?可以参考你们的实践。 肖仰华:未来随着通用人工智能技术的快速发展,其对教育的影响会非常深远。未来教什么学什么,怎么教怎么学都会成为问题。 人工智能的每一次进步似乎都以AI通过了人类的某种考试为标志,像高考、注册医师考试、注册司法执照考试等。那么AI的进步往往反射出人类教育的很多问题,比如既然AI通过了如此众多的人类考试,我们考试的意义何在?先进的人工智能似乎一直在把机器培养成人,而落后的教育似乎是把人培养成机器,很多优秀的学生被培养成了刷题的机器,这是教育应该极力避免的问题,所以AI的发展映射出的教育问题值得我们注意。 第二个问题是怎么教怎么学。未来知识的获取、技能的学习意义将会降低,现代文明一直是以知识发现和获取为主要目的,我们曾经以“饱读诗书,学富五车”为荣耀,这样一种追求在大模型时代,将会变得不再那么耀眼。因为最学富五车的是大模型,他几乎学到了人类的所有知识,那么对于知识的廉价和贬值,取而代之的是人类生存和发展的智慧将会更加凸显。 张鹏:有一次我跟“好未来”的技术人员交流。AI学习能力比人类强,比人类快,未来我们的孩子还需要学习这些基础知识吗?未来的孩子们要学习啥?我当时用开玩笑的语气说,学习AI。在这样一个时代,大家要掌握AI的原理或基本知识。第二,基础知识的学习还是要有,当然可以考虑怎么用辅助手段来提升学习效率。 AI的进化在倒逼人类自身的进化。如果人类不想被AI取代、被AI奴役,人类本身的智能水平以及学习能力需要调整和进化。 陈冉:学校资源是有限的,通过AI把好老师的资源沉淀下来,变成各科老师陪伴在身边,教育肯定会形成质变。 刘聪(科大讯飞研究院院长):教育领域属于讯飞非常重要、也有深厚积累的场景,因此我们在2022年12月开启大模型攻关确立“1+N”体系之时,就明确了教育属于“N”的重要落地领域之一。面向家长和学生,讯飞星火认知大模型赋能的讯飞AI学习机实现了中英文作文类人批改,在口语对话方面进行陪伴式对话练习,还能对孩子的发音进行评分。星火语伴App可以让学生和虚拟人老师面对面沟通。面向老师,星火教师助手可以创新规划单元教学设计、启发创设情境教学活动、一键生成互动教学课件,提升老师的备课效率。...
ChatGPT一周年|大模型新进化:智能体?超级生态?工具智能?澎湃新闻2023-11-30 14:21澎湃新闻2023-11-30 14:21
AI情感助手

ChatGPT一周年|大模型新进化:智能体?超级生态?工具智能?澎湃新闻2023-11-30 14:21澎湃新闻2023-11-30 14:21

【编者按】2022年11月30日,可能将成为一个改变人类历史的日子——美国人工智能开发机构OpenAI推出聊天机器人ChatGPT。它不仅催生了人工智能界的又一轮高光期,还并不常见地被誉为“蒸汽机时刻”、“iPhone时刻”甚至“钻木取火时刻”。 这一年来,被称为“生成式人工智能”的革命性技术激发了全球科技界“把所有软件和硬件重做一遍”的冲动,让具有先发优势的AI基础设施提供商价值暴涨,使得从医疗到航天的科学探索获得被加倍赋能的前景,传说中“奇点”的到来从未变得如此具有可能性。 正如历史上任何一次技术变革,ChatGPT也给我们带来了深深的焦虑。既有对AI威胁人类生存的科幻式恐惧,也有对砸掉我们饭碗、骗取我们钱财、操纵我们心灵的现实担忧。连OpenAI自身,也刚刚经历了一场危机,差点没躲过一夜坍塌的命运。 这一年让我们产生了更多疑问:大语言模型下一步的进化方向是什么?AI芯片短缺何时解决?训练数据快要耗尽了吗?中国的百模之战会如何演化?AI技术发展应加速还是减速?AGI(通用人工智能)是否会存在其他形式?等等。为此,我们邀请了2023年在AI赛道奔跑的业内人士回答这些问题,并提出他们自己的问题。如果你也有自己的答案或提问,欢迎告诉澎湃科技(www.thepaper.cn)。 掀起生成式人工智能浪潮的美国机构OpenAI,在ChatGPT发布前并不为大众所熟知。但在这短短的一年里,它已经成为全球最知名的科技公司之一,旗下产品令谷歌、Meta、亚马逊等几大巨头倍感竞争压力。所有关心AI的人都在好奇:GPT-5到底什么时候发布?谁能够成为OpenAI的真正挑战者? “用‘挑战者’这个词,就把OpenAI的地位抬得太高了。OpenAI确实在领先,但也不是可以完全忽视其他竞争者。”北京智谱华章科技有限公司(智谱AI)CEO张鹏对澎湃科技表示,“从技术上真正能和OpenAI一较高下的,可能还得是本身有底蕴、有技术积累、认知足够高的企业。”而上海市数据科学重点实验室主任、复旦大学教授肖仰华指出,一旦某个模型初步具备了AGI的形态之后,它的升级和迭代以及演进速度将会十分惊人,所以其先发优势十分明显,实际上要担心的是差距是否会被拉大。 经过早期爆炸式的增长后,OpenAI的用户增长放缓已是事实,尽管“这是非常正常的”。蚂蚁集团副总裁、金融大模型负责人王晓航告诉澎湃科技,从模型能力来讲,其演进是靠数据驱动的,“今天比较大的问题是互联网上公开可得的图文数据基本上已经开始枯竭了”,解决路径有两条。但最主要的问题是,AGI作为中心化的产品,现在还没法成为大众的高频刚需。他进而提出:大模型不应只是一个简单的中心化的超级AI,而应该是一个超级生态,这也是行业趋势。现在还没有特别成功的产业案例,但可能会在未来一两年发生。 对于大语言模型下一步的进化,在接受澎湃科技采访时,科大讯飞董事长刘庆峰提出了3个方向:更大的模型参数;打造AI人设;在各行业场景内做更纵深的定制和服务。百度集团副总裁、移动生态商业体系负责人王凤阳则着重提到了智能体(agent):“我们认为其已经是从商业生态上讲最有价值和最希望能够取得突破的方向。”北京衔远科技有限公司创始人周伯文认为,下一步在于有没有可能让AI跟人一样能够使用好工具,“这是目前我们在大模型领域再往下推进的更重要的一个方向,我把它叫做工具智能。”北京开放传神科技有限公司(OpenCSG)创始人、CEO陈冉指出,要解决数据缺乏的问题,必须做好数字化转型。亚马逊云科技全球渠道副总裁Ruba Borno则认为,真正的困难在于优先事项的排序,在于决定哪些用例对用户来说是最重要的,而不是跟随一切可能有趣的方向。 ChatGPT诞生以后,中国科技企业展开了一场被戏称为“百模大战”的白热化竞争,参与者包括老牌“大厂”和飞速融资的初创企业,其激烈程度和演进速度在中国企业界多年未见。但到了明年,“市场会更冷静客观。第一,未来大模型可能会更侧重应用落地。第二,基础模型肯定会收敛,市面上不会有80多个基础模型版本。”信也科技副总裁、大数据及AI负责人陈磊对澎湃科技表示。 随着OpenAI逐渐不open(开放),对其模型参数和训练细节讳莫如深,而以Meta为首的公司高举开源路线的旗帜,一个被广泛提起的问题是:“开源大模型有机会赶超闭源大模型吗?”云知声智能科技股份有限公司董事长兼CTO梁家恩估计:“在应用数量上开源大模型的影响会更大,但在做到最高水平上,闭源大模型会更好一些。” 以下为采访实录,因篇幅原因有删减: 澎湃科技:GPT-5会发布吗? 陈冉【北京开放传神科技有限公司(OpenCSG)创始人、CEO】:GPT-5、GPT-6、GPT-7肯定会继续发布。数据量爆发式增长,大模型参数不断增长,交互性也会越来越强,只不过大模型的预训练过程已经不需要了,更多的是怎么让它通过好的数据集形成质的飞跃。 梁家恩(云知声智能科技股份有限公司董事长兼CTO):GPT-5只是一个代号,往后走还有很多问题要解决,AGI的能力要继续延伸,OpenAI是一个值得尊重的AGI的引领者。 陈磊(信也科技副总裁、大数据及AI负责人):发布应该是必然,只是时间上难以判断,这取决于市场和监管。推测会更审慎看待GPT-5的推出时间,因为GPT-4现在在市场上还很有竞争力。 肖仰华(上海市数据科学重点实验室主任、复旦大学教授):发布是一个时间早晚的问题,但是它所发布的GPT-5和现在训练出的GPT-5未必是同一个版本。为什么?因为一般研制出来后需要进行一些安全性评估评测。安全性不单单是指在问答交互过程中产生有用的、无害的答案,还包括其能力对整个社会带来的冲击和影响。 事实上OpenAI在GPT-4发布没多久,在今年3月就曾经发布过一些报告,分析了人类的哪些工作岗位容易被GPT系列的大模型所替代,所以这本身也应该被纳入其发布前的安全性评估范围里。也是基于此,很多时候我们认为GPT-5经过适当评估,被认为是安全之后,或许也要做一定能力的剪裁,最终会发布一个相对安全、人类能够接受的大模型版本。 澎湃科技:谁能够成为OpenAI的真正挑战者? 张鹏(北京智谱华章科技有限公司CEO):OpenAI的挑战者可以分成两类,一类是科技巨头,像微软、谷歌、Meta、亚马逊,甚至包括英伟达,但他们的切入点不太一样,挑战的是OpenAI的市场、技术积累、资源。另一类是创业型企业,包括Anthropic、Cohere、Inflection AI等,对OpenAI会有一定冲击。 用“挑战者”这个词,就把OpenAI的地位抬得太高了。OpenAI确实在领先,但也不是可以完全忽视其他竞争者。从技术上真正能和OpenAI一较高下的,可能还得是本身有底蕴、有技术积累、认知足够高的企业。比如谷歌正在整合自己的所有资源,明显看到它在加速,对OpenAI的威胁明显提升了。Anthropic是公认除OpenAI之外强有力的一个竞争者,Inflection AI坚持自己的特色,这些企业也会构成挑战。 本质上,谷歌、Anthropic,包括我们自己,目标都是一致的,就是AGI。其他企业略微会有不同的发展方向或对自己的定义。 (澎湃科技:能成为竞争者是因为什么?)最重要的就是目标和认知要足够有竞争力。OpenAI从2015年瞄准的目标就是AGI,不管是投靠微软还是独立发展,都没有改变初心。第二是资源,微软可以说是不计代价支持OpenAI,能跟这些巨头的资源投入相媲美的,可能就是巨头或者是有巨头站在身后的企业。第三是团队积累、核心技术掌握的程度。 肖仰华:在ChatGPT刚发布的时候,我曾经就有一个观点:在通用人工智能赛道,有可能是只有第一,没有第二。这当然是在不考虑其他因素的前提下,如果是一个充分自由竞争的环境,那么可能是这样的结果。为什么?在不考虑其他人为因素、政治因素等,单纯就技术本身的发展和演进趋势来看,一旦某个模型初步具备了AGI的形态之后,它的升级和迭代以及演进速度将会十分惊人,所以其先发优势十分明显,实际上我们要担心的是差距是否会被拉大。 那么OpenAI会存在挑战者吗?我认为有可能会,但挑战者可能并不是来自于Open AI所开辟的通用大语言模型赛道,有可能来自于一些新的赛道,如具身大模型,当大模型和机器身体结合之后,它对智能本身的促进作用可能远超一个没有身体的纯语言式的大模型,还有包括多模态大模型、基于群体智能的大模型、专业大模型等。也就是说在一些新兴大模型赛道,因为其借助了新的发展智能的“涌现”机制,就有可能超出以语言为核心机制的GPT系列大模型。我一直认为智能的实现路径是多样的,或者说通用人工智能的实现路径是多样的,以ChatGPT为代表的以语言为核心的大语言模型,未必就是最佳捷径,有可能存在更快速的迭代。 我相信OpenAI也有可能意识到这些可能挑战者的存在,但同时在这么多赛道布局,这对任何一个参与者来讲都是非常困难的,所以挑战者理论上存在的,但一定不是在OpenAI自己所开辟的这条赛道上,一定是在其他可能实现通用人工智能的新赛道上。 王晓航(蚂蚁集团副总裁、金融大模型负责人):五年前,很少有人预料到OpenAI会成为AI领跑者。所以挑战者有可能是像Meta这样背靠开源生态的开源大项目,像谷歌这样有数据飞轮、有资源的企业,也有可能是另一个“OpenAI”,也就是专注在算法架构和深度领域潜心钻研的创业公司。 陈磊:短期很难(挑战OpenAI),测评结果上都没有达到GPT-4的能力。从多模态角度看,短期也没有看到特别强劲的挑战者。但这需要动态来看,因为模型在不断迭代,不同模型对不同场景的表现也不一样,很难讲一个模型通吃。但GPT-4可能是个例外,它真的比较全面。 陈冉:国内不可能有挑战者。国外像谷歌、Meta都没有放弃,另外一个阵列像Cohere、Anthropic、X会不断挑战。这个技术不会被垄断,大咖们都想获得挑战资格,所以竞争会越来越激烈。 梁家恩:DeepMind也是很是实力的AGI的推动者之一,但更关注行业问题,他们开发的AlphaFold非常厉害。其实大家都在寻找一个好的通用智能基础,然后用这个技术能力去解决一个问题,就像DeepMind的理念是先解决智能问题,然后再解决各种行业的难题,因为那些难题可能已经超出人类目前的能力范围了。 澎湃科技:如何看待OpenAI增长放缓? 王晓航:从模型能力来讲,共识是模型架构是趋于统一的,所以模型能力的演进是靠数据驱动的。今天比较大的问题是互联网上公开可得的图文数据基本上已经开始枯竭了。解决路径有两条:一是模型架构如何优化来“对齐”多模态数据,包括图文、视频、IoT等一系列多模态数据,打破数据规模、数据质量瓶颈,这是各大AI大模型厂商现在最主要的方向之一。二是落地,OpenAI正在寻找产业数据合作伙伴,这意味着公开可得的数据、高质量的数据耗尽之后,千行百业专业领域里的高质量私域数据规模可能和共享数据不相上下,这部分产业数据怎么像自来水管一样接入到大模型也很关键,这不存在捷径,要跟同行一起管理。 从用户来讲,用户增长放缓是事实,早期爆炸式增长不是可持续的。 最主要的问题是,AGI作为中心化的产品,现在还没法成为大众的高频刚需。大模型要真正融入千行百业,让产业全面AI化,才能成为广泛的刚需,这是下一步的增长空间,会有更大的增长。大模型不应只是一个简单的中心化的超级AI,而应该是一个超级生态,这也是行业趋势。所谓超级生态,就是更通用强大的模型、更高效的开发、开发之后集成到各产业中。现在还没有特别成功的产业案例,但可能会在未来一两年发生。 肖仰华:首先,OpenAI的增长缓慢只是指ChatGPT的用户数增长放缓了,这是非常正常的。任何一款新产品经过早期发展之后,随着用户对其新鲜感的消失,自然会存在一些用户流失。这也说明大模型的能力不能停留在只是聊天,应该要尽快向行业深度的痛点需求渗透,真正意义上解决千行百业里严肃的决策问题,才有可能释放价值。 我经常把OpenAI的GPT系列大模型比作电能,它提供的是一种智能。人类历史上从电能的诞生到大规模应用,经历了上百年的时间,为何如此?主要因为在于电能要想赋能应用,还需要很多电器,必须有大量电气设备的研发制造,才有可能真正解决问题。OpenAI进一步的增长动能恰恰也在于此,必须要有利用GPT这种智能的能力,形成各种各样的应用程序,就是所谓的GPTs,才有可能真正解决行业问题,创造价值,推动OpenAI进一步的可持续发展。 张鹏:从现象看本质,并不一定是放缓。盛传的ChatGPT用户增速放缓甚至是下降,其实有很多背后的原因,比如它的API(应用程序编程接口)收入增长很快,也就是说很多用户从初期试一试玩一玩ChatGPT,转向了真正拿GPT的API去开发应用,做商业转化,大家的心态从看热闹转换为脚踏实地做事情了。当然,像C端用户的增长也不是没有天花板的,因为全球网民也就那么多。 陈冉:它没有真的放缓,它的增长趋势超越了TikTok。只能说它到达了瓶颈,瓶颈受基数的限制。 陈磊:这只能反映OpenAI的To C基本面,To C放缓是必然的也是正常的,ChatGPT出来的时候是现象级应用,大家都会去尝试,基数很大,但群体也会逆向选择。另一方面,不能只看To C,集成在微软的Copilot、Office里的使用基数应该是非常大的。还要看到OpenAI投资了一些下游AI应用企业。OpenAI的技术在这些场景的应用到底是什么状态,还需要更加全面来看。 澎湃科技:OpenAI召开首届AI开发者大会后,AI领域的小公司还有没有机会?...
《讯飞星火:全面超越ChatGPT与GPT-4,打造AI新标杆》
AI医师助手

《讯飞星火:全面超越ChatGPT与GPT-4,打造AI新标杆》

这篇文章主要报道了科大讯飞星火大模型在多个领域的超越表现,包括医疗和GPT-4。通过实测发现,星火大模型在中文能力和多模态任务上表现出色,医生和科技行业的专业能力也得到了提升。此外,科大的技术发展和大模型赋能战略也取得了多项成果。
《讯飞星火:全面超越ChatGPT与GPT-4,带来AI新纪元》
AI医师助手

《讯飞星火:全面超越ChatGPT与GPT-4,带来AI新纪元》

这篇文章主要报道了科大讯飞在1024开发者节上展示了其最新的星火大模型,该模型在多个领域实现了对ChatGPT和GPT-4的超越。讯飞星火大模型V3.0在中文能力、医疗领域的表现尤为突出,还新增了虚拟人格功能。此外,科大讯飞还发布了科技文献大模型、医疗大模型以及与其他企业合作的12个行业大模型。在底层基础设施上,科大讯飞与华为联手发布了基于昇腾生态的“飞星一号”平台。文章指出,讯飞星火大模型的发展围绕着知识、推理和沟通能力,这正是实现认知智能所必需的能力。
多位畅销书作家起诉“ChatGPT”侵犯知识版权新京报2023-07-11 21:01新京报2023-07-11 21:01
AI律师助手

多位畅销书作家起诉“ChatGPT”侵犯知识版权新京报2023-07-11 21:01新京报2023-07-11 21:01

《萨拉·西尔弗曼:一尘不染》(Sarah Silverman: A Speck of Dust,2017)画面。 据美国《洛杉矶时报》《纽约时报》等媒体报道,当地时间上周五,莎拉·西尔弗曼以及另外两位作家理查德·凯德里(Richard Kadrey)和克里斯托弗·戈登(Christopher Golden)在旧金山联邦法院发起了集体诉讼。莎拉·西尔弗曼除了从事演出以外也是一位作家,她于2010年出版了畅销回忆录《尿床者》(暂译,The Bedwetter)。根据法庭文件,这些作家声称这两家科技公司将他们图书的“文本”注入到被称为大型语言模型的生成式人工智能软件中,却并未给予他们任何认可或补偿。每项诉讼要求不到10亿美元的赔偿。 几周之前,畅销书作家莫娜·阿瓦德(Mona Awad)和保罗·特伦布雷(Paul Tremblay)也以类似理由提起图书版权的侵权诉讼。接受这项诉讼的律师约瑟夫·萨维里(Joseph Saveri)和马修·巴特里克(Matthew Butterick)还代表几位视觉艺术家对备受争议的人工智能艺术工具“Stable Diffusion”(动画生成工具)提起诉讼,同时对微软公司的软件“GitHub Copilot”(编程工具)进行集体诉讼。 科幻纪录片《我们需要谈谈》(AI We Need To Talk About A.I.,2020)画面。 OpenAI公司的ChatGPT这类的大型语言模型需要消耗大量的文本,然后这些生成式人工智能开始“自我训练”,以便于使用模仿人类自然的回应方式来回答用户的提示或问题。它们可以编写代码、创作粉丝小说、代拟求职申请信,或者帮助完成学校作业。另外,Meta公司的生成式人工智能语言模型LLaMA(一种语言模型)与ChatGPT有所不同,它不是一个问答系统,而是一个旨在为人工智能领域内的研究人员提供工具的研究工具。然而,这几起诉讼对这类模型接收信息的方式和数据来源提出了控诉。 人工智能模型的资料通常来自于电子图书馆,其中的一部分是合法的,比如Project Gutenberg(数据库),这是一个收集版权已过期的电子书的数据库。另外一些来源常被称为“影子图书馆”,其中充斥着一些读者可以获得的电子书,但通常缺乏作者和出版商的版权许可。诉讼指责Meta和OpenAI公司向其人工智能模型提供了包括来自“影子图书馆”收集的书籍在内的数据,并称这种做法是“公然违法”。 这项诉讼中附有与ChatGPT的对话副本来支持原告的主张,这份对话内容显示,这些人工智能模型能够准确地概括莎拉·西尔弗曼、理查德·凯德里和克里斯托弗·戈登等人所写的书籍,比如ChatGPT可以为西尔弗曼的回忆录《尿床者》、凯德里的畅销书系列“沙人斯利姆系列”(Sandman SlimSeries)以及戈登的超自然惊悚小说《亚拉致命峡谷》(Ararat)等书籍生成摘要。 在这项发起的诉讼中,被视为涉及侵权的几本书籍。 这项诉讼还引用了公开发表的评论,该评论者声称收集了Meta公司用于“训练”人工智能的图书数据,并确认其中包括了知名影子图书馆“Bibliotik”的全部图书,总共超过19万6640本的侵权图书。几位原告也指控OpenAI公司向其ChatGPT软件提供了未经授权的图书来“获得丰厚的利润”。据《洛杉矶时报》的报道,生成式人工智能引发的担忧也扩散到了音乐、银行、电影业在内的其他行业,比如美国编剧工会发起罢工的理由之一,就是好莱坞的制作工作室正在使用人工智能软件取代编剧和演员的工作。 参考资料: (1)Sarah Silverman Sues OpenAI and Meta Over Copyright Infringement https://www.nytimes.com/2023/07/10/arts/sarah-silverman-lawsuit-openai-meta.html (2)Sarah Silverman and other...
措施恐惧症:人工智能时代的挑战与机遇
AI律师助手

措施恐惧症:人工智能时代的挑战与机遇

这篇文章探讨了人工智能领域中一种被称为FOMO(措施恐惧症,Fear of Missing Out)的现象,并分析了生成式人工智能的应用现状和发展潜力。文章提到,尽管已有不少公司和企业开始采用人工智能技术,但仍存在许多潜在问题和挑战,如技术瓶颈、文化和管理障碍等。同时,生成式人工智能的应用领域正在逐渐扩大,有望在未来颠覆商业模式和创新。
AI生成的未来:开源模型与商业应用的悖论
AI情感助手

AI生成的未来:开源模型与商业应用的悖论

本文主要介绍了人工智能领域的新动态和发展趋势。一方面,各大公司都在积极布局生成式AI,如Meta推出的编程AI模型Code Llama,以及斯坦福大学和Google研究的AI小镇项目。另一方面,生成式AI领域的商业化产品面临困境,如ChatGPT的流量连续两个月下降。然而,这种现象并不意外,因为在当前阶段,聊天机器人、搜索引擎并非最适合生成式AI的终端形态。最后,本文提到了斯坦福AI小镇的开源项目,以及智元科技和人形机器人「远征A1」的发展。
大模型赋能:中国科技企业与英伟达的芯片合作
AI情感助手

大模型赋能:中国科技企业与英伟达的芯片合作

中国科技巨头向英伟达订购50亿美元芯片,反映出我国AI产业快速发展趋势。然而,AI云服务需求仅得到部分满足,短期内在GPU市场面临紧缺。同时,国内外多家公司发布大模型基准测试工具和解决方案,显示出AI技术在各个领域的广泛应用。然而,也需关注到国内外政策对AI投资的影响,以及安全问题在AI领域的重要性。