文章主题:讯飞星火大模型, 开放式知识问答, 逻辑推理, 数学能力
作者 | 程茜
编辑 | 漠影
近日,讯飞星火大模型V1.5震撼亮相,引领了智能问答领域的新潮流。该版本升级了开放式知识问答、逻辑推理以及数学能力等核心技能,并推出了全新的星火APP,支持纯语音及多模态输入。此外,科大讯飞还向我们展示了星火大模型在办公、教育、医疗和工业等众多领域的应用成果,再次证明了其强大的实力和广阔的发展前景。
星火大模型在文本生成、语言理解、知识问答、逻辑推理以及数学能力和代码能力方面均取得了显著的提升。尤其是知识问答能力的提升最为显著,达到了24%,这表明该模型在理解和回答复杂问题方面的表现得到了明显的提高。同时,逻辑推理能力也取得了10%的进步,这意味着该模型能够更加准确地分析和推导出正确的结论。这些成果证明了星火大模型在不断改进和完善,为人们提供更好的智能服务提供了有力的支持。
事实上,星火大模型与教育和办公场景的融合已经取得了显著的成果。在5月6日,科大讯飞正式发布了其星火大模型,并将其成功集成到了教育和办公环境中。科大讯飞总裁吴晓如在活动现场透露,从今年6月1日至8日期间,其AI学习机的激活数量同比增长了214%,而搭载了语篇规整和一键成稿等功能的讯飞办公本和讯飞听见的使用者激活量分别提升了176%和205%。这些数据充分展示了星火大模型在教育和办公场景中的强大影响力,以及其在提高用户工作效率和学习效果方面的显著作用。
可以看出,新的用户体验正在极大激活用户的需求。
在6月9日的全国高考最后一天,我们有幸见证到了讯飞研究院院长刘聪现场展示星火大模型在高考场景中的卓越表现。他运用此模型解答了数学函数题目和语文阅读理解题目,展现出了清晰且具有逻辑性的分析过程,令人印象深刻。
在星火大模型发布的倒计时之际,科大讯飞董事长刘庆峰已经提前透露了三次升级的时间表,并计划在10月底全面赶超ChatGPT。这在国内大模型制造商中是独一无二的,显示出其对于长期发展道路的清晰规划。目前,正是这个升级过程的关键时刻。刘庆峰强调,实现长期主义的理想需要一个个阶段的里程碑来逐步达成。
一、三大综合能力升级,用户能定制200 “私人”助手
讯飞星火大模型V1.5在用户需求最高的开放式知识问答、逻辑推理以及数学能力方面,进行了全面的升级优化。
同时,讯飞发布了星火APP和小程序,支持全语音对话、多模态输入等,同步上线了“星火助手创作中心”,用户可以基于自己的需求打造大大小小的智能助手。
用户想要从0到1构建助手需要在后台输入相应的助手指令。如果想丰富文本的内容,用户还可以在助手指令里添加关键词,如“欢快幽默”、“引经据典”等。并且新生成的助手也会同步到PC、移动设备上。
目前,星火助手创作中心已经发布200多个助手。
1、开放式知识问答,文本内容能引经据典、补充分析见解
当下大模型在解决新知识更新上较为困难,回答一些事实类问题时容易发生张冠李戴的现象。而大模型可以基于其强大的语言理解能力,深度理解用户需求后,从实时的数据库、信息库中进行知识提取,再通过概括表达能力将答案提供给用户,从而保证结果的及时性和准确性。
吴晓如谈道,其实开放式知识问答最终拼的还是大模型的自然语言理解能力。
6月9日是全国高考最后一天,借这一契机,讯飞研究院院长现场向星火大模型提问,“2023年全国高考甲卷的作文题是什么?并分析一下它传递的意义”。星火大模型不仅给出了作文题目,还描述出题面背后想传递的内容。
在长文本生成能力上,星火大模型也实现进一步提升。当问到“高考刚刚结束,孩子即将开始新的起点,请给你的孩子写一封暖心的信”,星火生成的文本框架很清晰,并且还引经据典使得文章更加丰富。
还有关于通用人工智能产业的情况,“中国关于通用人工智能有什么新动向,并分析一下中国的基础和优势”。星火罗列了国内新动向后,还进一步分析了人才、数据、政策等方面的优势,最后还补充了当下面临的挑战。刘聪说,星火可以自己检索到今年6月发生的新信息,并从这些内容中抽取出共性知识,补充见解。
在司法领域,星火大模型还能帮助用户生成起诉状。当问到“我有个朋友叫张三,他在2023年1月5日晚上被李明家的狗咬伤了,前期治疗花了2000元,耽误上班损失了大概1500元。张三想让李明赔偿他的全部损失,但是好几次沟通无果,想要起诉他,请列出需要准备的材料”,星火生成了包括沟通记录、证人证言等材料,再次提问它还能直接生成起诉状。
大模型开放式问答展现了更强大的想象力,再加上其自然语言处理能力和专业知识库相融合,能为各个行业提供助力。
2、逻辑推理和数学能力升级,综合应用数学方法解答
大模型基于思维链的场景式逻辑推理和数学十分紧密,因此,逻辑推理能力提升也是数学能力提升的基础。
当问到“农夫需要带着狼、羊、菜一起过河,只有农夫能够划船,而且船比较小,农夫每次只能带一样东西过河,如果农夫不在,羊会偷吃菜,狼会吃羊,请设计一种方法,让农夫能够安全地将所有东西带过河”,星火不仅能给出方案,还会解释每一步骤的用意。
经典谜题星火也能轻松应对,如“一条船上有三个人,但是有两个父亲、两个儿子,请问是怎么回事?”
还有考察排列组合和空间想象力的初中数学题,当问到“六条直线相交,最多能有多少个交点?”星火会列出思考的过程,找到最终答案。
数学问题中,如三角函数等很多会包含大量的图片等,无法通过语音或者文字输入。讯飞星火APP基于OCR能力实现了图片输入。
例如一道考察多项式的数学问题,基于讯飞APP中的数学解题助手,就能给出完整的解题步骤。
星火大模型不仅能理清一些很绕的逻辑现象,还能综合应用方程、配列组合等数学方法来解决问题。
值得一提的是,此前搜狐科技选取了百度文心一言、阿里通义千问、讯飞星火大模型、360智脑、ChatGPT对2023高考上海数学卷前10道填空题进行了测试。结果显示,星火大模型的正确率最高为50%。
▲五大AI大模型高考数学题回答情况(图源:搜狐科技)
3、多轮对话能力升级,化身面试官、儿童作家
一般情况下,人和人协同完成任务需要多次交互,很少能通过一次性交互就完成复杂的任务,在人机交互中同样如此。
星火APP中的“讯飞智聘面试官”可以模拟面试现场,支持全语音交互。刚毕业的大学生如果没有面试经验,可进行模拟演练。例如说“我想面试产品经理的岗位”,助手就会询问用户此前的工作经历等,最后还会基于回答内容给出整体评价和建议。
还有一个更有趣的助手是故事创作助手,当用户输入一个标题就能生成一篇故事,如“小兔子去黄山旅游探险的故事”。如果小朋友对故事不满意,还可以补充需求,比如增加“小兔子遇到了一个伙伴皮卡丘”。
这样的话,星火大模型生成的故事就可以基于用户的需求不断丰富更新。
还有一个帮助用户生成故事的助手叫故事对话共创,用户输入标题后,星火小助手不会生成整篇文章,而是先给出一段话引入,用户再输入下一步的故事走向,以此类推去续写故事。
二、教育、办公场景设备再升级,工业、医疗服务次数大幅提升
在教育行业,讯飞此前发布的星火AI口语助手升级为了星火语伴APP,使得用户使用更为便捷。该APP面向的是中小学、大学生、商务人士等所有英语学习爱好者,除一般性交流外,还能发现用户发音、语法的问题,帮助纠错,支持语音、图片的翻译软件。
如果遇到不会用英语回复的问题,用户可以切换到中文,并且中英文混合输入星火语伴APP也能准确识别,同时,用户还可以在设置界面调整语伴的难度。
为了打造真人面对面的对话场景,星火语伴还支持虚拟人对话。
办公领域下,星火认知大模型搭载于讯飞听见智慧屏,该设备的拾音范围能达到10米,还能一线接入声音、视频等。录音完成后讯飞听见智慧屏支持快速转写录音,还能基于大模型的能力整理成稿,并生成会议纪要。
同时,用户想要离开办公环境,还能一键扫码将记录的内容转到手机上,同时自动生成工作待办、自定义关键词、提炼核心内容等,满足不同领域、不同风格的文本创作需求。
面向B端场景,星火大模型已经在工业、医疗行业实现应用。
此前,科大讯飞发布了羚羊工业互联网平台,贯穿工业领域企业的研产供销服管场景。工业场景的企业服务中,需要人工来对接企业需求的服务供应,但依靠人工所完成的需求和供应对接量十分有限。当下,AI 大数据的精准理解、分析、推荐在工业场景的融合应用,使得需求和供应的对接效率大幅提升。目前,羚羊平台用户总量达到32.2万人次,平台服务企业次数超72.1万次。
基于星火大模型,讯飞推出羚机一动,能将产业的商机、政策等推荐给用户。
例如问道“我们是一个家电生产企业,车间有大小设备20多台,正在寻求能进一步节能降耗的解决方案”,羚机一动会根据产业特点,为用户提出建议,同时给出一些解决方案案例、资源以及相应的技术专家。
刘聪称,基于星火大模型能力,讯飞开发了面向企业的产品介绍、新闻撰写等工具,下一步,讯飞也将会将这一工具的能力开放出来。
星火大模型可以和工业领域的知识结合企业,形成工业大脑,再和企业的知识库结合形成企业的知识大脑,企业的生产、研发、服务、营销各个环节,可以和企业大脑进行交互,更加精准的定位问题,找到针对性的解决方案。
此外,在车间场景中,一些新员工如果遇到设备故障,也可以询问羚机一动,“在总装车间进行整机调试的过程中,出现了触摸屏不灵的问题,有哪些原因导致”。当用户将周边工作环境的信息输入,羚机一动也会再次分析并给出建议。之后,羚机一动还会为用户提供触摸屏替代品建议,先从公司内部库存检索,然后再去外部寻找合适的触摸屏,实现了完成了故障查询、购买建议、测试验证的全流程
在医疗行业里,科大讯飞的智医助理可以应用到诊前导医、导诊,诊中帮助医生防止误诊、漏诊,诊后康复环节。吴晓如透露,智医助理系统已经应用到全国31个省,完成6.29亿次辅助诊断,修正了127份医生的首次诊断。并且智医助理和语音外呼相结合,已经完成了11亿次电话随访。
一般情况下,患者出院后服务的延续性会缺失,绝大部分患者面临出院即托管,医患人数不匹配使得医生不能对患者用药、饮食安全及时指导。吴晓如举了一个例子,脑卒中患者中有12%的人出院后30天内会再次出院,而这部分人中50%的患者其实可以通过诊后康复管理避免再次入院。
基于上述现象,星火大模型可以对病案进行全过程分析快速生成康复计划,同时这份计划会实时同步到医生、患者面前。
这一诊后管理平台的医生端界面有患者入院、出院、会诊单、检验记录、住院病历等,会基于这些数据为用户生成包含医生提醒、用药指导、康复运动、饮食建议等六个维度90天的康复计划。
经医生审核通过后,这份计划会同步到患者手机中,同时患者复查后上传检查单,医生端的数据也会同步变化,基于患者身体数据的变化调整健康管理计划,形成了复诊、随访,跟踪闭环患者康复情况的过程。
除了康复计划制定外,智医助理还能回答患者更加开放性的问题,同样基于患者的病历给出答案,如患者发烧吃退烧药能否与长期服用药物一起服用。
吴晓如称,康复管理医生诊后效果康复效率提升10倍以上,即时的管理使得患者对医生的依存性提升2.4倍,由于患者得到即时医院随访,问题及时回应、指导,其对医院的满意度从近90%提升到98%以上。
三、开放大模型七大能力、200 助手开发接口
星火大模型发布初期,科大讯飞就要联合行业合作伙伴共建大模型“星火”生态。刘庆峰透露,目前讯飞人工智能开放平台上的开发团队已经超过400万家。
他宣布要开放星火大模型的开发接口,包括七大维度能力和200个星火小助手,并且支持多端接入快速集成,对于数据安全有更高要求的企业还支持私有化部署。
5月6日发布星火大模型时,科大讯飞就划定了6月9日升级到V1.5,今年1024对标ChatGPT,实现中文超越、英文相当的时间表。刘庆峰谈道,这是因为科大讯飞在通用人工智能研究中,每一个关键模块都坚持自主研发,其“1 3 1”的创新体系,包含自主研发的安全可控大模型训练基座、软硬一体化的高性能大模型推理平台,以及数据、建模和强化学习等关键模块。
这也是科大讯飞能给出明确时间迭代节奏的关键。
未来,科大讯飞将在类脑智能、神经网络大模型的新算法和博弈智能等领域布局,探索更多的潜在路径,以前这些领域的交叉研究。
在人才培养方面,科大讯飞已经与首批全国22所重点高校联手,开展星火大模型场景创新赛、讯飞高校AI星火营,让更多学生参与到通用人工智能产业中来。
结语:围绕技术、应用、生态,“星火”再升级
点点“星火”,已成燎原之势。讯飞星火大模型与行业应用的结合愈加紧密,其能力展现的也更加充分,不仅包括用户感知度更高的教育、办公等场景的设备,还有工业、医疗行业的应用升级。
有AI国家队之称的科大讯飞,凭借其技术积累为大模型研发划定了时间表,其以大模型为核心的技术研发、应用落地、生态建设蓝图正徐徐展开。技术的发展并不难一蹴而就,需要综合考虑多方因素,包括技术研发进展、应用落地情况等,但科大讯飞基于其自主研发的大模型底座,以及在数据安全、建模、强化学习实现安全可控,都使得其在大模型浪潮中更加从容。
随着星火大模型的不断升级,星火大模型正在赶超ChatGPT的道路上勇往直前。
AI时代,拥有个人微信机器人AI助手!AI时代不落人后!
免费ChatGPT问答,办公、写作、生活好得力助手!
搜索微信号aigc666aigc999或上边扫码,即可拥有个人AI助手!