文章主题:关键词: 科大讯飞, AI开放平台, 商业变现, 开发者节
杨净 萧箫 发自 凹非寺
量子位 报道 | 公众号 QbitAI企业拥有265万开发者是一种什么体验?
是在最新财报上已经商业变现,开放平台营收增速高达131%?
是连续5年在合肥振臂一呼,全球就迅速响应?
当然,这还不是全部。
在这一次开发者节上,科大讯飞董事长刘庆峰向全球开发者,摊开过去一年答卷。
科大讯飞AI开放平台,至今已有441项核心技术;每个月平均新增9万开发者团队,其中工业应用占比达到60%;医疗AI系统一年给出97万份修正诊疗结果……而像“遇强则强,遇弱则弱”的围棋机器人、1分钟定制专属AI数字人、3秒判断声音画像等这些技术成果更是成为展区的爆款!
第五届全球开发者节究竟有何看头?现在就带你一文看尽。
科大讯飞最新技术成绩
今年1024开发者节上,最先登场的科大讯飞董事长刘庆峰披露了取得的一系列最新成绩。
其一,AI健康咨询准确率超过绝大部分全科医生。
在你就诊时,健康咨询AI系统会根据你的相关健康状况,推荐你去对应医院找专家就诊。据刘庆峰介绍,目前科大讯飞的健康咨询AI系统,已经超过96.4%的通过国家考试的全科医生。
其二,医疗AI系统一年给出97万份修正诊疗结果。
🌟 科大讯飞的AI医疗神器,重塑基层诊疗新纪元!在过去一年里,它犹如智慧灯塔,照亮了97万份安徽基层医生的诊疗之路,精准修正初诊结果,提升诊断准确度至惊人的80分!系统的强大实力,让整体准确率傲视群雄,高达97%以上。🌟借助这股科技力量,安徽基层医疗服务水平实现了飞跃式增长,未来可期!🌍
其三,AI开放平台核心技术达到441项。
🌟【科大讯飞:智能语音领域的革新者】🌟成立于2010年的科大讯飞,以其前瞻性的开放策略开启了智能语音的新篇章——🌟【科大讯飞开放平台】🌟,集成了诸如 pytts(语音合成)、voice_search(语音搜索)和nlp(自然语言处理)等强大技术,引领行业潮流。当时的它,以创新的姿态成为业界首个全面开放的智能语音平台,为后来的发展奠定了坚实基础。时光荏苒,十年磨一剑。科大讯飞的AI实力犹如璀璨星河般壮大——现在,他们已拥有惊人的441项核心AI能力与解决方案,这不仅是技术的积累,更是智慧的结晶!从最初的3项核心技术出发,它一路迭代,不断突破,展现出强大的技术研发和创新能力。作为人工智能领域的领头羊,科大讯飞持续推动着语音技术的进步,让智能触达更广泛。无论是教育、医疗、交通还是家居,都能看到他们AI方案的身影,为生活带来便捷与智能化体验。
其四,1句话就能语音合成1个人的声音。
🌟🚀科大讯飞引领人工智能前沿,🔥专注核心技术研发!🚀无需海量数据与繁琐标签,我们的创新无监督训练技术使AI能高效学习,声音拟人化已炉火纯青。只需一句,就能让机器模仿出独一无二的音色,为世界带来更自然、精准的声音体验。🌍🏆每一项突破,都是对智能未来的深情献礼!🏆🌍
在小语种识别上,科大讯飞提出的统一空间表达的半监督语音识别技术,使得研究人员只用100个小时的有监督语音和无标签文本数据训练,就能达到之前10000小时有监督语音数据训练的效果。
其五,用AI让学生无效作业时间平均降低50%。
据刘庆峰介绍,科大讯飞在安徽合肥率先用人工智能助力“双减”,利用AI复杂系统,结合OCR自动评分、语音推理等技术,分析学生的学习情况,对过程性作业考试数据进行评价,精准给予指导,将孩子的无效作业时间平均降低了50%。
这一系列亮眼的成绩之上,刘庆峰公开了科大讯飞AI开放平台2.0战略,共包括6大措施:
刘庆峰表示,行业关键问题,需要各行业的人共同努力:
开发者可以不了解AI技术,只要有灵感、创意和想象力,就可以加入到AI开放平台2.0来。
只有生态的繁荣,才能决定AI的未来。
AI开放平台2.0升级
接下来,基于过去5年的开发者生态积累,科大讯飞总裁吴晓如提出1024计划5.0——用系统性创新,打造人工智能产业新生态。
当中最重要的部分,就是AI开放平台2.0的发布。
与过去1.0相比,简单来说,就是二维到三维的升级。
🌟💡以前的创新路径往往是单向为创业者输送工具,然而,隨著AI逐步渗透各行各业,挑战日益升级,我们需要转向全面且结构化的解决方案。🚀
既然如此,就需要与行业龙头打造基线底座模型,再与上下游合作伙伴展开合作,形成完整的行业方案。
以智慧农业为例。
🌟🚀智慧农业新篇章!💼🌱讯飞携手中国农大,引领创新风暴!💡联手打造精准预测与智能灌溉的未来典范——生产模型与施肥策略,全面升级农业科技!📚💡这些先进的解决方案,通过传感器网络传输至产业链伙伴,共同为现代农业赋能。🤝Industry伙伴们,准备好迎接这场技术革新盛宴吧!🌐🌱#讯飞合作# #智慧农业# #创新前行
目前,科大讯飞首次推出18个行业,并表示将每年投入5亿研发基金,服务100万开发者。
既然如此,那该如何推动开放平台2.0的战略?有四大维度。
1、与高校合作开设人工智能专业,目前已经开发339门课程,培养超60万开发者。
2、与合作伙伴筹建智能语音创新中心,为每个行业制定标准测试环境。
🌟🏆顶尖赛事闪亮登场,引领行业风向标!🚀🔥1024开发者节盛况空前,集结了105个多元化的赛道,涵盖了创新应用、科研探索与公益实践的广阔天地。💡数千精英队伍跃动其中,热情如火,一展技术实力与梦想追求。👩💻🏆这是科技力量的狂欢,也是行业翘楚崭露头角的舞台。🌟赛事不仅是选拔行业领军人物的竞技场,更是知识与智慧碰撞、公益与创新融合的熔炉。🏆通过这样的平台,我们见证了无数创新思维的火花,也推动了技术进步与社会价值的共同提升。🌍欲知更多详情,敬请关注我们的官方网站,获取最新赛事动态和参赛指南。🌐别忘了,下一次1024开发者节,我们不见不散!🌟#1024开发者节#行业标杆#技术创新
3、孵化创新企业,提供优质资源。除了中国声谷之外,讯飞在全国共有十余家双创基地。
四大技术方向突破
接着,科大讯飞高级副总裁、AI研究院院长胡国平,就分享了四大技术方向的突破。
嗯,实际上就是去年发布的“AI科技树”,今年已然开出一些果来。
第一项,端到端建模技术。
这项技术将前端多路信号直接同步输入到后端声学模块,来实现更精细的建模,可实现复杂(比如嘈杂环境)场景下的一体化语音识别、语音翻译等。
在语音识别上,以卖场为例,这项技术成功将只有35%的语音识别准确率,提升到了88%;同时语音唤醒的成功率,也成功从40%提升到了90%。
在语音翻译上,科大讯飞还成功在IWSLT国际口语机器翻译大赛的同传任务上,包揽了三个赛道的冠军。
第二项,无监督训练技术。
为了降低对语音合成数据规模的要求,科大讯飞提出了听感量化编码,充分借助语音识别数据来合成音库,成功实现了多人混合模型训练。
在小语种识别上,提出的统一空间表达的半监督语音识别技术,使得只用100个小时的有监督语音和无标签文本数据,就能达到之前10000小时有监督语音数据训练的效果。
在语音合成上,利用无监督训练甚至实现了发音内容、情感和音色分别可控的效果,例如1句话合成语音、方言自由切换等等……
注意,不止是普通的四川和合肥话,科大讯飞甚至开放了6种船新的少数民族语种:
第三,多模态融合技术。
在人机交互上,现在甚至已经不需要唤醒词了,机器会看到你的嘴型,从而自动判断你“是否在对它说话”,并自动做出应答,误唤醒率降低到0.01%。
在复杂文档(例如试卷)识别上,多模态技术会结合OCR、手写数学公式识别等技术,将一张纸上的所有信息准确识别出来,已经实现教辅作业批改准确率从92%进化到98%的效果。
第四,外部知识融入技术。
我们都知道,做语音交互的AI总是有点“呆”,这是因为它们虽然学习了不少技术知识和新科技,但对人类的一些常识掌握得却还不够深。
为了提升AI在这方面的“人情味”,科大讯飞特意将人类的常识和知识整理成一个事理图谱。
像儿童玩具交互场景中,就包括“抢玩具”“收拾玩具”这样具体的动作,让它知道人类平时会做、会说的事情。
这样,在面对小朋友乱抛玩具时,AI就能从容说出“来收拾一下玩具”这样的语句,而不是只会帮小朋友一遍遍亲自收拾玩具。
又例如电子病历场景下,运用外部知识融入技术也能让AI学习到人类医生看病的经验,最终将罕见病诊断率从87%提升到了93%,整体病情判断准确率从92%提升到了95%。
两大平台+生态助力产业
最后面向合作伙伴,科大讯飞交出自身探索成果——
两大平台+两大生态。
首先是企业数字化平台的发布和虚拟人交互平台的开放。
简单来说,这个企业数字化平台其实是原来的AI开放平台基础上,配置了RPA引擎,从而具有智能化、自动化(RPA)、低代码、流程管理等特性。
以智能招聘为例,这位“虚拟小助理”可以在前期分发信息、电话通知等重复性工作上替代HR的工作,据称流程至少提效10倍。
除了企业数字化平台的发布以外,还开放了虚拟人交互平台。
值得一提的是,在传统意义上开放给开发者外,还接受声音、形象提供者提供相应的数据,以应用于各类应用场景。
实际上,在过去一年里,这个交互平台已经在400+个企业客户进行试点,应用在了新闻生产、企业客服、泛娱乐营销等场景,新增54个形象,汇集了4988份声音。
接着,就是科大讯飞过去一年中成绩最显著的两大生态:教育+城市。
在教育生态上,科大讯飞今年提出了三大计划,包括教育科研基金资助计划,即在未来三年投入1个亿的科研基金,开展前沿的理论与应用的研究;
此外合作伙伴联合创新计划,设立创新孵化投资基金,每年投入1亿元,技术上提供300人以上的技术和市场领域的专家服务;
还有教学教研联盟的公益计划,预计新增建设10个区域联合教研机构、100所名校联盟新增合作校,推动内容共创平台新增骨干教研员1万名。
在城市生态上,据科大讯飞高级副总裁张友国表示,科大讯飞预计在2025年的智慧城市中,实现一年销售收入150亿,在“十四五”期间实现约500亿收入,其中预计60%(约300亿)的收入,科大讯飞都会分享给生态合作伙伴。
人工智能的未来:由表及里的生态
一天发布会下来,听到最多的一个关键词就是生态。
随着浪潮向前,人工智能不再像此前那般是一个触不可及的概念,而是真正普惠于民、用之于民的全民技术。
“帮助每个人、陪伴每个人、更懂每个人”,这是科大讯飞所描述的AI未来。
而预见未来最好的方式,就是共创未来。
去年这个时候,刘庆峰在演讲的最后提到,唯有生态,才能生生不息。
今年开发者节上,“生态”的味道更加明晰,从技术、到产业,再到开发者从内到外全面渗透。
作为一家上市13年的老牌企业,正在用这种方式去完成人工智能产业的全面盛放。
One More Thing
对了,在本次开发者节上,还有其他意想不到的亮点。
比如,安徽人余承东回到家乡,在父老乡亲面前“带货”。(手动狗头)
— 完 —
量子位 QbitAI · 头条号签约
关注我们,第一时间获知前沿科技动态
AI时代,掌握AI大模型第一手资讯!AI时代不落人后!
免费ChatGPT问答,办公、写作、生活好得力助手!
扫码右边公众号,驾驭AI生产力!