AIGC文生图Midjourney提示词详解:老爷爷也能零基础完美AI绘图
AI助手资讯

AIGC文生图Midjourney提示词详解:老爷爷也能零基础完美AI绘图

第二章:Midjourney提示词详解 本章知识点: 一、能让Midjourney听明白的提示词如何描述 二、找到好的提示词的三个方法 三、写好提示词前要会选词 四、指定艺术风格与艺术媒介的重要性 假设你是一个零基础AI绘图的初学者,你没有系统的学习过美术专业,你也不是计算机相关专业毕业的,你甚至是一个电脑小白,即使是这样的情况下,只要你认真的学习本章节内容,你也可以完美出图。这就是AI工具的魅力。 使用AIGC出图,你把自己假设成一个霸道总裁,Midjourney就是一个毕业于清华美术学院的举世无双高材生,她通晓中西方所有美术流派的所有技艺,现在她为你打工。所以你只要把你的工作需求,工作目标清楚完整的告诉她,她就可以完成你所有在设计方面的要求,而提示词与参数就是你提出的工作目标与要求, 所以,这个世界上目前没有Midjourney画不出来,如果她画的不好,那一定是你的指令给出的不清楚,目标设定的不合理。所以我们一直说AI的上限取决于我们提出问题的能力。 所以,本章内容就是学习如何写出好的提示词。 1、提示词是一段简短的文本短语,MJ 机器人会对其进行理解,并生成图像。MJ 机器人会将提示中的单词和短语分解为更小的部分(称为标记),将这些标记与Midjourney庞大到无与伦比的训练数据进行比较,然后用于生成图像。精心设计的提示词就可生成创意独特且令人兴奋的图像。 2、MJ基础提示词如何理解? 基础提示词可以是简单的单词、短语或表情符号😊。 提示词中的单词与短语,大家都能理解,这里重点说下表情符号😊,如果有时候你出张带有人物表情的图,你不太好明确描述表情的细节或者是状态,这个时候,可以找相应的表情符号来让MJ机器人来参考。 下图的提示词就只发了一个笑脸的符号。 特别说明:这个表情符号要使用MJ里边的表情包,就在操作界面的右下角,如果你从微信里边复制一个表情符号过去,就存在不能被MJ很好理解的情况。 3、高级提示词 更高级更能出好图的提示词,一般都包括一个或多个图像 URL(垫图)、多个文本短语以及一个或多个参数。 如果自己一下不太好描述提示词,这里有三个方法给初学者 垫 图 可以先去图库找张符合自己需求的样图,让Mj参考这个图去画。 Image Prompts(图像链接) 可以将图像 URL 添加到提示词中以影响最终结果的样式和内容。图像 URL也就是图像的链接地址要放在提示词的前面。 这个知识点很重要,在平时出图中会被高频率使用到,它可以提取一张图像的风格、颜色、构图等特征,生成类似的图像,尤其是在制作风格化头像、生成  3D 图标等设计素材上用途广泛。请注意看下面的操作示范: 在提示词中添加一个图片链接,我们一般称之为“垫图”,就是有时候你看到一张图的风格特别好看,她完全长到了你的审美点上,你想画出同类型的图像,甚至你想画出图和这个样图保持高度的类似,这个时候你就需要垫图来实现。 比如,我特别喜欢这个图片的风格与构图,我想出一张类似的图片。 首先我们要获取这张样图的URL,也就是 链接地址。 就简单粗暴的,直接把样图拖拽进MJ 拖进MJ回车上传,点击图片使用浏览器打开图片,获取到图片的URL,也就是链接地址。 复制样图的链接地址,像往常一样开始输入/imagine 出现提示框后,右键单击并粘贴提示框中的链接,链接地址后面在加上补充的关键词+参数。 垫图后要注意使用图像权重命令 “ –iw  ”来控制样图对新生成图片的影响。 –iw的参数值范围从1—3。iw后面的数值越高,新生成的图片和样图的相似度就越接近。 反向调理 虽然已经了解了提示词的使用逻辑,但还是有些手残,不能写出让自己有自信的提示词,我们还可以找到自己满意的样图,丢给MJ,让MJ自己反向倒推出这张图片的提示词与参数,我们在参考她自己推理出的提示词,进行局部调整,或者学习提示词的构成 这次我们要使用到一个命令:describe...
人手一个AI健康助手!大模型时代的搜索引擎「蜕变」
AI医师助手

人手一个AI健康助手!大模型时代的搜索引擎「蜕变」

(头图由AI工具生成) 作者 | 三北编辑 | 漠影 智东西12月27日报道,今年9月,国外一名身患怪病的男孩三年求医17名医生无果,却因被ChatGPT正确诊出“脊髓栓系综合征”而成功获救。这让人们第一次直观感受到大模型在健康信息服务领域的巨大潜力。 现在,这种潜力正在被科技公司们转化为端到端的闭环产品。一些科技公司面向医疗机构客户开放了大模型服务,也有团队开源了医疗大模型群,但要说广大用户最直接可感的,还是智能搜索引擎夸克App近期悄然上线了一款“夸克健康助手”。 日前,夸克进行了健康搜索的全面升级,用户在部分搜索结果中会得到由“夸克健康助手”提供的AIGC内容。据悉,在夸克搜索健康信息的正确率超过90%,处在行业第一梯队。 ▲在夸克App调用夸克AI健康助手 首次体验后,用户便可将夸克健康助手添加到App首页,以便随时调用。 ▲将夸克AI健康助手添加到夸克App首页 据夸克相关负责人称,夸克自研大模型已经凭486分的高分通过了临床执业医师资格考试,同时在健康内容上的幻觉率已经降低至5%以内,达到远优于同行的水平。 自年初ChatGPT爆火以来,微软、谷歌等科技巨头纷纷推了出AI版搜索引擎,但面对专业知识要求更高的健康信息服务领域,各路玩家或保持观望或小范围试水。作为2018年就明确了智能搜索引擎定位的新锐选手,夸克率先在健康领域迈出了革新搜索的第一步。 夸克自研大模型在搜索的实际落地效果如何?背后有什么样的技术挑战和行业真相?通过深扒夸克健康大模型应用,本文对此进行了深入探讨。 一、实测AI健康助手:简单对话,多维诊断 打开夸克App,虽然首页没有发生明显变化,但搜索结果呈现已经被夸克大模型悄然改变。 如下图所示,当智东西输入“咳嗽检查”这一问题,搜索结果中出现了AIGC内容和夸克健康助手的入口。用户可以先简单的了解病症信息,然后在根据自己的身体情况进行选择和对话。 点击进入夸克健康助手,页面变成一个对话框形式。当智东西换一个问题:“经常口腔溃疡是什么原因”,夸克健康助手从非病理因素和病理因素给出了问题的答复。或许是考虑到回答较含糊,夸克健康助手进一步给出了一个卡片选项,使我可以补充症状,从而获取更精准的答案。 在我提供了补充症状之后,夸克健康助手果然给出了更聚焦的治疗建议,并给出主要原因分析、科室就医建议、如何进一步确诊等一系列问题的答案。 当智东西问到“家里老人刚做完宫颈手术,有什么吃食建议?”时,夸克健康助手给出了针对性的饮食建议。当涉及偏门的问题,比如“有人说鱼是发物,也是可以吃的吗?”,夸克健康助手也能根据跨中西医的知识,给出明确的分析判断:“可以适量食用”。 夸克健康助手的一大特点是病情病例描述具体,而不是泛泛而谈,因此具有更强的参考性。 比如当智东西问到“我胳膊肘处有小块红色点群状胎记,不太光滑,有一些充血,可能是什么疾病?”,夸克健康助手立马给出了血管瘤、鲜红斑痣、草莓状毛细血管瘤等几种可能。 通过“质软可被压缩、“菜花状”等描述,加上超链接中的图片,血管瘤的可能性看起来更大。通过夸克健康助手,我进一步了解到这是一种大概率不会给身体带来危险的良性肿瘤。实际上,这是我家人的真实病例,夸克给出的判断与此前在医院检查所得的结果一致。 再来看看智能筛查功能,比如智东西在搜索引擎中输入“55岁男士经常胳膊麻是怎么回事”,智能筛查卡片弹出并给出了持续时长、发病部位、行为诱因等多个选项。 当选择持续数月、单侧选项之后,夸克则提示我这可能与颈椎病、脑出血、脑血管病有关。点击可能的病状,如点击脑出血板块进入解答链接,只见有首都医科大学的主任医师来为我解答背后的原因。 实际上,这一病例的患者确实在出现手麻症状之后的几个月后突然脑出血,可见这个智能筛查的功能还是比较具有参考性的。 经过试用智东西发现,夸克健康助手在健康问题咨询上基本上没出现答非所问、胡编乱造、上下文不流畅的情形,甚至还比较准确地给出了初诊结果。虽然这种建议不能替代医疗诊断,但有助于帮患者在就医前进行初步自查。 必须承认,夸克健康助手在一些问题回答上偏保守,比如在多则建议后都指出“以上建议仅供参考”,但它作为一款辅助性的健康助手,已经比传统搜索引擎好用了不少。 二、大模型进入专业领域,安全准确是第一道关口 体验完产品应用,我们将目光转向产业和技术。 从通用搜索到健康等专业搜索领域,大模型正在彻底改变搜索引擎的玩法,背后的关键因素是知识准确度的提升。 回顾年初ChatGPT爆火全球以来,先是微软率先将ChatGPT接入了Bing搜索,而后谷歌以及国内的百度、夸克等纷纷将搜索引擎接入大模型,短视频平台抖音近期也传出正在内测AI视频搜索……互联网大厂纷纷抢滩AI搜索赛道。 背后,大模型正在打破传统搜索引擎的技术瓶颈:传统搜索引擎依赖关键词匹配,难以理解上下文;仅调取网上已有内容,内容相关度和质量不足;难以区分真假信息,误导用户等。大模型对搜索的变革在行业已有共识,基于理解、知识、创作、对话、推理等多重能力,将带来更准确、更全面、更交互的信息服务体验。 但与此同时,大模型在知识准确度上表现不足,阻碍其进入更专业的信息服务领域。 以健康领域为例,这是很多人使用搜索引擎的典型场景,却是大模型久攻不下的一座城池。 究其背后原因,还是“幻觉”问题。由于医生无法给患者详细解释每一个医疗健康知识,患者很多知识需求是通过网络获取的。但由于大模型存在幻觉,会捏造信息,很可能给出错误的疾病判断、用药建议,使得患者贻误病情,后果不堪设想。 安全准确是健康信息服务的第一道关口,夸克专门对此进行了攻关。夸克相关负责人称,夸克做了很多健康行业数据建设和知识建设,从而使其知识错误率能降到了5%以下,这才具备了产品推向广大C端市场的底气。 解决大模型应用的问题,首先要先解决知识正确性的问题。为此,夸克建设了大量的医典百科、医典问答的C端用户数据,整理了大量的指南、标准、书籍等一系列数据,并建设了完整的医疗知识图谱,由此大大降低了大模型的幻觉。 值得一提的是,为了确保内容的专业性、正确性和科学性,夸克还成立了健康专家团。一方面其与200多位权威医学专家、60多家全国知名公立三甲医院和40多家医学机构合作,共建大模型内容生态;另一方面,夸克招募了健康大模型精调师,结合用户需求和热门病症,提供最新健康知识。 由此形成的千亿参数级别的夸克自研大模型,助其跨越安全准确第一道关口,进入专业搜索领域。 三、千亿级参数大模型,四个大招变革搜索 根据知名行研机构IDC今年8月发布的报告,在大模型的推动下,2027年全球人工智能IT总投资预计增至4236亿美元,约合3.1万亿元人民币。在这一新蓝海前景下,互联网巨头、科技行业龙头和AI创企几路玩家掀起了声势浩大的「百模大战」。 而随着「百模大战」的焦点演变为大模型产业化落地,夸克这样交叉领域玩家快速走到了聚光灯下。 夸克于11月22日正式公布了全栈自研、千亿级参数的夸克大模型。同时,夸克大模型已登顶C-Eval和CMMLU两大权威榜单,多项性能优于GPT-4,亦在法律、医疗、问答等领域的性能评测中夺冠。 要达成这样的成绩,并非没有挑战。...
AI健康管理师来了
AI医师助手

AI健康管理师来了

今年两会吹响了“人工智能+”千行百业的号角,缘起是生成式人工智能(AIGC)的爆发为众多行业带来了革命性的变革,其中健康管理行业也毫不例外。AIGC技术的应用不仅极大地提升了健康管理的效率和质量,还为健康管理师的工作方式和价值定位带来了根本性的改变。一个全新职业,《AI健康管理师》来了。 我给大家介绍一下,AI+健康管理师是什么。 首先,AIGC技术在数据处理和分析方面的应用,极大地提高了健康管理的效率和准确性。传统的健康管理往往依赖于人工收集和分析大量的健康数据,这不仅耗时耗力,而且容易出错。而AIGC技术能够快速准确地处理和分析大数据,帮助健康管理师迅速掌握患者的健康状况,从而做出更加科学合理的管理决策。例如,通过分析患者的生活习惯、遗传信息和实时健康数据,AIGC可以预测患者患某些疾病的风险,为健康管理师提供科学依据。 其次,AIGC在智能诊断和预测方面的应用,为健康管理师提供了强大的技术支持。通过深度学习和模式识别,AIGC能够在海量的医疗数据中发现疾病的早期迹象,实现早诊断、早治疗。此外,AIGC还能够根据患者的具体情况,预测疾病的发展趋势和治疗效果,为健康管理师制定个性化的治疗方案提供参考。例如,AIGC可以根据患者的基因信息和生活习惯,预测其对某些药物的反应,从而帮助健康管理师选择最合适的治疗方案。 再次,AIGC技术在个性化治疗和用药、健康监测和预防方面的应用,为患者提供了更加精准和高效的健康管理服务。通过对患者健康数据的实时监测和分析,AIGC能够及时发现健康问题并给出预警,帮助健康管理师采取预防措施,避免疾病的发生。同时,AIGC还能根据患者的个体差异,提供个性化的治疗和用药建议,确保治疗方案的有效性和安全性。 最后,AIGC技术还催生了虚拟护理助手的应用,为健康管理师提供了强大的辅助工具。虚拟护理助手能够24小时不间断地为患者提供健康咨询和心理支持,帮助患者更好地管理自己的健康。同时,它还能够协助健康管理师进行日常的健康管理工作,如提醒患者按时服药、记录患者的健康数据等,极大地提高了健康管理的效率。 总之,AIGC技术的应用为健康管理行业带来了深刻的变革,不仅提高了健康管理的效率和质量,还为健康管理师的工作方式和价值定位带来了根本性的改变。随着AIGC技术的不断发展和完善,未来的健康管理将更加智能化、个性化和高效化。 健康管理师们,赶快拥抱AI,重塑自身价值,遇见更好的自己。
ChatGPT手把手教学指南整理,法律人必备
AI律师助手

ChatGPT手把手教学指南整理,法律人必备

进入2023年以来,相信各位律师应该还在被各种ChatGPT的新闻刷新着认知。 比如,ChatGPT高分通过了美国司法考试、有代替人考律师资格证的趋势,国际上最大的律所之一英国老牌“魔术圈”律所安理将人工智能用于法律服务…… 人工智能来势汹汹,在法律界大有取代传统律师的意味。法律从业者们们今年谈论最多的话题之一便是“ChatGPT能不能取代律师”。 当然,经过大半年的讨论跟沉淀,大部分同行都认为:不能。 其实,与其说未来取代律师的是AI,不如说是掌握了AI技术的律师。 技术不可能完全代替人,法律GPT也不可能完全代替律师——因为无论是出庭辩护、还是商业谈判,都离不开律师。但不可否认的是,由于这次“技术扩散”,律师的服务内容、服务方式、服务成本等将发生根本性的转变。 律师如何将ChatGPT为自己所用? 一言以蔽之,AI技术的革新带来的是全新的法律行业人机协同工作模式。 1、法律知识协同 律师行业是典型的专业知识型行业。面对浩如烟海的案例、纷繁复杂的法律,尽管一直在不断汲取养分的路上,但律师的知识储备似乎永远都跟不上客户的需求。 但ChatGPT尤其是法律垂直领域ChatGPT的出现,已经能很好地解决大多数的知识型问题。比如它可以进行法律解析,帮助律师厘清新出台法规对相关行业的影响;还可以在专业领域回答法律问题,协同律师为客户提供更完整的服务方案等等。 2、法律文书协同 AI技术已基本上能生成大部分的法律文本,起诉状、合同、商业文件……鉴于法律文书大多具有标准化、结构化且重复使用率极高的特性,法律人恐怕对此已见怪不怪。 但不止于此。AI技术不仅可以生成文本,还可以对文本进行审查。比如在非诉业务中,它就可以帮助律师审查合同,并对不合理条款进行修改调整。 3、案件管理协同 数据库、案例以及案情分析,这些是律师最关注的核心问题。 律师可以将GPT当做学习的工具——它可以进行案例分析,以知名案例为素材,剖析案件细节和法律适用。 在办案过程中,GPT可以帮律师提供证据关键要素、管理案件进程、辅助分析案情、对案件进行智能预测等。 4、客户服务协同 在客户服务这个模块中,AI技术便是律师的智能副驾、智能客服。 现有的法律GPT已可以生成行业分析报告、定制专业文章,并实时对客户的需求、反馈进行数据分析,从专业上帮助律师增加对目标客户的吸引力、日常维系客户。 想要更好地拥抱这种全新的工作机制?你需要的正是一堂ChatGPT实操课。 11月2/3日晚19:00,智拾网直播间邀请到了北京盈科(沈阳)律师事务所朱岳峰律师,他将从诉讼业务流程、非诉业务流程、律师写作、客户拓展等方面讲解智拾GPT全场景实操演练,助你解锁法律行业人机协同新模式。 扫码报名,0元听课 入群领《10大类100+法律ChatGPT基础提示词》 课程收获 01 跟上人工智能时代步伐,深入了解ChatGPT对律师行业的影响和冲击 02 理解ChatGPT使用思路,全方位上手实操流程及提问技巧 03 熟悉法律行业人机协同工作模式,成为与ChatGPT共存的技术型律师 课程大纲 一、智拾GPT全场景实操演练 1.诉讼业务流程示范 ■ 合同纠纷案例:磋商准备、庭前案件梳理、庭审策略制定、庭后意见撰写 ■ 侵权案例:证据收集、起诉状撰写、开庭辩护、执行建议 2.非诉业务流程示范 ■ 案例1:服务客户审查合同时,修改不合理条款 ■ 案例2:法律培训案例中的企业和个人培训框架设计 3.律师写作案例 ■...
奥特曼:下一代AI模型更聪明,ChatGPT不会有情感,无需害怕超级智能【附生成式AI行业发展前景预测】
AI情感助手

奥特曼:下一代AI模型更聪明,ChatGPT不会有情感,无需害怕超级智能【附生成式AI行业发展前景预测】

原标题:奥特曼:下一代AI模型更聪明,ChatGPT不会有情感,无需害怕超级智能【附生成式AI行业发展前景预测】 图片来源:摄图网 当地时间周三,英伟达向OpenAI交付了全球首台DGXH200超级计算机,而且还是其CEO黄仁勋亲自“送货上门”。相关人士表示,世界上第一台NVIDIADGXH200交付给OpenAI,致力于推进人工智能、计算机和人类发展。随后,OpenAI创始人山姆·奥特曼(Sam Altman)在斯坦福大学进行演讲活动,分享了他对人工智能未来的见解,超过1000名学生排队参加了此次活动。 奥特曼发人深省的演讲为人工智能的未来提供了一个变革性的愿景,强调了人工智能产业的快速发展、对通用人工智能的追求,以及在应对社会挑战的同时利用创新方法的必要性等等。GPT-4之后的下一代人工智能模型将更加强大,表明该领域的发展速度极快。 奥特曼表示,“我们现在可以高度科学地确定,GPT-5将比GPT-4聪明得多,而GPT-6将比GPT-5聪明得多,我们还没有接近这条曲线的顶端”。 奥特曼表示,OpenAI的使命是实现通用人工智能。开源人工智能可能不是实现这一目标的最佳途径。此外,作为一种旨在增强人类能力的工具,没有必要让ChatGPT充满情感。没有必要害怕超级智能的人工智能,因为与未来的模型相比,每个新模型都被认为能力不足,进而推动了持续的改进。 ——AI大模型是一种新的智能计算范式 AIGC全称为AI-Geneated Content,指基于大型预训练模型、生成对抗网络GAN等人工智能技术,通过已有数据寻找规律,并通过适当的泛化能力生成相关内容的技术。 超大规模智能模型,简称大模型,是近年兴起的一种新的人工智能计算范式。和传统AI模型相比,大模型的训练使用了更多的数据,具有更好的泛化性,可以应用到更广泛的下游任务中。按照应用场景划分,AI大模型主要包括语言大模型、视觉大模型和多模态大模型等。业界典型的自然语言大模型有GPT-3、源、悟道和文心等。视觉大模型也已广泛应用于自动驾驶、智能安防、医学影像等领域。基于多模态大模型的以文生图技术也迅速发展,AI内容生成(AI Generated Content,AIGC)已成为下一个AI发展的重点领域。 ——全球生成式AI行业独角兽公司 目前,在生成式AI这条细分赛道,全球已经诞生了13家独角兽公司(估值达到10亿美元以上),其中OpenAI的估值及融资额排名第一,其估值将达到800亿美元。2023年以来新增的5家AI独角兽中,包括Cohere和Runway两家新晋生成式AI独角兽。这13家生成式AI公司成为独角兽的平均时间仅为3.6年,过去企业成为独角兽的平时时间需要7年,从时间上来说几乎缩短了一半。 ——市场规模及预测 随着ChatGPT的火爆出圈,生成式AI成为各行各业关注和热议的话题。全球科技巨头和AI厂商纷纷下场,唯恐错过此番科技盛宴。行业翘楚和媒体将生成式AI浪潮类比昔日的移动互联网机遇,认为它将对全球经济和各个行业带来深远影响,企业也将迎来重大变革机遇,同时这一堆。根据Bloomberg Intelligence披露的数据,2023年全球生成式AI市场整体规模约为670亿美元,预计2029年及2032年将分别达到7280亿美元和1.3万亿美元,2022-2032年复合增长率高达42%。 据前瞻产业研究院测算,预计2027年我国AIGC产业规模超600亿人民币,2028年开始,AIGC产业将延展出完整产业链,并在商业化场景上持续拓宽加深,深入变革行业。2028年起,我国AIGC产业规模将持续保高速增长,2030年市场规模超万亿。 聚焦生成式AI,IDC预测,全球生成式AI市场年复合增长率将达85.7%,到2027年全球生成式AI市场规模将接近1500亿美元。 英伟达CEO黄仁勋表示,生成式AI已经开启了全新的投资周期,已经进入了“十年周期”(技术从出现、传播到大规模应用所需的时间)的第一年。 前瞻经济学人APP资讯组 更多本行业研究分析详见前瞻产业研究院《》。 同时前瞻产业研究院还提供、、、、、、、、、等解决方案。在招股说明书、公司年度报告等任何公开信息披露中引用本篇文章内容,需要获取前瞻产业研究院的正规授权。 更多深度行业分析尽在,还可以与500+经济学家/资深行业研究员交流互动。更多企业数据、企业资讯、企业发展情况尽在,性价比最高功能最全的企业查询平台。返回搜狐,查看更多 责任编辑:
用大模型“治病”,有多少人想找AI看一次“电子专家门诊”?丨新经济 再出发
AI医师助手

用大模型“治病”,有多少人想找AI看一次“电子专家门诊”?丨新经济 再出发

封面新闻记者 欧阳宏宇 蔡世奇 工作中,帮你远程操控机械的,是AI;看病时,给你做检查写病历的,是AI;出行时,替你巡航驾驶汽车的,还是AI……这些未来图景是否已嵌入了你的工作生活? 从ChatGPT出现挑起“百模大战”,到文生视频模型Sora在全球爆火,人工智能技术与各场景共振的新潮流再起。资本热逐之下,AI在产业端落地的锚点与前景也日渐清晰。 作为新质生产力的重要范畴,人工智能的价值与潜力不言而喻。当这一技术从实验室走向生产线,再进入千家万户,经过了怎样的历程?带着这些问题,我们一同到大湾区寻找答案。 “人工智能+”落地成果显现 医疗影像AI技术已臻成熟 随着GPT-3开启人类通用人工智能之旅,文心、通义、混元大模型等中国造AI大模型接踵而至,并很快同线下场景展开结合实践。 作为中国互联网三巨头BAT之一的腾讯,已在AI赛道上深耕多年。这家公司几天前公布的2023年年报显示,旗下金融科技及企业服务板块在过年一年实现收入2037.63亿元,人工智能及相关应用也是其中的重要组成。在财报发布后一个交易日,腾讯股价一度冲高至298.2港元/股,收盘时上涨0.83%。 调查机构QYR咨询去年底公布的报告显示,全球人工智能市场预计未来五年年复合增长率为41%。我国人工智能产业在过去几年发展蓬勃,工信部副部长徐晓兰此前公开透露,其核心产业规模达到5000亿元,企业数量超过4300家,创新成果不断涌现。 在腾讯研究院资深专家王鹏看来,大模型热度兴起不过一年多时间,行业与社会的主要关注点还是基础模型层面:比如在研究层面,中西方都在尽全力用好自己的母语,在基础平台研发上发力占据基础技术的领先地位。而在产业落地方面,企业也在努力寻找适合自身的特色领域。 中国工程院联合清华大学人工智能研究院发布的《中国人工智能发展报告2020》显示,过去十多年,中国专利申请人工智能量为389571,位居世界第一,AI专利领域的创新主要依靠高科技互联网企业和高校科研机构,其中国家电网专利申请量最多,其后依次是腾讯、OPPO。根据腾讯2023年年报,其专利申请总数已超过7.5万件。腾讯副总裁张立军透露,该公司申请的AI专利数量已超过3000件。 如今,人工智能正在赋能千行百业,医疗场景则是二者结合较为成熟的领域之一。“从2017年将人工智能引入癌症早筛后,经过数年的发展,目前AI已经能在影像AI、智能导诊、辅助诊断场景发挥作用。”腾讯杰出科学家、腾讯优图实验室天衍研究中心负责人郑冶枫说。 在腾讯,围绕“人工智能+”的产业端应用已经在医疗领域落地。记者看到,针对青光眼早期筛查和预防防治,腾讯优图实验室和腾讯觅影联合研发的AI眼底筛查系统,已经获得创新医疗器械证,并陆续落地筛查场景。 借助 AI 能力,腾讯觅影正助力基层农村逐步开展普惠性的眼底健康筛查 在体验AI眼底筛查系统时发现,患者只需将头部放在诊断机器上,瞳孔注视检测口中的红点。不到一分钟,就可完成青光眼等眼部疾病的筛查。机器会生成眼底照片并给出辅助诊断意见。 “眼底相机是利用深度学习技术来对比分析数据,从而进行青光眼筛查。”北京大学教授、眼科专家王乐今告诉记者,其背后的原理是,通过观察眼底图像,机器反复学习和积累大量病例,加速了对疾病的深入认识过程,能够快速标记正常和异常状态,最终实现快速准确地诊断青光眼等眼部疾病。 AI+5G 构建起新型的眼底远程筛查网络 目前,科技部已依托腾讯建设医学影像人工智能开放创新平台。郑冶枫透露,除青光眼影像筛查外,还研发了肺炎CT辅助诊断、结肠癌辅助筛查,正在攻克的还有宫颈癌筛查。“如果研究成功,或许能帮助在全球范围内早日消除宫颈癌。” AIGC开辟“AI+医疗”新范式 “机器幻觉”仍是大瓶颈 当GPT-4出现后,得益于其人机对话的形式,一旦和医院场景结合,还可能开辟出新的“AI+医疗”模式。就在几天前,微医就与腾讯达成协议,将合作打造医疗大模型品牌和医疗AI数字人。 除了借助AI提升医疗影像识别鉴定效率之外,目前AI大模型在文档归类、整理甚至撰写等领域展现出的能力,让很多人对“用AI帮助医生写出院报告”等繁琐文书工作产生了期待。 “比如,在病人完成住院治疗出院时,医生往往要花接近1个小时来书写病人的出院小结信息,而借助AIGC的能力,就可以自动生成电子病历,医生花费少量的时间进行修订和确认,就可以完成一份出院小结,帮助医生在繁忙的工作中解放出来部分精力。”郑冶枫介绍,像智能导诊、AI筛查都是基于人工智能的分类算法实现的;AIGC出现后,人机对话将大大提升医生在看病诊断外工作的效率。 王乐今也表示,目前国内大部分医院采用的电子病历系统,都是传统软件服务商开发的,只是把纸质病历变成了电子病历,依然需要人工总结、敲字,距离应用AI提升文书工作效率还很遥远。 “但医疗系统对人工智能技术的使用还是比较保守。”尽管AI在国内一线医院的应用仍有距离,但王乐今表示,ChatGPT等大模型在医疗学术研究方面“很有用”,“让ChatGPT给我检索东西,把眼球震颤的相关文章给我做一个简单的综述,它就能给你写出来。” 在海外,谷歌已于上周宣布其正在开发的多项新“AI+医疗”项目。包括旗下AI模型Gemini能从运动腕带中提取用户数据,用来评估锻炼将如何影响用户的睡眠质量;还将与印度一家医疗中心展开合作,在当地提供针对肺结核、肺癌和乳腺癌的人工智能筛查。同时,旗下视频网站油管也在基于AI提升健康信息的质量。几乎同一时间,刚刚又注资了“欧洲版OpenAI”的微软,也宣布携手多家健康医疗机构共同创建“值得信赖和负责任的人工智能网络”,为医疗行业开发和使用AI定标准。 在郑冶枫看来,“AI+医疗”有非常广阔的发展空间。“目前,腾讯的影像AI技术已很成熟,智能问答、智能导诊等便民服务正打通就诊全流程,提升患者就诊体验;临床辅助诊断决策技术也在持续发展,帮助医护提升服务效率。”他表示,AI技术要成为新质生产力,首要的就是落地到临床,让医生都要使用起来,尤其是帮助基层医院医生提高诊断水平。 可喜的是,国内医疗领域并没有“内德·卢德”。郑冶枫表示,医疗行业大模型等技术产品的成熟给了他很大的研发信心,得益于医疗知识图谱能力日益完善,困扰大模型应用的“幻觉”现象也逐步被解决。“我们尝试了知识图谱等各种手段,使得大模型技术在医疗场景的落地具有更加可靠的表现”。 不只是给人“看病” AI将成为通用“工具箱” 《“十四五”医药工业发展规划》提出,探索人工智能、云计算、大数据等技术在研发领域的应用,通过对生物学数据挖掘分析、模拟计算,提升新靶点和新药物的发现效率。 在医疗工作一线,AI与“看病”的结合才迈出“第二步”。王乐今介绍,人工智能在医学领域的应用主要经历了两个阶段变化:首先是通过机器模拟人类的反复学习过程,加速诊断技术的学习速度。例如,英伟达的GPU集成芯片可以实现高速运算,学习能力不断提升,从而快速识别病变并提供准确的判断。其次,随着科技进步,人工智能技术的应用范围不断扩大,例如ChatGPT可以编写代码,Sora可以制作影像,这将极大地改善医疗服务的工作流程,提高工作效率。 事实上,人工智能已经是引领新一轮科技革命和产业变革的战略性技术和重要驱动力量,它不仅在医疗领域有所体现,还在众多行业的关键场景中落地。据中科曙光信息产业成都公司总经理杨彦博介绍,作为信息基础设施企业,他们已面向AI产业发展需求,建设了一体化算力服务平台和“AI模型仓库”,可提供灵活的模型算法、算力服务,涵盖金融、能源、科教等行业的关键场景。 “人工智能将带来的是一种新的产业革命;如果只把AI当成一种技术,那就看低它了。”王鹏分析道,AI对传统产业的赋能绝对不是小修小补,是遵循‘第一性原理’的全面改造,并可能推动产业革命的拐点的到来。“就物理学理论来说,相对论联系了质量和能量,量子力学联系了能量和信息;而AI大模型的出现,让物质、能量、信息转换的标志同时都出现了。” 围绕“第一性原理”,很多人首先想到的是把这一理论常挂在嘴边的马斯克。在王鹏看来,马斯克参与的众多项目看似不着边际,但都围绕一个共性的目标,即新能源车、火箭回收、超级高铁、星链卫星等等,都是以火星探索和居住来执行的。“基于同样的逻辑,人工智能提供了一种行业改造的共性方法,以后,AI可能会成为改造各行各业全场景的一种通用‘工具箱’。” 从“+人工智能”到“人工智能+”,AI对于事物还是新事物的改造已越来越快。就在OpenAI公司宣布,正计划筹备在今年年中推出性能提升超出预期的GPT-5之后不久;苹果公司CEO蒂姆·库克也表示,苹果也会入局生成式AI。并且,连一直稳坐高端的iPhone,也将会在第16代产品迭代AI功能。 “AI所发挥的作用,是一种数字化纽带的能力。”王鹏表示,这一能力以创新为核心,进而提供了更加优质的新质生产力;这种将技术端和工业端做好匹配的底层关键技术,就是AI。 【如果您有新闻线索,欢迎向我们报料,一经采纳有费用酬谢。报料微信关注:ihxdsb,报料QQ:3386405712】
能导览科普也能亲情陪伴,会说话的AI数字相框火到中东
AI情感助手

能导览科普也能亲情陪伴,会说话的AI数字相框火到中东

原标题:能导览科普也能亲情陪伴,会说话的AI数字相框火到中东 《南方都市报》2024年4月8日A07版。 想不到,一款会说话的AI数字相框,竟在中东成了爆款。只需上传一张人像照片和一段声音素材,就能生成相框里的数字人,他/她不仅能克隆你的声线,还能讲50多种语言,和用户无障碍交流。 这款相框来自深圳的一家AIGC品牌——来画,可应用在展馆导览、亲情陪伴、逝者悼念等场景。今年以来,该品牌已亮相于广东省高质量发展大会产业科技融合发展成果展、2024沙特阿拉伯通信科技与信息技术展览会等国内外多个展会。 日前,南都记者走进深圳市前海手绘科技文化有限公司,一睹AI如何为数字相框赋予灵魂。 在海外已经卖出上万台 “AI相框的灵感来自于迪拜的金像框,配合着AI数字人的生成技术,你可以跟世界上任何一个人对话,这个创意将哈利·波特电影中会说话的相框复现了”,来画创始人魏博介绍,中东国家有将尊贵人士照片挂在墙上的文化习俗,这一市场潜力被来到沙特拓展业务的他敏锐捕捉到,AI相框由此诞生。 定位于“好看的皮囊,有趣的灵魂”,但AI相框起初只能实现简单的特效,“皮囊并不智能”。在魏博看来,大模型的诞生为AI相框赋予了灵魂,通过绑定APP并上传相应素材,就能够实现和相框人物对话、生成视频等功能,目前可支持50多种语言。在国外,一些足球俱乐部将内马尔、C罗等球星的AI数字人相框放进球迷商店售卖,受到了“疯抢”。 来画联合创始人全倖慧告诉南都记者,AI相框是公司在中东打响的“第一炮”,她也惊讶于整个中东地区的阿拉伯人对于“相框”的文化寄托和情感寄托。据了解,这款AI数字相框在海外已经售卖了上万台,不仅挂入了阿布扎比皇宫,还作为国礼被皇室馈赠给远道而来的贵客。 来画新产品:李白形象的AI助手。 从相框到AI助手 “它更像是一个AI助手的角色”,接受采访时,全倖慧更愿意将AI相框定义为基于技术驱动的消费电子产品。将Al助手SDK运用集成到不同硬件中,就能实现对多行业智能交互场景的连接。 不仅可以做成“相框”,AI助手还能化身咖啡厅点单员、博物馆讲解员、企业前台等,在政务、金融、医疗等场景进行答疑解惑,在博物馆、文化馆、展览馆等场景开展科普教育,成为陪伴空巢老人的心灵伴侣、悼念逝去亲人的媒介等。南都记者注意到,来画的AI助手已被应用于COP28联合国气候变化大会IP助手、阿布扎比大清真寺AI导览助手、阿布扎比警察局官网AI助手、阿布扎比咖啡厅点单助手等案例中。 全倖慧谈到,在文化领域,AI助手也能被应用于与孔子、鲁迅、蒙娜丽莎、爱因斯坦等古今中外名人跨时空对话的场景,像《长安三万里》李白的动画形象登上了今年的春晚舞台,来画也借机推出了李白形象的AI助手,用户可与其吟诗对谈,进行有趣互动。 AI创作如何炼成? 今年1月,来画发布了2023年度报告,AI动画、AI数字人视频、AI助手、AI相框成为产品核心关键词,不难看出,“AI创作”已成为该品牌的内核。 起初来画的定位并非AIGC,而是希望传递“让视频创作更加简单”的理念。2015年,来画所属“深圳市前海手绘科技文化有限公司”创立,“我们早期并没有推崇AIGC,之所以一步步发展成为AI公司,源于我们持续将小的AI功能植入到产品中去赋能用户”,全倖慧透露,公司创立的早期想法是去打造动画技术,研究动画的自动手绘路径,基于动画智能生成平台不断迭代用户体验,将自定义IP卡通形象等功能植入到产品中,用户可以创建角色并驱动其讲话,这也是早期的数字人技术。 随着数字人的出圈,来画科技开始大规模雇佣画师,手绘出一个个数字人IP模版。据全倖慧介绍,来画的驱动技术可以做到通过上传一张照片,连接到手机APP后远程操控数字人形象,从而生成数字人口播视频、数字人动画、数字人直播等。“如今的来画科技已蜕变为一个AI创作平台。”全倖慧说。 3000万+动画数据资产 2023年,人工智能迎来“奇点”:大模型横空出世,“生成式AI”形成奔涌大潮,几乎每天都有新的生成式AI产品诞生。乘着东风,来画依托自身1800万动画数据资产,推出动画领域的垂直模型SkinSoul,这成为平台智能内容创作与交互体验能力的驱动器,由此支撑着视频、动画创作。 譬如,用户使用平台推出的商业视频制作工具URL TO VIDEO,将亚马逊、淘宝等网页链接导入后,就能快速批量化生成多种不同风格的视频,且可以在Al动画在线创作平台进行简单拖拽等二次编辑,生成动画视频。目前,该功能已被在线教育、媒体宣传、广告营销、金融、医疗等行业使用,比如帮助教师将课程内容一键转换成相关的视频,快速制作出生动的课件,再配以数字人去做讲解,提升授课的趣味性和效率;再如,赋能电商运营,帮助中小企业提升营销能力和体验;还有帮助医生制作科普视频等。 8年多时间里,来画科技已积累起3000万+动画数据资产,这成为训练模型的原料。全倖慧指出,在大模型研发方面,来画选择与基于开源大模型进行应用层的训练,并针对不同大模型生成的效果进行测试。目前,来画与大模型创业公司月之暗面展开合作,基于大模型Kimi去进行“可控视频”的生成训练,从而达到内容与画面的强匹配。 出海拓展全球商业版图 对于来画而言,带着“AI相框”走出国门成为品牌发展的重大转折。以沙特、阿联酋、卡塔尔、科威特等为代表的诸多中东富裕国家,均已部署各类“2030远景”,从能源型国家向多元化、数字化国家转型,在一次海外市场调研中,来画敏锐捕捉到了商机。 2022年以来,该公司开始关注中东市场,并将阿联酋作为落地的首站,成立阿布扎比中东总部,出海拓展全球商业版图。其推出的海外动画产品Doratoon、海外数字人产品InnAIO均受到广泛关注,也带来了覆盖全球100多个国家和地区的数千万用户。去年以来,来画的产品在土耳其国家峰会、GITEX GLOBAL 2023全球科技盛会、沙特LEAP科技展等海外知名活动上相继亮相,并与迪拜中阿卫视等众多机构企业达成AI数字人合作。 “参加这些展会时,我们的AI相框常被‘疯抢一空’,因为文化属性不同,会出现不同的需求,形成出其不意的‘爆款产品’”。谈及下一步产品规划,全倖慧表示,在拓展海外市场时会较早地认知到海外的AI行业趋势,也会及时将这些信息带到国内,赋能下一步的产品研发方向。 链接 有AI产品:AI相框 产品特性:用一张照片就能生成可以对话的数字人视频。 应用场景:可运用于政务/金融/医疗等场景的服务助手,博物馆、文化馆、展览馆等讲解助手,陪伴空巢老人、悼念逝者、传递哀思等。 使用效果:增强讲解趣味,为用户提供相关资讯及个性化服务,可全天候、全方位地与受众进行实时互动。 南都调研 总第238期 统筹:张纯 采写:南都记者 张雨亭 李伟锋返回搜狐,查看更多 责任编辑:
直击GTC:医疗或成Gen AI今年关键词
AI医师助手

直击GTC:医疗或成Gen AI今年关键词

文 | 硅星闻 2024年3月,全球目光聚焦硅谷——一年一度的GTC大会正在召开。 刚刚过去的一年,生成式AI已经席卷全球,成为人工智能在各行各业落地的重要锚点。而作为生成式AI背后极为重要的软硬件基础设施,英伟达召开的GTC大会,无疑将传达Gen AI的种种未来风向。 这一年的AI风向中,医疗领域可能最受瞩目。 周二早,英伟达生物医疗副总裁Kimberly Powell在演讲上这样强调:“医疗行业正在采用生成式人工智能,成为最大的技术产业之一。” 知名AI科学家李飞飞在和英伟达首席科学家Dill Dally教授的炉边谈话中也表示,AI在医学中的应用可能是最深远、最广泛的。 今年整个大会有90场活动与医疗保健/生命科学相关——数目位居所有行业之首,超过了汽车、云服务、硬件/半导体等一众热门领域。在首日的主题演讲上,黄仁勋更是一口气宣布了25个由生成式人工智能驱动的全新微服务(microservices),加速药物发现、医疗技术(MedTech)和数字健康等领域的发展。 英伟达对医疗健康领域的重视可见一斑。随着Gen AI应用不断扩展、深入,与人类命运息息相关的医疗健康领域将会迎来什么样的变化?有了英伟达加持的创业公司又将在其中扮演什么样的角色? GTC大会内场 GTC大会 新一代人工智能推进医疗发展 如文初提到的,今年GTC上,Nvidia宣布的最重要进展之一,就是在医疗健康领域的25项GenAI相关微服务。 这些由生成式人工智能驱动的微服务覆盖多个领域,包括药物发现、医疗技术(MedTech)和数字健康等,在全球范围内为医疗组织提供支持。 这套服务可在任何云平台使用,包括成像、语言处理、语音识别和生物学模拟等功能。套件中还有专为医疗应用调优的NVIDIA NIM AI模型和行业标准API,使其易于整合进云解决方案。 此外,像Parabricks、MONAI、NeMo、Riva和Metropolis这样的软件开发套件和工具现在作为NVIDIA CUDA-X微服务提供,以加速药物发现、医学成像和基因组学分析的工作流程。 套件中还包括NVIDIA NIM医疗微服务,为成像、医疗技术、药物发现和数字健康的模型优化推断,包括用于生成化学、蛋白质结构预测、分子相互作用分析和3D分割等模型,大幅提升基因组分析速度,变异检测速度比传统方法快50倍以上。 “历史上首次,我们可以在计算机中深入生物学和化学的世界,让计算机辅助药物发现成为可能,”Powell在会议上谈道。 像Amgen、Astellas、DNA Nexus和Iambic Therapeutics这样的医疗巨头可以利用这些生成式AI微服务,改善药物发现和抗体设计。 另一个值得关注的进展是,Nvidia一年前发布的BioNeMo(帮助医疗机构通过生成式人工智能进行药物发现的模型)如今包含了多种用于药物发现任务的新基础模型,如分析DNA序列、预测药物相互作用导致的蛋白质结构变化,以及从RNA数据识别细胞功能。 在这些新的基础模型中,有用于基因组学分析的DNABERT和用于单细胞RNA测序的scBERT。EquiDock是另一个预测蛋白质相互作用的模型,这对于评估药物的有效性至关重要。 “医疗本身就复杂。我们的目标是让研究人员更加容易地调整这些模型以适应他们的专有数据,通过网络浏览器或云API运行AI模型推断,并且能够访问预训练模型以帮助药物开发。”NVIDIA的医疗副总裁Kimberly Powell在采访中表示。 大会上,英伟达还宣布与强生医疗器械合作,利用AI提升手术室效率和临床决策。 这一合作让强生能用NVIDIA的IGX和Holoscan平台处理手术室数据,提高手术结果,简化手术室AI应用的开发和部署。NVIDIA的Holoscan和IGX加速了医疗AI应用的创建和数据处理——通过AI分析设备、患者和手术数据,这些技术能在手术中为医生提供洞察,减少负担,提高护理质量。 除此之外,新一代人工智能芯片Blackwell也在GTC上正式发布,性能在不同应用中的相比当前供不应求的H100等提升在7-30倍,预计将在今年晚些时候发货。这可能标志着AI和机器学习技术向前迈进了一大步,对医疗科技也将有进一步推进作用。 为创新加速,英伟达支持头部AI创业公司 从数年前,英伟达就与创业公司紧密合作,通过多个项目支持创业公司在各个领域的探索。此前Kimberly Powell在采访中也提到,英伟达的目标是为更多技术公司提供芯片、云基础设施与其他工具。 从2017年起,英伟达就通过Inception创新计划合作伙伴项目、竞赛奖励及投资与包括医疗AI等多方向的AI创业公司紧密合作。本次大会上,Inception计划参与企业也有专门的布展区域,展示其创新进展。 其中,结缘于2018年的深智透医(Subtle Medical Inc.)就是一个典型案例。早在2018年,深智透医曾获英伟达AI大奖,获百万美元奖金。此后,深智透医与英伟达医疗、MONAI等方向建立长期合作。 2018年英伟达AI大奖颁奖现场,左起:NVIDIA CEO...
顺网科技引领AI娱乐新潮流,SPICE引擎开启GenAI时代智能陪伴新时代
AI情感助手

顺网科技引领AI娱乐新潮流,SPICE引擎开启GenAI时代智能陪伴新时代

顺网科技发布了AI陪伴引擎"SPICE"和应用"灵悉",聚焦于游戏场景,宣布了休闲娱乐GenAI时代的到来。"SPICE"作为全链路能力引擎,通过智能语言处理、计算机视觉等技术及大模型实现个性化陪伴,包括性格、记忆、认知和决策模块,展现出强大的AI技术实力。应用"灵悉"展示出在定制化交互、游戏场景和休闲场景的陪伴功能上已具备高度智能化水平,预示着AI陪伴新时代的到来,将为用户带来更贴心的体验。
科技巨头加码生物技术,AI医疗或成黄金赛道?巨头们如何重塑生命健康产业?
AI医师助手

科技巨头加码生物技术,AI医疗或成黄金赛道?巨头们如何重塑生命健康产业?

AI生物技术领域潜力巨大,被视为“下一场革命”,科技巨头如英伟达和谷歌通过软件向硬件切换,加码医疗布局,推动医疗科技创新和产业升级。未来,高度定制化的AI将在垂直场景中发挥关键作用,通过积累数字要素和升级硬件设施以提高生产效率和质量。科技巨头凭借先进技术与完整生态系统优势,正加速AI在医疗领域的应用,尽管挑战如数据质量和深度理解医疗场景仍存在,但AI医疗已推动市场发展,预计未来将有更多融合AI的医疗相关投资机会。