《AI大模型竞赛:谁在吊打ChatGPT?》
AI情感助手

《AI大模型竞赛:谁在吊打ChatGPT?》

这篇文章讨论了当下 AI 行业中“百模大战”的现象,即各大厂商发布的多款大模型在各种榜单上争夺第一名。然而,尽管这些大模型在某些方面表现出色,但在用户实际体验中,其表现并不尽如人意。此外,由于各种不同的统计排名口径,使得榜单变得难以使用。文章指出,部分榜单存在刷榜现象,这导致了一些模型虽然在榜单上排名靠前,但在实际应用中表现不佳。为此,C-Eval 团队 issuing lists of models that have passed their evaluation and those that haven't, in order to help users carefully evaluate the actual performance of these models.
ChatGPT对金融业的影响座谈会成功举办,共话金融业未来发展!
AI金融助手

ChatGPT对金融业的影响座谈会成功举办,共话金融业未来发展!

ChatGPT火爆出圈,引起金融机构和科技企业的广泛关注,已有多家企业宣布入局,正在尝试运用ChatGPT技术提升金融生产力。那么,到底何为ChatGPT?ChatGPT在金融领域可以产生哪些应用?距离落地还有哪些问题? 为此,中关村金融科技产业发展联盟、中关村互联网金融研究院于3月16日联合举办“Chat-GPT对金融业的影响座谈会”,本次座谈会将从以上问题出发,浅析ChatGPT可能给金融机构和科技企业带来的机遇与挑战。 本次座谈会由中关村互联网金融研究院院长、中关村金融科技产业发展联盟秘书长刘勇主持。他对大家的到来表示热烈的欢迎,对ChatGPT做了简要介绍,对各位分享嘉宾积极参与、精心准备报告内容表示感谢。北京科技创新促进中心科技金融部、中国人民银行中关村国家自主创新示范区中心支行、中信银行、华夏银行、安信证券、东软集团、天翼电子商务、数字认证、海致星图、百融云创、瑞莱智慧、度小满、东方微银、创易金服等参加本次会议,积极讨论,分享真知灼见。开场致辞过后,座谈会进入到第一环节主题分享,中关村金融科技产业发展联盟专家委员会委员,中科院微电子研究所研究员,中国科学院大学教授、博导陈曙东教授从三个方面讲述ChatGPT:“我是谁?——ChatGPT是什么?”“从哪里来?——生成AI的发展历程”“到哪里去——类ChatGPT的机遇与挑战”。金融行业如何应对风险与挑战?陈老师从三个方面给出独到见解!第一,数据质量、隐私和安全、计算能力和资源及风险管理,是目前Al在金融行业应用的主要难点。在广泛实施之前,必须重视存在的风险和面临的挑战。数据的预处理和标注需要消耗大量的人力和时间成本。算力也将是制约Al模型发展的重要因素之一。第二,AI的使用应当有“底线”和“红线”,要受到道德和法律的制约。加强模型、算法设计者的职业道德建设,消除主观歧视思想,不做恶;加强对人工智能领域数据的管控,评估可能引发的国家安全风险,根据《网络安全法》《数据安全法》《数据出境安全评估办法》等法律、法规,对出境数据进行合规审查。第三,相关监管手段也需要加快进程跟上技术发展的步代。AI模型要能智能识别敏成数据,实现对多用户、多模态数据间的风险识别、预警,将可信数据检核功能前置,促进自驱动式提升数据质量,进而保护用户数据。随后,中关村互联网金融研究院兼职研究员张雅琪从四个方面表述自己的观点。第一,OpenAI美东时间3月14日发布大型多模态模型GPT-4,支持图像+文本输入。与GPT-3.5相比,GPT-4更具备创造力,更能理解人类的指令,进行更为复杂的任务处理。例如,GPT-4在美国律师执照考试中,可达到前10%水平,而GPT3.5处于后10%,表现出了明显的性能提升。第二,GPT-4在工程实现上存在多个值得关注的地方。比如,更GPT-4加关注大模型的安全和风险控制,并且通过开源OpenAI Evals方式,引入更多生态参与方,来共同协助对系统进行评估和检测。第三,做大模型的机遇与挑战在于,工程实现需要技术和时间积累、迭代和反馈,但垂直领域的小模型存在机会。第四,GPT-4推出后,以摩根士丹利为代表的金融公司马上宣布,计划接入OpenAI的GPT-4,主要是应用于金融内容的处理、洞察全球金融行业的信息,以及更人性化的智能投顾等业务。因此,GPT在金融领域的应用也在不断拓展,对金融行业的效率,降低综合成本可能存在很大应用前景。最后,中国人民银行中关村国家自主创新示范区中心支行党委书记、行长毛笑蓉做总结发言。她指出,我们要更加理性客观的看待ChatGPT带来的机遇和挑战。从企业层面来讲,ChatGPT在金融领域的场景应用,可能更多的是基于开放的模式,建议科技企业集中深入研发,在未来同金融产品紧密结合。从银行和金融机构这个角度来看,要基于一种标准化的场景,积极的去推动客户互动模式落地,促进相对来说比较成熟的一些场景能够先期应用,逐步的去实现人工替代。如果未来引进ChatGPT这样的技术,将极大提升是信息汇总及自我学习的能力,更好的为企业服务。与此同时,技术规范和标准制定尤为重要,ChatGPT处于初始阶段,标准规范从头开始,形成比较好的、健康的发展模式。另外就是注重风险防控,一方面去推这些动技术进步,另一方面做好风险防控漏洞弥补,同步推进。 当前,推动金融行业数字化转型是发展所趋,ChatGPT是信息化技术与金融深度融合的缩影。在金融行业数字化良好转型目标下,对ChatGPT等工具的使用需要冷思考和主动应对,要做好全面系统、动态的评估,为积极应对即将到来的风险做铺垫,同时要建立具有包容性的监管制度,划清底线,搭好顶层设计和制度框架,主动适应金融新形态,唯有此,才能充分发挥ChatGPT等人工智能工具的金融服务属性,打造更有质量的未来金融,进一步实现金融现代化。 声明:此公号(ID:cnzifi)发布内容和图片的目的在于传播更多信息,版权归原作者所有,不为商业用途,如有侵犯,敬请作者与我们联系。 -金融科技行业周报|往期回顾- 金融科技行业周报 | 要闻速览(3.6-3.12)十四届全国人大一次会议选举产生新一届国家领导人 金融科技行业周报 | 要闻速览(2.27-3.5)十四届全国人大一次会议在京隆重开幕 金融科技行业周报 | 要闻速览(2.20-2.26)中共中央政治局召开会议,决定2月26日至28日召开二十届二中全会 金融科技行业周报 | 要闻速览(2.13-2.19)人民银行召开2023年金融市场工作会议:完善支持科技创新等政策工具机制 金融科技行业周报 | 要闻速览(2.6-2.12)央企今年投资重点明确 聚焦主责主业、发展实体经济 -行业资讯-行业资讯 | 国务院发展研究中心原党组成员、副主任张军扩 :对2023年经济形势与对策的几点思考行业资讯 | 构建新发展格局讲座聚焦金融科技发展,市委书记尹力要求全力打造全球金融科技发展高地行业资讯 | 人民银行党委书记、银保监会主席郭树清重磅发声:金融服务大有可为 科技创新能力不断提升行业资讯 | 北京金融资产总量达190万亿,金融业成为首都经济第一大支柱产业行业资讯 | 北京市金融监管局局长李文红:巩固扩大金融科技发展优势,大力培育数字金融产业主体-专家观点回顾- 专家观点|吴敬琏重磅发声:中国经济问题,冰冻三尺,非一日之寒 专家观点|董希淼、桑晨颖:加快培育中国银行业的“专精特新” 专家观点|中国工商银行原行长杨凯生:商业银行面临的主要挑战与对策建议 专家观点|中国工商银行董事长陈四清:以科技搭建金融生态,当好金融服务科技创新的引领者。 专家观点|黄益平:数字经济的发展与治理
“大模型在金融行业的应用与展望”研讨会举行
AI金融助手

“大模型在金融行业的应用与展望”研讨会举行

来源:中国证券报·中证网 近日,恒生聚源主办的“大模型在金融行业的应用与展望”研讨会在上海举行。会上,恒生电子高级副总裁、恒生聚源董事长王锋表示,“当技术、模型、数据、应用快速形成闭环,将产生真正的业务价值,AI进入了从能力涌现走向价值涌现的新阶段。” 2022年11月以来,随着OpenAI发布ChatGPT,全球迎来AI大模型热潮。到今年3月BloombergGPT的推出,引起对金融垂直领域大模型应用的关注。 恒生研究院院长、首席科学家白硕介绍称,基于Transformer架构,大模型目前分为两条技术路线,其中GPT的单向预测模型可以理解为“接龙”,而另一条路线类似于“填空”,前者通过一条示意可以容纳包括知识、推理、引导、详细说明,甚至代码的预测,后者需要两边文本的信息指示。 “GPT对AI行业的冲击非常大。”白硕告诉记者,在此之前机构部署的AI系统都是“烟囱式”的单个系统,“诸多小模型的训练使分析师沦为数据标注员,而模型的可用性也难以得到保障。” 富国基金信息技术部总经理李强提到,在基金行业的AI应用中,自然语言处理、文档解析、智能客服、发票识别、表单提取等小模型应用都已相对成熟,但“烟囱式”发展问题非常严重。 “小模型和大模型也存在经济学中的‘不可能三角’。”申万宏源证券研究所所长助理刘洋提到,小模型强调了精准度、利润率,但弱化了智能化程度,大模型恰恰相反,通过成本的堆叠,实现了模型的智能化与高效能。 “当高质量语料库训练到百亿级参数时,大模型的语言能力就会涌现,在意图理解、文本语言生成等方面的能力将随着参数的增加达到顶峰。”白硕指出,尽管大模型的语言能力已经很强,但是在垂直专业能力方面还有所欠缺,当前普遍适用的解法是,以大模型中控为核心,结合应用、插件等共同构建成AI能力中心,将大模型中控成为链接大模型与应用的“桥梁”。 “大模型的涌现能力,让基于大量计算的‘暴力求解’成为现实。”刘洋表示,在算力、算法、数据“三驾马车”的推动下,工程化能力变得尤为重要,特别是在券商、基金这样的垂类大模型应用场景下,率先为客户提供服务的厂商将抢占先机。从应用端,李强同样提到,目前各类大模型“百花齐放”,但应用落地还需要真正的工程化能力。 “我们要解决的一个核心问题是,让大模型有效应用于投资业务服务之中,对于机构客户能带来投资收益,对于我们内部的中台与后台,可以带来有效工作效率提升。”中信证券首席数据科技分析师张若海指出,在投研领域,大模型可以助力人均价值的提升,例如在量化领域,对政策文本数据的情绪提炼、中观景气研究的指标投资有效性识别,在投资覆盖宽度与数据处理精度大幅提升同时,人力规模并没有显著等比例增加。在高频场景下,可以实现大规模的定量数据跟踪与观点提炼,解构成交易信号,从而帮助到机构投资者更加便利地获得大模型的赋能。 李强认为,未来三年内代码生成的效率提升将在30%-50%之间。白硕则提到,从技术发展的角度,三年内大模型的语言能力将全部上一个台阶,而在金融领域的提质增效目前主要集中于IT研发与数据分析方面。通过AI可以实现低代码甚至“零代码”,工作效率可以提升2-3倍,满足七成以上的数据偶发性即时需求,提升8-10倍的建模效率。 “在ChatGPT3.5横空出世时,很多金融从业者不对其进行训练与微调,可以达到很好的效果,但是随着在业务场景的落地,会发现这一模型难以满足各业务的精度要求。”恒生聚源副总经理白雪表示,为了实现“语控万数”,恒生电子与恒生聚源共同推出的智能投研平台WarrenQ-Chat利用大模型叠加搜索和聚源金融数据库,通过对话指令,轻松获得金融行情、资讯和数据,且每一句生成的对话均支持原文溯源,确保消息出处可追溯。 原创回顾盘点20家银行数字风控:“智能”“反欺诈”成核心关键词 1、银行闯进这个规模超4.9万亿的大市场,需防范合规风险 2、结果最新出炉|22家农村银行机构手机银行“七大核心性能”评测 3、机器人的数量将会超过人类,银行还能见到真人员工吗? 4、银行掌握的大数据越多,挑战就越大?专家:解药在AI那里 5、不断延伸互联网服务场景,银行多措并举推进场景金融建设 点击“在看” 您关心的行业资讯永不掉线
《ChatGPT:2022年最先进的聊天机器人》
AI金融助手

《ChatGPT:2022年最先进的聊天机器人》

2022年11月30日,Open AI发布名为“ChatGPT”的对话优化语言模型,被称为“2022最先进的聊天机器人”。ChatGPT是基于人工智能技术驱动的自然语言处理工具,能完成撰写邮件、视频脚本、文案、翻译、代码等任务,其应用带有人工标注反馈的强化学习,能模拟人类对答案的偏好评分。借助微软Azure云平台提供的超强算力,ChatGPT对手写、语音和图像识别、语言理解方面表现大幅突破,加速场景内容生成的高效性和应用的多样化。ChatGPT可以提供文本生成、数据分析、聊天机器人、预测分析和NLP技术方面的服务,主要应用场景包括内容生成、编程协助、创意生成、虚拟对话等。在编程协助领域,ChatGPT可以实现生成代码前后的逻辑一致性,具有强大的代码生成能力,可以应用在代码生成、代码提示、故障诊断、自动测试等环节。
谷歌正式推出“医疗ChatGPT”
AI医师助手

谷歌正式推出“医疗ChatGPT”

2022年底,OpenAI推出的基于大语言模型(Large language model,LLM)的聊天机器人ChatGPT展示了令人印象深刻的强大能力。 为应对异军突起的OpenAI,谷歌在今日推出了其生成式人工智能模型——Gemini,谷歌表示,这是迄今为止功能最强大、最通用的人工智能大模型,其在许多测试中击败了OpenAI最近的GPT-4。 除了与OpenAI的直接竞争外,谷歌还致力于开发其他更专业的生成式人工智能项目,其中就包括医疗人工智能大模型——MedLM。谷歌表示,该模型已经可以通过公司的Vertex AI平台向美国谷歌云客户提供,该平台使用机器学习工作流来指导用户通过训练、评估和部署生成式人工智能模型的过程。与此同时,美国以外的某些市场可以“预览”这些工具。 MedLM模型基于Med-PaLM 2,Med-PaLM 2是谷歌进军医疗人工智能大模型的第二次尝试。去年,其开发的Med-PaLM模型因通过了美国医疗执照考试(USMLE)而成为头条新闻(准确率为67%),而今年,Med-PaLM 2进一步将准确率大幅提升至86.5%,根据谷歌的说法,该分数相当于“专家”医生水平。 谷歌表示,MedLM模型有两个版本,其用途之间的差异在于,第一个MedLM模型更大,专为复杂任务设计。第二个是中等模型,能够进行微调,最适合跨任务扩展。谷歌表示,在未来几个月会将基于Gemini的模型集成到MedLM模型中,以进一步扩展其人工智能功能。 谷歌表示,此次新推出的医疗人工智能大模型——MedLM,旨在用于整个医疗保健行业的各个方面,包括医院、药物开发、面向患者的聊天机器人等。例如,美国医疗保健巨头HCA Healthcare正在将MedLM模型用于记录临床医生与患者之间的对话,并将其自动转译为医疗记录,从而提高记录的质量。AI药物发现平台BenchSci正在使用MedLM模型快速筛选大量临床数据并识别某些疾病和生物标志物之间的联系。 医学是一项人性化的事业,其中语言是临床医生、研究人员和患者之间的沟通互动的关键。近年来,人工智能的进步为其在医学领域的应用带来了新的希望。但AI模型主要是单任务系统,缺乏表达能力和交互能力,还可能会编造令人信服的医疗错误信息,或纳入偏见加剧健康不平等。因此,现有的AI模型所能做的和在现实世界的临床工作流程中对它们的期望之间存在着不一致,使其难以转化为真实世界的可靠性或价值。 2023年7月,谷歌和谷歌旗下人工智能公司DeepMind的研究人员在国际顶尖学术期刊 Nature 上发表了题为:Large language models encode clinical knowledge 的研究论文。 该论文展示了谷歌开发的一个专精医学领域的大语言模型——Med-PaLM,其能够很好的回答医学问题。 为评估大语言模型(LLM)编码临床医学知识的能力,研究团队探讨了它们回答医学问题的能力。这项任务非常具有挑战性,因为为医学问题提供高质量的答案需要理解医学背景,回忆适当的医学知识,并根据专家信息进行推理。 在这项研究中,提出了一个基准,称为MultiMedQA:它结合了6个涵盖专业医疗、研究和消费者查询的现有问题回答数据集以及HealthSearchQA——这是一个新的数据集,包含3173个在线搜索的医学问题。通过这一基准来评估大语言模型回答医学问题的真实性、在推理中使用专业知识、有用性、准确性、健康公平性和潜在危害。 表现令人鼓舞 研究团队随后评估了PaLM(5400亿参数的大语言模型)及其变体Flan-PaLM。他们发现,在一些数据集中Flan-PaLM达到了最先进水平的表现。在整合美国医师执照考试类问题的MedQA数据集中,Flan-PaLM超过此前最先进的大语言模型达17%,达到了67.6%的准确率,达到了通过考试的标准(60%)。不过,虽然FLAN-PaLM的多选题成绩优良,进一步评估显示,它在回答消费者的医疗问题方面存在差距。 为解决这一问题,研究团队使用一种称为设计指令微调(instruction prompt tuning)的方式进一步调试Flan-PaLM适应医学领域。设计指令微调是让通用大语音模型适用新的专业领域的一种有效方法。 结果产生的新模型Med-PaLM在试行评估中表现令人鼓舞。例如,Flan-PaLM被一组医师评分与科学共识一致程度仅61.9%的长回答,Med-PaLM的回答评分为92.6%,相当于医师做出的回答(92.9%)。同样地,Flan-PaLM有29.7%的回答被评为可能导致有害结果,Med-PaLM仅5.9%,相当于医师所作回答(6.5%)。 升级版——Med-PaLM 2 值得一提的是,这篇在 Nature 论文中描述的 Med-PaLM 模型于2022年12月推出,而在今年5月份,谷歌在预印本平台发表论文,推出了升级版的Med-PaLM 2。 论文中显示,Med-PaLM 2是第一个在美国医疗执照考试(USMLE)类问题上达到专家级表现的大语言模型,能够正确回答多项选择题和开放式问题,并对答案进行推理,准确率高达86.5%,大幅超越了Med-PaLM以及GPT3.5。 Med-PaLM 2根据14项标准进行了测试,包括科学事实、准确性、医学共识、推理、偏见和危害,由来自不同背景和国家的临床医生和非临床医生进行评估。研究团队还发现该模型在回答医学问题方面仍存在一些差距,但并未具体说明,谷歌表示,进一步开发和改进该模型以解决这些差距,并了解大语言模型如何改善医疗保健。 已开展临床测试 据报道,Med-PaLM...
《2023生成式AI大模型之战:谷歌Gemini与OpenAIGPT-4的较量》
AI创业助手

《2023生成式AI大模型之战:谷歌Gemini与OpenAIGPT-4的较量》

在过去一年里,ChatGPT3.5引领了AI技术的风潮,定义了人类与AI互动的新方式,全球范围内的科技巨头纷纷加快大模型产品的更新速度。新年伊始,Gemini大模型的发布预示着2023年可能是生成式AI的一年。各大科技公司都在积极布局大模型领域,我国已有多个10亿级参数规模的基础大模型发布。而随着OpenAI GPT-4V的发布和谷歌Gemini大模型的官宣,生成式AI大模型多模态能力的竞争愈发激烈。
ChatGPT王炸升级!更强版GPT-4上线,API定价打骨折,现场嗨翻了量子位2023-11-07 05:06北京量子位2023-11-07 05:06北京
AI创业助手

ChatGPT王炸升级!更强版GPT-4上线,API定价打骨折,现场嗨翻了量子位2023-11-07 05:06北京量子位2023-11-07 05:06北京

梦晨 明敏 发自 凹非寺量子位 | 公众号 QbitAI ChatGPT,今天裂变成无数个GPT。 OpenAI在首届开发者日上,正式公布自定义GPT。 还将上线“GPT商店”,与创作者分享收入。 CEO山姆·奥特曼现场登台演示,3分钟不到,只凭几步操作做好一个“创业导师GPT”。 接下来,“创业导师GPT”就可以根据奥特曼本人过去的演讲内容,回答创业相关问题。 刚刚出炉的新GPT,可以在公司内部共享或对所有人公开。 从此,“GPT开发者”像“iOS开发者”一样成为了新的职业,让AI替你赚钱的梦想成真了。 与此同时,现有的GPT-4也迎来一大波更新。 新版本GPT-4 Turbo,支持128k上下文,知识截止更新到2023年4月,视觉能力、DALL·E3,文字转语音TTS等等全都对API开放…… API价格还打了3-5折。 这边发布会进行着,ChatGPT网页版同步更新,最新知识截止现场就实装了。 对这次发布的种种,OpenAI创始成员Andrej Karpathy总结到“在计算中看到了一个新的抽象层”。 将会有更多的开发者和更多的GPT。GPT可以读、写、听、说、看、画、思考,使用现有计算作为工具,成为重点领域的专家,参考自定义数据,在数字世界中采取行动,以自定义方式说话或行动,以及共同协作。系好安全带。 每个人都能定制GPT 这一次的最重磅更新,当属GPTs。 它让过去一段时间里大家想象的GPT帮你做一切,成为现实。 无需编程,每个人通过对话聊天的方式,即可构建一个专属技能的GPT。 而且每个人能同时拥有多个专长GPT,可以是你自己创建的,也能从GPTs商店里拿别人的来用。 OpenAI透露GPTs商店将在本月晚一点的时候推出。 这意味着你能靠制作专属GPT来赚钱了。 具体能干啥? 它能成为你的宠物顾问,基于多模态能力解答毛孩子遇到的各种问题。 也能充当设计助手,按要求生成海报。 还能帮你给朋友发消息,奥特曼现场就收到了一条由ChatGPT代发的信息。 而且构建过程并不难,奥特曼在现场亲自演示了一遍。 整个过程就是和构建助手GPT Builder唠嗑,告诉它你想要做什么即可。 奥特曼说,想要构建一个创业公司助手,能够给创始人提供各种商业建议,并且不断拷问他们为啥不能发展得更快(现场爆笑)。 然后GPT Builder就输出了一个GPT,它会更进一步询问用户给新生GPT做更多定制信息。比如希望突出哪些方面、规避哪些问题等。 同时用户能控制构建的GPT能不能上网、是否具备图像生成、代码生成能力,以及上传知识文档加强专业能力。 现场只进行了3轮和GPT Builder的对话,就构建好了一个Startup Menter。 用户可以设置这个GPT是仅自己可用,还是能和他人共享。 由此企业可以构建一个仅限内部使用的GPT。本周三企业用户就能使用GPTs了。 同时OpenAI强调,他们已经构建了新系统来筛查监管这些自定义GPT,以防出现有害GPT。...
《GPT-4助力在线教育:高中化学教学设计与人工智能助手的探索》
AI创业助手

《GPT-4助力在线教育:高中化学教学设计与人工智能助手的探索》

本文介绍了两位职场人士如何利用美国人工智能研究实验室OpenAI的最新一代语言模型GPT-4提升工作效率的故事。他们分别从事在线教育和零售行业的数字化解决方案,通过将客户信息、产品介绍及方案范例“喂”给GPT-4,轻松获得符合基本要求的 Proposal。然而,使用GPT-4并非免费,个人用户需支付每月20美元的订阅费,且目前OpenAI不面向中国市场。因此,想要利用AI提高工作效率的上班族,只能选择寻找国产AI代替或通过AI“中介”。