文章主题:这篇文章主要讲述了微软发布了一篇关于 GPT-4V 的测评报告,其中包含了 GPT-4V 的高级用法。报告中详细介绍了 GPT-4V 的输入模式、工作模式、提示技术以及视觉-语言能力等方面。此外, report 的作者向 GPT-4V 询问了多种问题,包括图像识别能力和多模态理解能力等。
标题:微软推出166页GPT-4V评估报告,深入探讨ChatGPT高级应用 | Hunt Good周报在人工智能领域,GPT-4V的发布引起了广泛关注。微软近日发布了166页的GPT-4V测评报告,对这款产品的性能和应用进行了深入的分析和评估。报告中涵盖了ChatGPT的高阶使用方法,为我国人工智能的研究和应用提供了宝贵的参考。这份报告由微软团队精心制作,内容详实且深入浅出,无论您是人工智能的初学者还是资深从业者,都可以从中获得丰富的知识和实践经验。报告全面地介绍了GPT-4V的算法原理、技术特点以及在实际应用中的表现,让读者对其有了全面的了解。此外,报告还重点探讨了ChatGPT的高阶使用方法,包括如何利用ChatGPT进行文本生成、对话系统构建以及智能客服等方面的应用,这些内容对于想要利用ChatGPT进行创新应用的企业和组织来说,具有极高的实用价值。总的来说,微软发布的166页GPT-4V测评报告,无论是对于人工智能的研究人员,还是对于希望利用人工智能提升工作效率的企业,都是一份非常有价值的参考资料。我们相信,随着GPT-4V的不断发展和完善,其在人工智能领域的应用将会越来越广泛,对我国的科技创新和社会经济发展也将产生深远影响。
收看最新一期的 Hunt Good 周报!
在本期内容你会看到:
6 条新鲜资讯
3 个有用工具
3 个鲜明观点
1 个有趣案例
Hunt for News|先进头条
微软、OpenAI 等 AI 巨头探索自研 AI 芯片
据路透社报道,OpenAI 正在探索制造自己的 AI 芯片,并已经评估了潜在的收购目标。
据知情人士透露,自去年起,OpenAI就开始探讨多种策略以应对其人工智能芯片的短缺问题。这些策略包括研发自主的人工智能芯片、加强与其他芯片生产商如英伟达等的合作,以及拓展供应商的多样性。
据报道,这家公司目前尚未确定是否将继续推动该项目的进展。OpenAI的首席执行官Sam Altman曾表示,将增加对AI芯片的收购已成为公司的首要任务。
他曾公开表达对GPU供应短缺的抱怨,尤其是英伟达在这个市场上的垄断地位。从Altman的角度来看,OpenAI面临着来自多方面的挑战,包括先进处理器的需求、以及硬件运行成本的持续上升。
据业内资深人士透露,OpenAI 自主研发芯片被视为一项具有重大战略意义和巨大投资的行为,其每年的成本可能达到数亿美元。然而,即便 OpenAI 对这一项目投入了大量资源,成功仍无法得到完全保证。
在人工智能领域,微软公司已经抢占了先机,其首个专门针对人工智能设计的芯片有望于下个月的开发者大会上正式亮相。相比之下,OpenAI 对于自家的AI芯片研发仍处于观望状态。
微软近期推出了一款专为训练和运行大型语言模型数据中心服务器设计的芯片,该芯片的设计思路与英伟达的GPU十分相似。据知情人士透露,微软和OpenAI的部分员工已经在悄然测试这款新的AI服务器芯片,期望借助这款自研的AI芯片,微软能在人工智能领域实现基本赶上亚马逊和谷歌的目标。尽管目前这款芯片的具体性能尚需等待下个月的实际亮相,但从微软方面的期望来看,其目标是能与英伟达的H100 GPU抗衡。
作为一家技术驱动的公司,OpenAI,尤其是其聊天机器人ChatGPT,一直处于人工智能领域的最前沿。最近,据路透社报道,OpenAI正在积极研究开发自己的AI芯片。这一举动标志着OpenAI在人工智能硬件领域的布局进一步扩大,也预示着未来人工智能技术的巨大变革。值得注意的是, sources 表示,OpenAI正在考虑自主开发AI芯片,而不是简单的合作伙伴关系。这意味着OpenAI将能够更好地控制其硬件产品的性能和设计,从而优化其在各个行业的应用效果。对于此次消息,市场反应热烈。许多分析人士认为,这是OpenAI在未来竞争中取得优势的关键一步。他们指出,拥有自主知识产权的AI芯片将使OpenAI在数据处理、算法优化等方面具有更大的灵活性,进而在提高ChatGPT等产品性能的同时,降低其对外部供应商的依赖。总之,随着人工智能技术的不断发展,OpenAI自主开发AI芯片的行动无疑将为行业带来新的机遇与挑战。我们期待OpenAI在未来能推出更多创新的产品和服务,推动人工智能技术的进步。
微软发布 166 页 GPT-4V 测评报告,高级用户必读
在此前的文章中,我们报道了 ChatGPT 迎来史诗级更新,从单纯的文字「来往」跃升到图像「来往」,实现了基于图像的分析和对话,你可以简单地将之理解为从 GPT-4 转变成了 GPT-4V(ision)。
当人们还沉浸钻研 GPT-4V 的玩法时,OpenAI 的「大东家」微软直接发布了一份长达 166 页的报告,详细地描述了该功能的测试和使用情况。
MedARC(医疗人工智能研究中心)联合创始人兼 CEO Tanishq Mathew Abraham 表示,「这篇报告将是 GPT-4V 高级用户的必读之作。」
具体来说,这份报告分为 11 个章节,囊括了论文概览、GPT-4V 的输入模式、GPT-4V 的工作模式和提示技术、视觉-语言能力、与人类的互动:视觉参考提示、时间和视频理解、视觉推理与智商测试、情商测验、新兴应用亮点、基于 LLM 的智能体等方面的研究。
测试的方法也很简单,通过输入 Prompt(提示词),报告的作者向 GPT-4V 询问问题即可。
例如,报告作者输入一张联合国徽章的照片,并要求 GPT-4V 编写 svg 代码生成联合国徽章照片,但遗憾的是,最终的生成效果谈不上多好,甚至有点糟糕。
当然,上面的例子只是极个别例子,实际上,纵观整篇报告, GPT-4V 在逻辑推理能力,图像识别能力,多模态理解能力都有不俗的表现。
例如,当报告作者「喂」给 GPT-4V 一张黄仁勋的照片时,GPT-4V 还是能够精准识别其英伟达 CEO 和联合创始人的身份和照片中的具体行为。
限于篇幅,便不一一举例,报告的链接如下,欢迎阅览
https://arxiv.org/pdf/2309.17421.pdf
Meta 向顶级创作者支付数百万美元,以使用其肖像打造 AI 角色
据 The Information 报道,Meta 向 Snoop Dogg、Tom Brady、MrBeast 和 Charli D’Amelio 等明星付费,以使用他们的肖像来塑造虚拟的 AI 角色。
据知情人士透露,对于几位顶级创作者来说,多年来每人的报酬可能高达数百万美元。
目前,这些角色主要是 Instagram、WhatsApp 和 Messenger 上基于文本的聊天机器人,不过扎克伯格表示,明年年初还将推出语音功能。
Meta 可能希望通过与知名人士合作,利用这些明星在不同平台上已经积累的庞大受众群体。
在 YouTube 和 TikTok 等平台上成名的创作者已经证明,他们可以吸引粉丝观看内容、购买产品并使用不同的服务,他们的 AI 化身或许具有相同的影响力。
https://www.theinformation.com/articles/meta-is-paying-creators-millions-for-ai-chatbots
动视暴雪的收购案迎来大结局?
据 The Verge 报道,微软计划下周完成以 687 亿美元收购动视暴雪的提议。
消息人士透露,该公司预计以 10 月 13 日星期五为截止日期,届时微软将向全世界宣布,为期 20 个月的收购动视暴雪的流程已经结束。
不过,届时微软能否如愿宣布这一消息,还要取决于英国反垄断监管机构「竞争与市场管理局」(CMA)。微软和动视暴雪日前将交易截止日期延长至 10 月 18 日,以等待与英国监管机构的谈判结果。
在动视暴雪同意将其流媒体版权出售给育碧娱乐公司后,微软上个月获得了 CMA 的初步批准。如果微软成功收购动视暴雪,这将标志着游戏行业最大的一笔交易。
https://www.theverge.com/2023/10/6/23905946/microsoft-activision-blizzard-deal-finalization-timing-cma
美国福布斯 400 强公布,马斯克位居榜首
近日,美国《福布斯》发布了美国超级富豪《福布斯 400 强》排行榜。
总体而言,美国前 400 位富豪的财富共计达到了 4.5 万亿美元(约合人民币 32.38 万亿元),追平了 2021 年创下的财富记录。
据福布斯报道,得益于 AI 驱动和科技繁荣以及股市的反弹,这些富豪的财富比前一年增加了约 5000 亿美元。
前 8 名富豪财富排名如下
有意思的是,这份《福布斯 400 强》的进入门槛可不低,净资产必须至少达到 29 亿美元,而上一年还只是 27 亿美元。
据《福布斯》报道,得益于与耐克的交易,以及出售在夏洛特黄蜂队(Charlotte Hornets)的股份,美国传奇球星迈克尔·乔丹(Michael Jordan)成为第一位登上该榜单的职业运动员。
而其他因「太穷」而无法上榜的亿万富翁包括苹果 CEO 库克(18 亿美元),Facebook COO 桑德伯格(18 亿美元)和美国前总统特朗普(26 亿美元)。
https://www.forbes.com/forbes-400/
2023 年诺贝尔奖陆续揭晓
国庆假期,除了刷屏的杭州亚运会,2023 年诺贝尔奖的「花落谁家」也同样引人瞩目。
目前已经揭晓的奖项为:
诺贝尔物理学奖授予皮埃尔·阿戈斯蒂尼 (Pierre Agostini)、费伦茨·克劳斯 (Ferenc Krausz) 和安妮·卢利尔 (Anne L’Huillier),以表彰他们「为研究物质中的电子动力学,而产生阿秒激光的实验方法」方面所作出的贡献。
诺贝尔生理学或医学奖授予匈牙利科学家 Katalin Karikó 和美国科学家 Drew Weissman,以表彰他们在核苷碱基修饰方面的发现。
诺贝尔文学奖授予挪威小说家、剧作家约恩·福瑟(Jon Fosse),以表彰他的创新戏剧和散文,为难以言喻的事物发声。
此外,诺贝尔和平奖等一众奖项也陆续揭晓中。值得注意的是,今年,每项诺贝尔奖的奖金都将增加 100 万瑞典克朗(约合人民币 65 万元),达到 1100 万瑞典克朗(约合人民币 715 万元),属于历史最高水平。
https://www.nobelprize.org/prizes/about/prize-announcement-dates/
Hunt for Tools|先进工具
Assistant with Bard :你的 AI 助理
近日,在 Made by Google 2023 的发布会上,Google 推出了 Assistant with Bard。
Assistant with Bard 是一款由生成式 AI 驱动的个人助理,结合了 Bard 聊天机器人的生成推理能力与 Assistant 的个性化帮助能力。
该工具将与 Gmail 和 Docs 等 Google 应用程序集成,你可以很轻松地与 Google Assitant 交谈,并让它帮助你执行照片创建标题、创建购物清单以及在电子邮件收件箱中查找信息等一系列操作。
Google 承诺未来几个月,Assistant with Bard 将陆续推送至 iOS 和 Android,更多具体的信息可以回看 APPSO 此前的文章。
Pixel 8 系列正式发布!这才是 Google 的 AI 杀手锏
https://www.cnet.com/tech/services-and-software/google-assistant-with-bard-puts-an-ai-chatbot-in-your-iphone-or-android/#ftag=CAD590a51e
AI 设计机器人只需要 26 秒
近日,西北大学研究人员领导的团队开发了首个能自行设计机器人的 AI。
大自然花了数十亿年的时间才进化出第一个行走的物种,而这个 AI 却能在短短的 26 秒内设计出一个成功的行走机器人。
西北大学研究人员 Sam Kriegman 表示:「我们发现了一种非常快速的人工智能驱动的设计算法,可以绕过进化的弯路,并不依赖人类的偏见。」
研究人员给予 AI 一个基本的提示,即「设计一个可在平坦表面上行走的机器人」,眨眼之间,AI 就能构筑出基础蓝图。
AI 先从一块大约肥皂大小的块状物质开始,起初这团物质只会摇晃,完全无法行走。然后 AI 会评估自己设计的效果并迅速进行迭代设计。
最后,机器人可以在原地弹跳,然后向前跳和移动。九次尝试后,AI 设计出每秒可以行走的机器人,步速约为人类的一半。
https://news.northwestern.edu/stories/2023/10/instant-evolution-ai-designs-new-robot-from-scratch-in-seconds/
亚马逊计划推出 AI 聊天机器人
据 BusinessInsider 报道,亚马逊正在改进其网站和应用程序上的搜索体验,以融入更具对话性、更深入和个性化的生成式 AI 功能。
该项目代号为「Project Nile」,旨在在亚马逊现有的搜索栏之上增加人工智能功能,实现即时产品比较、获取更多产品细节及评论,并根据用户搜索内容和个人购物数据提供推荐。
知情人士称,新的搜索原定于今年 9 月启动,但如今被延迟到明年 1 月左右,率先在美国市场推出。
AI 驱动的交互式搜索可以改善亚马逊的购物体验。此外,亚马逊还希望这些变化能够增加销售额,特别是在移动设备上。
Hunt for insights|先知 软银 CEO 孙正义:通用人工智能将在十年内超越人类智能
软银 CEO 孙正义近日在东京举行的软银世界 2023 年企业会议上公开发表讲话。
会议上,孙正义表示:「通用人工智能将在 10 年内超过人类总智能 10 倍。」
▲ 图片来自:路透社
他认为,通用人工智能将影响从运输、制药到金融、制造、物流等各个行业,而从事人工智能工作的公司和个人将成为未来 10 到 20 年的领导者。
「如果站在被抛在后面的一边,就像一条古老的、关闭的商业街,那将是令人悲伤的。」因此,孙正义呼吁日本企业应当及时「醒悟」到人工智能引领未来的愿景。
但他也指出需要解决虚假信息以及隐私和版权风险的担忧,不要因担心数据泄露和其他可能的风险而犹豫不决。
https://www.euronews.com/next/2023/10/05/ai-will-surpass-human-intelligence-in-a-decade-says-japans-leading-businessman
摩根大通 CEO 杰米·戴蒙: AI 有望消除 5 天工作制
摩根大通 CEO 杰米·戴蒙近日接受了彭博电视台的采访。在采访中,他表示摩根大通公司正在拥抱人工智能,该技术有能力大幅改善员工的生活质量。
▲ 图片来自:Getty Images
「由于技术的进步,你的孩子将活到 100 岁并且不会患癌症」杰米·戴蒙告诉记者,「从字面上看,他们可能每周工作三天半。」
据彭博社报道,咨询公司 Evident 的数据显示,2 月至 4 月期间,摩根大通招聘了超过 3500 个人工智能相关职位。
杰米·戴蒙表示,人工智能对于摩根大通未来的成功「是真实的」且「至关重要」,可以帮助提高生产力、产品设计、客户参与度和风险管理。
https://www.entrepreneur.com/business-news/jpmorgans-jamie-dimon-says-ai-leads-to-35-day-work-week/463069
人工智能可带来 10 万亿美元的生产力收益
IBM 首席执行官兼董事长 Arvind Krishna 近日在迪拜举行的世界政府峰会上表示:「未来 10 年,人工智能将为全球经济带来 10 万亿美元的贡献。」
他认为,由于人均生产率达提高,人工智能有可能改变世界经济。
「如果你考虑 GDP 增长,这可能在 10%、20% 或 30% 之间。但我们必须谨慎行事,我们必须利用技能并以正确的方式部署它。」
在阿联酋官员奥马尔·本·苏丹·阿尔·奥拉马的交谈中, Arvind Krishna 表示,到 2030 年,仅阿联酋人工智能采用率的提高就可以带来高达 2000 亿美元的生产力提升。
https://www.cnbc.com/video/2023/10/02/10-trillion-dollars-of-productivity-to-be-reaped-from-ai-says-ibm.html
Hunt for Fun|先行
漫画图片翻译神器
倘若你是资深的漫画迷,或许会因为看不懂外语漫画而懊恼,临时学一门语言又似乎性价比不高,而接下来所要介绍的漫画 AI 翻译神器或许能帮助你解决这个问题。
Manga-Image-Translator 是一个开源的漫画图片翻译器,能自动翻译漫画图像中的文本,当然普通的图片也可以,翻译完成后,将会在图片原位置替换译文。
目前该工具主要支持日语、汉语、英语和汉语,翻译速度相当快且效果还不错。
工具试用链接:https://cotrans.touhou.ai/
https://twitter.com/xiaohuggg/status/1710264008140619781
彩蛋时间
为庆祝成立 50 周年,10 位标志性建筑师利用 AI 对悉尼歌剧院进行了重新设计,你更喜欢哪一版?
#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。
| · · 返回搜狐,查看更多
责任编辑:
这篇文章主要讲述了微软发布了一篇关于 GPT-4V 的测评报告,其中包含了 GPT-4V 的高级用法。报告中详细介绍了 GPT-4V 的输入模式、工作模式、提示技术以及视觉-语言能力等方面。此外, report 的作者向 GPT-4V 询问了多种问题,包括图像识别能力和多模态理解能力等。
AI时代,拥有个人微信机器人AI助手!AI时代不落人后!
免费ChatGPT问答,办公、写作、生活好得力助手!
搜索微信号aigc666aigc999或上边扫码,即可拥有个人AI助手!