文章主题:ChatGPT, 图像识别, 语音识别, 人工智能
近期,ChatGPT 进行了重大升级,实现了图片和语音输入的功能。那么在这个重要的时刻,我们应该从中期待什么样的突破?关于终极 AGI 的实现,我们又还有多少路要走呢?
引言
在国庆长假即将到来之际,ChatGPT 进行了重大升级,使得用户能够通过语音或图像的形式与它进行互动。在一场校友分享会上,OpenAI 的CEO奥特曼的一句简短的发言,给众多 GPT 创业项目画上了句号。此外,强化学习领域的奠基人之一萨顿与传奇程序员卡马克联手,致力于实现通用人工智能 (AGI)。那么,终极的 AGI 距离我们还有多远呢?
一、GPT 更新了什么?
1. 会听——和 ChatGPT 语音对话
通过语音交互,用户与ChatGPT展开多轮对话,官方提供的示例为让ChatGPT讲述一个适用于睡前的故事,同时具备语音包切换功能。当前,其表现相当自然,至少“机器人声音”并不突出。
2. 会看——给 ChatGPT 发图聊天
ChatGPT 已经具备了处理图片的能力。官方提供的示例是一个用户上传了一张自行车的照片,并期望 GPT 提供降低座高方案。
当然,我们还可以将自家的剩余食材交给 GPT,让它为我们生成相关的菜谱或饮食计划;另外,我们也可以向 GPT 发送一张表格,请求它进行数据分析和处理。
二、OpenAI CEO 奥特曼说了什么?
ChatGPT 的出现标志着人工智能技术的发展迈出了重要的一步。能够听取人类的声音并理解图像的含义,不仅能够极大地提高 ChatGPT 的交互体验,同时也为人工智能领域带来了更多的应用场景。OpenAI 的 CEO 奥特曼也对此表达了赞赏,认为这是人工智能技术发展的一个重要里程碑。这一技术的进步不仅能够改变人们与机器之间的交互方式,同时也为人工智能的应用范围提供了更广阔的空间。
近期,OpenAI首席执行官埃隆·马斯克(Elon Musk)在校友会上分享了他的观点,特别警示了众多创业公司:不要过分关注用户界面(简称“套壳”),而应更注重核心功能的优化和创新。此外,他还分享了许多其他有价值的见解,具体内容简要梳理如下:
1. 为啥取名叫 ChatGPT?
就是特意取了个 ChatGPT 这样的名字,让它看起来就很像机器,避免人类对它产生感情。
2. 套壳 GPT 的都将灭亡!
当前,众多企业正努力解决 GPT 模型所存在的轻微缺陷,特别是那些仅关注用户界面优化的企业。然而,这种方法显然无法取得理想效果。因为 OpenAI 已经针对这些问题进行了有效处理,而且企业不应与 OpenAI 在迭代速度上展开竞争。在此,我们善意地提醒独立企业,只有提供真正独特且具有价值的解决方案,才能在市场中立足。
3. 看好 AI 赋能医学和教育方向
AI 诊疗(AI medical advisor):这将会体现出巨大的社会价值。
AI 陪练(AI personalized one on one tutor):为用户提供一对一量身定制的辅导。
4. GPT5/6 还会给我们带来什么变化?
奥特曼透露,GPT5/6 会具备多模态的输出能力,比目前的 GPT 有更高的可靠性和个性化定制能力。
但是一说到大模型,大多数人第一反应就是贵。那 GPT5/6 的成本和收费会不会非常恐怖呢?奥特曼表示,摩尔定律在大模型领域依然生效,目前大模型的训练成本越来越低,因此未来调用 GPT 接口的价格也会更加便宜。
三、讨论:AGI 离我们还有多远
1. OpenAI 奥特曼:目前距离 AGI 还很远
虽然 GPT 已经给 AI 领域按下了 ” 加速键 “,但是还在还没找到一个产品能让我感觉和真人在聊天。
真正的 AGI 是能够 ” 自行推理 “,而不是依赖大模型预训练的,它像真实人类那样根据学到的知识,写论文、做实验的 AI 才能是称得上是 AGI。
2. Keen Technologies:2030 年实现 AGI 可行!
近期,强化学习之父萨顿也加入了 Keen Technologies,联手传奇程序员卡马克 All in AGI。他们两人在阿尔伯塔大学机器智能研究所(Amii)特别活动表示,2030 年可以实现 AGI 的目标。而且,他们相信最终的 AGI 源代码将会是一个人就能编写的量级,可能只有区区几万行。
所以,AI 的终极形态会是什么样的呢,让我们一起拭目以待吧!
以上资料参考来源如下,侵删:
https://openai.com/blog/chatgpt-can-now-see-hear-and-speak
https://www.linkedin.com/posts/ibamasood_chatgpt-can-now-hear-see-and-speak-nervous-activity-7112087060068368384-0OXb/
https://www.amii.ca/latest-from-amii/john-carmack-and-rich-sutton-agi/
本文由 @运营老中医 原创发布于人人都是产品经理,未经许可,禁止转载
题图来自 Unsplash,基于 CC0 协议
ChatGPT, 图像识别, 语音识别, 人工智能
AI时代,拥有个人微信机器人AI助手!AI时代不落人后!
免费ChatGPT问答,办公、写作、生活好得力助手!
搜索微信号aigc666aigc999或上边扫码,即可拥有个人AI助手!