文章主题:ChatGPT, 图像识别, 语音识别, 人工智能

666AI工具大全,助力做AI时代先行者!

近期,ChatGPT 进行了重大升级,实现了图片和语音输入的功能。那么在这个重要的时刻,我们应该从中期待什么样的突破?关于终极 AGI 的实现,我们又还有多少路要走呢?

引言

在国庆长假即将到来之际,ChatGPT 进行了重大升级,使得用户能够通过语音或图像的形式与它进行互动。在一场校友分享会上,OpenAI 的CEO奥特曼的一句简短的发言,给众多 GPT 创业项目画上了句号。此外,强化学习领域的奠基人之一萨顿与传奇程序员卡马克联手,致力于实现通用人工智能 (AGI)。那么,终极的 AGI 距离我们还有多远呢?

一、GPT 更新了什么?

1. 会听——和 ChatGPT 语音对话

通过语音交互,用户与ChatGPT展开多轮对话,官方提供的示例为让ChatGPT讲述一个适用于睡前的故事,同时具备语音包切换功能。当前,其表现相当自然,至少“机器人声音”并不突出。

2. 会看——给 ChatGPT 发图聊天

ChatGPT 已经具备了处理图片的能力。官方提供的示例是一个用户上传了一张自行车的照片,并期望 GPT 提供降低座高方案。

当然,我们还可以将自家的剩余食材交给 GPT,让它为我们生成相关的菜谱或饮食计划;另外,我们也可以向 GPT 发送一张表格,请求它进行数据分析和处理。

二、OpenAI CEO 奥特曼说了什么?

ChatGPT 的出现标志着人工智能技术的发展迈出了重要的一步。能够听取人类的声音并理解图像的含义,不仅能够极大地提高 ChatGPT 的交互体验,同时也为人工智能领域带来了更多的应用场景。OpenAI 的 CEO 奥特曼也对此表达了赞赏,认为这是人工智能技术发展的一个重要里程碑。这一技术的进步不仅能够改变人们与机器之间的交互方式,同时也为人工智能的应用范围提供了更广阔的空间。

近期,OpenAI首席执行官埃隆·马斯克(Elon Musk)在校友会上分享了他的观点,特别警示了众多创业公司:不要过分关注用户界面(简称“套壳”),而应更注重核心功能的优化和创新。此外,他还分享了许多其他有价值的见解,具体内容简要梳理如下:

1. 为啥取名叫 ChatGPT?

就是特意取了个 ChatGPT 这样的名字,让它看起来就很像机器,避免人类对它产生感情。

2. 套壳 GPT 的都将灭亡!

当前,众多企业正努力解决 GPT 模型所存在的轻微缺陷,特别是那些仅关注用户界面优化的企业。然而,这种方法显然无法取得理想效果。因为 OpenAI 已经针对这些问题进行了有效处理,而且企业不应与 OpenAI 在迭代速度上展开竞争。在此,我们善意地提醒独立企业,只有提供真正独特且具有价值的解决方案,才能在市场中立足。

3. 看好 AI 赋能医学和教育方向

AI 诊疗(AI medical advisor):这将会体现出巨大的社会价值。

AI 陪练(AI personalized one on one tutor):为用户提供一对一量身定制的辅导。

4. GPT5/6 还会给我们带来什么变化?

奥特曼透露,GPT5/6 会具备多模态的输出能力,比目前的 GPT 有更高的可靠性和个性化定制能力。

但是一说到大模型,大多数人第一反应就是贵。那 GPT5/6 的成本和收费会不会非常恐怖呢?奥特曼表示,摩尔定律在大模型领域依然生效,目前大模型的训练成本越来越低,因此未来调用 GPT 接口的价格也会更加便宜。

三、讨论:AGI 离我们还有多远

1. OpenAI 奥特曼:目前距离 AGI 还很远

虽然 GPT 已经给 AI 领域按下了 ” 加速键 “,但是还在还没找到一个产品能让我感觉和真人在聊天。

真正的 AGI 是能够 ” 自行推理 “,而不是依赖大模型预训练的,它像真实人类那样根据学到的知识,写论文、做实验的 AI 才能是称得上是 AGI。

2. Keen Technologies:2030 年实现 AGI 可行!

近期,强化学习之父萨顿也加入了 Keen Technologies,联手传奇程序员卡马克 All in AGI。他们两人在阿尔伯塔大学机器智能研究所(Amii)特别活动表示,2030 年可以实现 AGI 的目标。而且,他们相信最终的 AGI 源代码将会是一个人就能编写的量级,可能只有区区几万行。

所以,AI 的终极形态会是什么样的呢,让我们一起拭目以待吧!

以上资料参考来源如下,侵删:

https://openai.com/blog/chatgpt-can-now-see-hear-and-speak

https://www.linkedin.com/posts/ibamasood_chatgpt-can-now-hear-see-and-speak-nervous-activity-7112087060068368384-0OXb/

https://www.amii.ca/latest-from-amii/john-carmack-and-rich-sutton-agi/

本文由 @运营老中医 原创发布于人人都是产品经理,未经许可,禁止转载

题图来自 Unsplash,基于 CC0 协议

查看原文

ChatGPT, 图像识别, 语音识别, 人工智能

《ChatGPT升级记:听觉与视觉的的双重进化》

AI时代,拥有个人微信机器人AI助手!AI时代不落人后!

免费ChatGPT问答,办公、写作、生活好得力助手!

搜索微信号aigc666aigc999或上边扫码,即可拥有个人AI助手!