文章主题:ChatGPT, GPT-4, 懒惰, AI
原标题:ChatGPT越来越懒,都学会反过来PUA人类了
机器之心报道
编辑:陈萍
OpenAI 表示自 11 月 11 日以来,他们就没有更新过模型,模型行为是不可预测的,他们正在研究如何修复。在过去的段时间里,你是否留意到 GPT-4 的表现有所下滑?如今,它似乎变得更加「消极」,时常拒绝执行某些任务,甚至直接给出简化版的結果。
这个问题得到很多网友的共鸣,纷纷开始抱怨 ChatGPT 变「懒惰」这个事实。
我注意到近期有一些用户在使用 GPT-4 或 ChatGPT API 时遇到了响应速度慢以及回答不完整的问题。在高峰时段,这些问题尤为明显,甚至有时候API会出现拒绝回答的情况。而在某些情况下,一旦出现一系列问题,对话就会突然中断。
据报道,当用户请求 GPT-4 撰写一段代码时,可能会遇到相关问题。GPT-4 并非单纯地提供代码,而是给予一定的指导与信息,促使用户自行完成剩余部分。偶尔,GPT-4 也会鼓励用户采取自主行动,尝试亲自动手实现目标。
GPT-4变「懒惰」一些示例展示
GPT正在变得越来越不愿意执行那些枯燥无味的任务。它本质上会为你提供一部分答案,然后暗示你接下来的步骤。试想一下,当你提出一个查询时,它的数据库只返回了前10行信息。Summit的创始人Matthew Wensing对此感到十分沮丧,因为他主要关注的是销售和营销领域。
「让它扩展一些代码,生成的代码要求达到 50 行,它让我自己去做。」
有时 ChatGPT 受够了网友的请求,最后直接来了个「白眼」,让你自己体会。
「现在的 ChatGPT 无法帮助用户处理代码脚本。」
沃顿商学院的Ethan Mollick教授在近期的一项研究中,对GPT-4的表现进行了深入分析。他认为,尽管GPT-4拥有丰富的知识储备,但在实际应用中,其表现出了一定的“懒惰性”。具体来说,GPT-4在面对用户提出的问题时,更倾向于提供解决问题的方法,而非直接给出具体的解决方案。此外,GPT-4在处理编程任务时,也表现得相当“热情”,更愿意向用户提供关于如何修复代码的建议,而非直接修正代码。
接下来,Mollick教授补充道:“同样地,我们并未发现GPT-4在任何情况下变得更愚蠢,这可能仅仅是系统负载的一个短暂问题(比如OpenAI现在将DALL-E 3的图片响应从4张减少至1张)。然而,在以下几个方面,GPT-4的行为确实发生了变化:系统在没有刺激的情况下愿意采取的行动数量。”
Reddit 上近期出现了一则备受关注的帖子,题为《ChatGPT 已经变得非常懒惰》。该用户表示,他们向 ChatGPT 提出了一个请求——让其填写一份包含多个条目的 CSV 文件,然而 ChatGPT 却予以拒绝,并给出了一种解决方案。据其解释,这是因为涉及的数据范围极为广泛,因此提取整个产品的信息显得繁琐。然而,ChatGPT 仍能提供一个包含特定条目的模板文件,以便用户根据需求自行填写其余数据。
原内容表达存在情感色彩过于强烈、语言过于口语化等问题,以下是我重新组织的内容:当看到这个回答时,发帖人的情绪显然是被激怒了。他质问道:“这就是人工智能应有的表现吗?一个狂妄自大、懒散无用的机器人,让我自己来进行这种工作?”
鉴于 ChatGPT 现在的表现,网友开始纷纷怀念以前的 GPT-4 了。
OpenAI 承认了,但不确定是什么原因造成的
有些人开始猜测是因为 OpenAI 合并模型、同时运行 GPT-4 和 GPT-4 Turbo 导致服务器持续过载、公司试图通过限制结果来节省资金等造成的。
众所周知,OpenAI 的运营成本极其昂贵,今年 4 月,研究人员表示,每天需要花费 70 万美元,即每次查询花费 36 美分,才能维持 ChatGPT 的运行。根据行业分析师当时的说法,OpenAI 必须将其 GPU 群扩大至 30000 台,才能在今年剩余时间内保持其商业性能。除了为其所有合作伙伴提供计算之外,OpenAI 还需要支持 ChatGPT 其他流程。
对于这个问题,ChatGPT 官方账户发布了推文,OpenAI 承认了这个问题,但不确定是什么原因造成的。「我们已收到您关于 GPT4 变得更加懒惰的所有反馈!自 11 月 11 日以来我们就没有更新过模型,这当然不是故意的。模型行为可能是不可预测的,我们正在研究修复它。」
简而言之,OpenAI 表示他们最近没有对 ChatGPT 或 GPT-4 进行任何会使其变得更加懒惰的更改。事实上,自 11 月 11 日以来,没有任何变化。但他们解释说,模型本身「可能是不可预测的」,他们正在寻求解决的问题。
12 月初,OpenAI 员工 Will Depue 在 X 中也证实了,OpenAI 已注意到有关 ChatGPT 变懒惰的报告,正在研究潜在的修复方案。
从他的回答中我们可以看出 ChatGPT 确实存在过度拒绝用户问题以及其他奇怪的行为(例如最近的懒惰问题),但这些都是不断服务和尝试支持众多用例过程中的迭代产物。他指出,当 ChatGPT 的某些部分显著改进时,这些改进通常不会被广泛注意到。相反,当模型的某些部分偶尔出现退化时,这些问题就会变得非常明显。尽管存在一些问题,如过度拒绝和偶尔的性能退化,但这些都是改进过程中的一部分。OpenAI 鼓励提供具体反馈以帮助快速解决这些问题。
在等待 GPT-4 性能稳定的同时,用户们互相打趣,「接下来你就会知道它会『请病假』。」
参考链接:
https://twitter.com/ChatGPTapp/status/1732979491071549792
https://arstechnica.com/information-technology/2023/12/is-chatgpt-becoming-lazier-because-its-december-people-run-tests-to-find-out/
https://www.digitaltrends.com/computing/heres-why-people-are-saying-gpt-4-is-getting-lazy/返回搜狐,查看更多
责任编辑:
ChatGPT, GPT-4, 懒惰, AI
AI时代,拥有个人微信机器人AI助手!AI时代不落人后!
免费ChatGPT问答,办公、写作、生活好得力助手!
搜索微信号aigc666aigc999或上边扫码,即可拥有个人AI助手!