还记得 ChatGPT 推出 GPT-4 模型时,那时回覆的内容真的让人惊艳,比 GPT-3.5 好太多,不过不知道是不是 iOS 行动版推出之後,GPT-4 让 ChatGPT Plus 用户无限使用关系,国外越来越多人反应最近状况不是很好,不仅出现很多错误,其回覆品质有时候甚至还比 GPT-3.5 还差,有人也有这种感觉吗?
ChatGPT 的 GPT-4 变笨了?越来越多网友反应回答品质下降,产生很多错误代码
最近在国外 Reddit、Twitter 和 Hacker News 等网站上,陆续有用户讨论 GPT-4 品质下降的情形,像是 Hacker New 这篇有人询问「是只有我?还是说 GPT-4 品质最近明显降低了?」
他提到,现在 GPT-4 回应的速度比以前快很多,但其品质就像是 GPT-3.5++,因为它产生很多错误代码,也缺乏深度和分析,整体感觉跟以前比差很多。有一段时间他测试 phind.com 的 GPT-4 给出结果,甚至比 ChatGPT 的 GPT-4 还要好,而且可以明显感受到两这速度差异,前者较慢但更精准:
後续也很多人回覆表示也有一样感受,一位 bbotond 提到,在更新前 Logo 是黑色时,它可以很轻松解决复杂的程式码问题,并且对非程式码问题给出细腻且很高的答案。但现在它连更改一个 10 行的 CSS 都会出现缺失。他觉得现在 GPT-4 变得很笨。
而且不只一位说 GPT-4 的程式码能力变糟,超多人都这麽认为。
Nabeel S. Qureshi 在 Twitter 分享这篇文章,问有没有人也碰到,结果也不例外,同样有很多 Twitter用户反应:
这位用户某天切换到 GPT-3.5 模型後,反而更容易解决他的程式码问题:
Mickey McAllister 猜测 OpenAI 削减了 GPT-4 的处理能力,或是故意让它变得不那麽聪明。他觉得两个月前 GPT4 是世界上最伟大的写作助手,但几周前它变得非常平庸。
Maxim Fedotov 也在一两周前就注意到了,GPT-4 变糟糕多,有时候 3.5 甚至感觉更好。虽然它的确变快很多,但我不再有那种「天阿,这回应也太棒」的感受:
Reddit 这篇才刚发表没多久,这位 OxydBCN 一样觉得 GPT-4 的程式码能力变很糟糕,当它贴上有问题的程式码区块时,GPT-4 不再处理问题,而是解释这段是干嘛用的,随後提出问题,它给人有种好像忘记我们正在讨论什麽:
为此目前还没有看到 OpenAI 有任何回应,虽然大多数都是觉得 GPT-4 程式码能力变糟,但也是有一些人觉得写作、回答内容品质不再像以前那麽好。
如果你也有这种感受,那就代表你不孤单,很可能真的是 GPT-4 变笨了。
为此在 Humanloop 的报导中有提到,OpenAI 承认现在 ChatGPT 的效能不如以往,因为 GPU 短缺的缘故,有可能是这原因导致 GPT-4 的品质下降: