OpenAI在最新博客文章中表示,虽然大多数指标都有所改善,但GPT-4在某些任务上可能表现会更差。
最近几周,不少GPT-4用户吐槽,与之前的推理能力相比,GPT-4的性能有所下降。
有些用户在推特以及OpenAI在线开发者论坛上指出了问题,集中于逻辑变弱、更多错误回答、无法跟踪提供的信息、难以遵循指令、忘记在基本软件代码中添加括号,只能记得最近的提示等等。
一位使用GPT-4帮助他为自己的网站编写功能的开发人员写道。“目前的GPT-4令人失望。这就像开了一个月的法拉利,突然变成了一辆破旧的皮卡。我不确定我是否愿意为此付出代价。”