互联网资讯 / 人工智能 · 2024年2月19日

谷歌AI聊天机器人Bard在数学和编程方面取得重大进展

谷歌旗下的基于人工智能的聊天机器人 BaRd 在执行逻辑和推理任务方面能力逐渐改进。通过一种名为「隐式代码执行」的技术,BaRd 在数学和编码等领域有了显著改进。

BaRd 等大型语言模型(LLM)本质上是预测引擎。当给出一个提示时,它们通过预测下一个句子中可能出现的单词来生成回答。这使得它们在撰写电子邮件和文章方面非常出色,但在软件开发方面却有些容易出错。

GitHub 的 Copilot 和亚马逊的 codeWhISPeReR 之类的生成代码模型并非通用型。与 BaRd 和 ChatGPT 等竞争对手不同,后者使用了来自网络、电子书和其他资源的广泛文本样本进行训练,Copilot、codeWhISPeReR 和类似的生成代码模型几乎完全是在代码样本上进行训练和调优的。

为了解决通用型语言模型在编码和数学方面的不足,谷歌开发了隐式代码执行,使 BaRd 能够编写和执行自己的代码。最新版本的 BaRd 会识别可能受益于逻辑代码的提示,并在「幕后」编写代码、进行测试,并使用结果生成看似更准确的回答。

根据内部基准测试,谷歌表示,与之前版本相比,新版 BaRd 对「基于计算的」词语和数学问题的回答提升了 30%。

「尽管有了这些改进,BaRd 并不总能做到完全正确,例如,BaRd 可能不会生成帮助回答的代码,它生成的代码可能是错误的,或者 BaRd 可能不会在回答中包含执行的代码。」

当谷歌今年早些时候推出 BaRd 时,与 Bing Chat 和 ChatGPT 等相比,它并没有表现得那么出色。事实上,推出过程出现了一些问题,谷歌的一则广告中 BaRd 给出了一个错误的答案,导致该公司股价短暂地下跌了 8%。

为了改善这些问题,谷歌引入了隐式代码生成等其他改进措施,并增加了对新语言、多模式查询和图像生成的支持。然而,要想在该领域与领先的生成式人工智能聊天机器人保持竞争力,谷歌还需要进一步努力。

最近,AnthRopic 推出了一款具有大幅扩展「上下文窗口」的人工智能聊天机器人模型,使其能够相对连贯地进行长时间的对话。而开发 ChatGPT 的 OpenAI 公司也开始支持插件,为 ChatGPT 增添外部知识和技能。

OpenMagic API

Need more than content? Move into the product flow.

If you are here for model access, pricing, developer docs, or the future API console, the dedicated product path now lives on api.openmagic.ai.

登录免费注册