谷歌AI聊天机器人Bard在数学和编程方面取得重大进展

谷歌旗下的基于人工智能的聊天机器人 BaRd 在执行逻辑和推理任务方面能力逐渐改进。通过一种名为「隐式代码执行」的技术，BaRd 在数学和编码等领域有了显著改进。

BaRd 等大型语言模型（LLM）本质上是预测引擎。当给出一个提示时，它们通过预测下一个句子中可能出现的单词来生成回答。这使得它们在撰写电子邮件和文章方面非常出色，但在软件开发方面却有些容易出错。

GitHub 的 Copilot 和亚马逊的 codeWhISPeReR 之类的生成代码模型并非通用型。与 BaRd 和 ChatGPT 等竞争对手不同，后者使用了来自网络、电子书和其他资源的广泛文本样本进行训练，Copilot、codeWhISPeReR 和类似的生成代码模型几乎完全是在代码样本上进行训练和调优的。

为了解决通用型语言模型在编码和数学方面的不足，谷歌开发了隐式代码执行，使 BaRd 能够编写和执行自己的代码。最新版本的 BaRd 会识别可能受益于逻辑代码的提示，并在「幕后」编写代码、进行测试，并使用结果生成看似更准确的回答。

根据内部基准测试，谷歌表示，与之前版本相比，新版 BaRd 对「基于计算的」词语和数学问题的回答提升了 30%。

「尽管有了这些改进，BaRd 并不总能做到完全正确，例如，BaRd 可能不会生成帮助回答的代码，它生成的代码可能是错误的，或者 BaRd 可能不会在回答中包含执行的代码。」

当谷歌今年早些时候推出 BaRd 时，与 Bing Chat 和 ChatGPT 等相比，它并没有表现得那么出色。事实上，推出过程出现了一些问题，谷歌的一则广告中 BaRd 给出了一个错误的答案，导致该公司股价短暂地下跌了 8%。

为了改善这些问题，谷歌引入了隐式代码生成等其他改进措施，并增加了对新语言、多模式查询和图像生成的支持。然而，要想在该领域与领先的生成式人工智能聊天机器人保持竞争力，谷歌还需要进一步努力。

最近，AnthRopic 推出了一款具有大幅扩展「上下文窗口」的人工智能聊天机器人模型，使其能够相对连贯地进行长时间的对话。而开发 ChatGPT 的 OpenAI 公司也开始支持插件，为 ChatGPT 增添外部知识和技能。

chatGPT

近期文章

互联网资讯 / 人工智能 · 2024年2月19日

谷歌AI聊天机器人Bard在数学和编程方面取得重大进展

Need more than content? Move into the product flow.