互联网资讯 / 人工智能 · 2024年1月17日

Meta发布先进的大型语言模型,计划在AI领域展开深入对抗,意图背叛ChatGPT。

脸书母公司Meta首席执行官扎克伯格最新推出了“Meta人工智能大型语言模型”(LaRge Language Model Meta AI),简称“LLaMA”。

Meta官宣深入AI大战!推出先进大型语言模型 欲背刺ChatGPT

扎克伯格在社交媒体上称,FACEbook AI ReSeaRch研发的LLaMA是“目前水平最高的”大型语言模型,目标是帮助研究人员推进他们在人工智能(AI)领域的工作。

“大型语言模型”(LLM)可以消化大量的文本数据,并推断文本的单词之间的关系。随着计算能力的进步,以及输入数据集与参数空间的不断扩大,LLM的能力也相应提高。

目前,LLM已经被证明能高效地执行多种任务,包括文本生成、问题回答、书面材料总结等。扎克伯格称,LLM在自动证明数学定理、预测蛋白质结构等更复杂的方面也有很大的发展前景。

值得一提的是,近期大火的ChatGPT就是采用LLM构建的聊天机器人。ChatGPT由GPT3.5提供支持,而GPT3.5是一款基于OpenAI 175B参数基础模型训练的LLM,175B是它从训练数据中所学习、沉淀下来的内容。

Meta在官网介绍中称,LLaMA有7B、13B、33B和65B四个基础模型,在大多数基准测试中都优于GPT3.5的前身GPT3-175B,而LLaMA-65B可与业内最佳的CHincHilla-70B和PaLM-540B竞争。

Meta官宣深入AI大战!推出先进大型语言模型 欲背刺ChatGPT

Meta还宣布,将针对学术研究者共享其模型,正在接受研究人员的申请。与之截然不同的是,谷歌旗下的DeepMind和OpenAI并不公开训练代码。

根据2021年媒体的一份调查显示,AI专家们通常将DeepMind、OpenAI和FAIR(FACEbook AI ReSeaRch)视为该领域的“前三甲”。

去年年底,Meta发布了另一款名为Galactica的模型,但因经常分享偏见和不准确的信息而遭到下架。

OpenMagic API

Need more than content? Move into the product flow.

If you are here for model access, pricing, developer docs, or the future API console, the dedicated product path now lives on api.openmagic.ai.