互联网资讯 / 人工智能 · 2024年1月26日 0

邝子平:新一代人工智能将颠覆搜索、教育等领域

中国发展高层论坛2023年年会在北京钓鱼台国宾馆召开。启明创投创始主管合伙人邝子平出席经济峰会《人工智能引领新产业革命》分组会。

邝子平在演讲中指出,大模型的规模有了巨大的飞跃,预训练提升了创新的效率,通用性极强,此外,大模型能够继续学习和提高。邝子平认为,新一代人工智能将颠覆搜索、人机交互、内容生成、教育等行业。

邝子平称,“现在大模型的方向已经确定,灯塔已经很明确,我非常有信心赶上GPT3、GPT3.5是在中国是极大大概率的事情,也就是时间的问题。”

但邝子平同时亦指出,国际交流、监管和全球共识都是值得深入探讨的议题。

大家下午好!最近大家都在讲新一代人工智能,讲的都比较热闹,所以在我阐述新一轮的人工智能对我们整个产业对各方面意味着什么、我们需要考虑一些什么问题之前,我可能花2分钟时间大致说一下我们讲的新一轮人工智能到底是什么,最近这个话题很热,每碰到一个做企业的人都在跟我们说,我们在做人工智能、我们也在做大模型、我们15年前就在做大模型,这个有点太“厉害”了。

现在说的大语言模型,以ChatGPT为代表的新一代的人工智能到底在讲什么。

第一个,模型的规模比起过往是巨大的飞跃,是1750亿个参数,历史上没有过这么大的模型。由于这个模型的巨大,OpenAI又通过用这个大模型把几十个TeRabyte的数据往里面灌去做预训练,所以在处理和生成自然语言方面它有一个非常巨大的飞跃,这是一方面,几十个TeRabyte是什么意思,把美国的国会图书馆所有的文献都往里面去灌了一遍也就大概这个规模,这是模型的巨大。

第二个,预训练,预训练方面用这么大海量的数据往这个模型里面进行预训练,得出来的结果,基本上刚刚像我说的,把人类几千年的文字内容都输入进去了,因为是一个自训练,所以也不存在我们过去说这个训练的数据过多了我们需要标注等等,不存在这么一个因素,所以是预训练不需要标注的过程。

第三个,因为它是往里面去灌这些通用的人类几千年积攒下来的这些巨大的知识、巨大的文字数据,所以它的通用性极其强,以前我们也有很多优秀的人工智能企业,往往都是在一个垂直领域里面,但这次革命是它的通用性极强,因此不需要做什么调整,ChatGPT很多对话一般性的都已经能够基本解决了,当然它还开放一个API,如果企业有兴趣在那上面用更多的跟行业有关的数据做一个分析的话,他对那个行业里边的任务会做的更好。它的通用性强。

最后,它可以在这个过程中继续去学习、继续去提供。

这样一个大模型的打造需要很多顶尖人才、需要很多努力,OpenAI 2015年就开始做这个事情,每次的训练需要的价格也很昂贵,所以如果是15人的小团队跟我说也在做大模型做了N年,我们做的模型基本上能够把OpenAI打掉,这个肯定是瞎说的。

我们在讲这次的人工智能革命为什么那么根本性的会改革我们整个社会对人工智能的期待,是因为它在这些方面有巨大的变化。