互联网资讯 / 人工智能 · 2024年1月29日

全村寄望于阿里云

据可靠消息,阿里云一个月之后,会发布人工智能大模型的相关产品,具体的落地场景将会揭晓。

视线再回到本周初阿里史无前例的架构调整,我们就会发现:张勇之心,路人皆知。

ChatGPT带来了人工智能行业的确定性,目前整个互联网行业必然要洗牌。阿里云有模型,有算力,有钱,还有场景。商业逻辑的要素齐全了,张勇不亲自盯,谁来盯?

而且,GPT一出,阿里云事关整个阿里的未来。如果说1+6+N的背后,是张勇的生态野心,那么阿里云必定是张勇最核心的押注。

GPT未来已来,BAT、字节和华为均已入场,张勇胜算几何?

01模型和算力

ChatGPT大概率要重新把今天的科技公司洗礼一遍,就像当年苹果用iphone洗礼大家一样,上一次我们迎来了移动互联网时代,这一次我们将迎来人工智能时代。

百度、360等公司已经发布了国产相关产品,科大讯飞等公司也在排队,但是这些也许都是前菜。中国三家最有实力的公司,还没下场,腾讯、阿里、字节。腾讯据我所知,马化腾亲自在盯这个业务,阿里巴巴在低调研发,很快会有产品,字节目前大概率精力并不在此。

人工智能技术的核心是模型和算力。

这一块,我用更通俗的语言来概述一下。

第一,模型就是思维模式。

最终有开发能力的大厂,模型都会趋同。因为底层逻辑一样,就像一个个人,最终大脑的思维模型都差不多,天才和蠢材的智商差距其实也没有太大,基本的吃喝拉撒和认知处理,都没问题。

所以,我特别讨厌吹模型的公司。因为模型本质上并不神秘,有一家公司突破了,其他玩家立刻就学会了,中国公司最擅长的就是从1到100。

模型方面的阻力,通过人才的流动以及目前公开的基础逻辑论文,都可以通过时间来解决,这个事情百度之前已经实践过了。

模型这一块,阿里对行业还是有贡献的。

2022年9月,阿里推出“通义”大模型系列,通用大模型分为三层:模型底座层、通用模型层和行业模型层。在云栖大会上,阿里推出了AI模型魔搭社区,有300多个优质AI模型,其中百亿参数以上的大模型超过10个。通过魔达社区,没有开发者基于阿里的AI模型做开发,把AI变成生产力。

第二,算力的核心竞争力。

大脑的认知以及模型,都是靠我们的信息处理速度来决定的。算力最终决定了每一套模型的学习速度和迭代速度,这没什么好争议的。但是算力的核心是物理芯片,这一块谁能拿到更多速度最快的芯片,谁的优势就大。英伟达的黄仁勋现在为何能穿着皮夹克到处得瑟?因为他有最快的芯片。

目前,阿里云在国内的算力储备,是值得所有AI玩家深思的一件事情,在高端算力目前进口受阻的情况下,原本的算力储备就显得很关键了。

阿里云在算力储备这一块,就不用赘述了。从云计算市场的份额以及此前公布的智算市场数据,就可以得出结论。

智能算力这一块,阿里云也是第一名。根据阿里对外的数据,阿里巴巴达摩院多模态大模型M6参数已到10万亿,是全球最大的AI预训练模型。作为对比,ChatGPT3的参数是1750亿,4.0的参数还未公布。 这个10万亿的大模型,M6使用512GPU 在10天内就训练出来了。

而且它还省电。10天内完成10万亿参数模型训练,能耗只有GPT-3同等情况的1%。

不要小瞧省电这个事,GPT千好万好,就是费电耗能源,而且很有挑战性,省电这一点很重要。

02阿里也有技术?

阿里除了会卖货和搞营销之外,还懂技术?

由于阿里巴巴创始人马云非技术出生的背景,导致大部分人会认为,阿里巴巴是一家只会卖货和营销的公司。我曾经一度也认为阿里的技术不行,甚至没有技术,或者都是吹的。但是后来亲身下场创业做智慧零售的时候才发现,阿里原来在开源这一块下了很大功夫,并且值得尊重。

在全球最知名的技术分享平台GitHub上,中国区企业活跃度和影响力排名上,阿里巴巴长期占据第一位置。在全球范围内,阿里巴巴目前也排名第六,GitHub在行业的地位,懂得都懂,不懂的自己去科普。

我对于阿里技术的深度研究,源于它的微服务架构double。当时我们的软件技术总监坚持要用这套系统,放弃了通用性更好的spRing cloud。原因就是在高并发的零售业务中,用double来做架构,稳定性更好。而这套架构就是阿里巴巴开发的,虽然几经波折中间断更过,但是最终还是挺了下来。

架构在软件行业的重要性,就相当于建筑学中的结构。一座房子稳不稳定,美不美观,科不科学,都要靠这个结构,这一块的国产化是非常重要的。

然后就是注册中心的国产化。阿里推出了nacos,使用了Raft协议,nacos的集群一致性非常好,功能丰富,社区活跃,最重要有中英文档。

另外,在软件行业中最核心的数据库这一块,阿里巴巴和蚂蚁共同研发的公有云分布式数据库OceanBase也取得了很大的进展。目前支付宝的核心业务数据库,应该就是由它在完成,很多国内银行和保险公司也在适用这一套国产数据库。

阿里云后来又弄了一套独立的数据库,PolaRDB。存储和计算分离,又有软硬结合的优势,对于应对高并发的抗压能力更强。

数据库的国产化是数据安全的一个核心环节。

上述的三项国产突破,都是我亲自体验过的东西。这三块市场本来都是欧美技术为完全的主导,国产插不上话。其实其他几家大厂也推出过类似产品,但是普及度很低,甚至自己公司都不用。真正有一定市场普及度的目前来看只有阿里,虽然也是举步维艰。

此外,阿里还整出了飞天云操作系统、倚天云芯片、磐久服务器、神龙架构、龙蜥操作系统、阿里灵杰等等一系列技术产品,我都没用过,我就不评价了。

如果,你去问一问中国的全栈软件工程师或者后端工程师,国内的软件开源领域,哪家互联网公司的贡献度与技术最优秀,大概率他会告诉你,是阿里,这已经是行业的共识。

03确定性与不确定性

如果我们仔细去追溯阿里这些技术的源头,你会发现一个非常有意思的事情,阿里所有软件和硬件上的技术突破,都来自双11,被逼出来的。

双11每一年指数型的交易增长,给阿里整个交付系统带来了巨大的倒逼效应。超高并发的业务特点,一不小心整个系统就会宕机,用传统的解决方案肯定解决不了这些问题。国外的架构没有这种超大并发的场景,中国巨大的消费市场活生生逼出了一个全球最抗压的解决方案。

阿里的技术中,确定性就是稳定,这种稳定包括模型和算力。

我之前听很多小道消息说,达摩院已经在做ChatGPT类似的产品布局,而且在四五月份就会发布出来。这个消息我不确定真假,但是以目前阿里的人才储备来看,是有能力在短时间内把模型搞出来的。

说起阿里的GPT架构,还有个小插曲。阿里做大模型开发,和OpenAI一样,都是采用TRansfoRMeR架构,但是分支走得不一样。阿里最早用的是BERT,但后来发现,OpenAI的自回归路线更有效,于是也调转枪头转向自回归。

但是,这个模型会不会比现在百度的好用,我不好判断。毕竟百度在人工智能模型上的持续性投入时间更多,消耗掉的资源和金钱也更多。

在搜索时代,阿里百度水火不容。毫无疑问,这次的GPT,阿里和百度还会有一次交火。

去年阿里云推出过全栈智能计算解决方案“飞天智算平台”,并且启动张北和乌兰察布两座超大规模智算中心。其中张北总建设规模是12EFLOPS的AI算力,超过谷歌的9EFLOPS和特斯拉的1.8EFLOPS,是全球最大的智算中心。

小鹏汽车已经开始用阿里的智算平台了,小鹏“扶摇”系统,是国内最大的自动驾驶智算中心。小鹏发布的新车P7i,用的是全新的语音系统,没有唤醒词,非常好用,靠的就是扶摇系统。

另外,人工智能是需要喂料的,这块阿里也是有优势的。天猫、淘宝的访问量极大。另外,天猫精灵家庭用户超过4000万,月交互次数超过80亿。对于阿里来说,这些都是非常优质的数据。

阿里接下来的产品,应用场景值得期待。

04花钱与赚钱以及安全

人工智能带来的确定性机会,无疑是需要烧钱的。未来三年在这一块的跑马圈地,无疑又会是一场烧钱大战。算力的持续性投入,模型的优化,以及落地场景的探索。

所以,我之前就有过一个基本结论,这是一场巨头之间的战争,甚至是国家层面的战争。这将会决定未来整个人类社会的资源再匹配问题,因为人工智能的出现,已经不仅仅是单纯的辅助性提高劳动效率的行为,而是一种生产力结构性调整。生产力的主角可能会发生变化,生产力的纬度会发生变化,我们整个文明在提高认知这件事上,会大大加速。

这种潜在的风险,已经让我们开始意识到人类作为世界主人的危机感。于是马斯克联名一千多位美国知名人士,开始呼吁暂停GPT4以后的技术探索,人工智能技术已经走到了拐点,就快要失控。

如何确保人工智能在一个安全的环境里运行,将会是我们未来一个重要的议题。

阿里云目前的业务特点,有一个巨大的优势。

那就是阿里云和钉钉。是目前中国在中小企业中,渗透率最高的To B企业,如果面向C端用户的人工智能产品是危险的,那么人工智能工具化,帮助中小企业提高劳动生产率,将会是一个更加安全和有效的方向。

比如,更加智能的帮助企业管理,尤其在财务、人力资源、法务方面,帮助企业更好的获客,做好生意的撮合。帮助企业更合理的分配资源,尤其是物理资源。钉钉能不能通过人工智能的改造,成为企业家的人工智能秘书。阿里云能不能为企业提供自然语言对

OpenMagic API

Need more than content? Move into the product flow.

If you are here for model access, pricing, developer docs, or the future API console, the dedicated product path now lives on api.openmagic.ai.

登录免费注册