人工智能 · 2024年2月16日 0

中国如何将理想转化为现实,快速实现人工智能算力网络?

文|智能相对论

作者|曾响铃

2021年5月底,国家发展改革委、中央网信办、工业和信息化部、国家能源局共同印发了《全国一体化大数据中心协同创新体系算力枢纽实施方案》,在这个方案中,关于算力资源的统筹协同发展在宏观层面定下了调,一个未来网络新愿景浮现出来;

仅仅时隔四个月,在刚刚举办的华为全联接2021上,中国科学技术信息研究所、AITISA(新一代人工智能产业技术创新战略联盟)、鹏城实验室联合发布了《人工智能计算中心发展白皮书2.0——从人工智能计算中心走向人工智能算力网络》,这个未来网络新愿景完成了宏观的构想与路线图设计,开始迈出步子付诸实践。

人工智能算力网络,正在成为“新基建”浪潮中最大的浪头之一,驱动中国AI产业发展进入史诗级加速进程,让智能社会这一人工智能发展的终极目标离得更近。在这个过程中,中国在发展AI产业方面的独特优势也展现得淋漓尽致。

关于算力的答案一步步“升维”,人工智能算力网络的出现是一种必然

要理解人工智能算力网络究竟是什么、为什么会出现,还要从产业对算力需求不断满足的进程看起。

阶段一:基础软硬件创新

一开始,专门针对AI计算的基础软硬件大发展,这包括专门的芯片产品(如NPU)推出,或者更进一步的,底层计算架构创新基础上的异构计算(例如昇腾AI),这些在本地或云端为AI提供相对于过去更充沛的算力。

阶段二:人工智能计算中心建设

然后,随着AI产业的进一步发展,在更强烈的算力需求面前,即便是有基础软硬件的创新,单一企业在部署或采购算力时,也会面临算力资源紧缺或价格高昂的难题。

于是,在那些有AI产业集群的地方,由政府主导建设的人工智能计算中心开始出现,通过集约化的方式为企业提供相对更合理的算力价格与更灵活的供给方式,最典型如已经落地的深圳鹏城云脑II和武*工智能计算中心,在昇腾AI加持下,其算力资源都在满负荷运行,可见需求之旺盛。

同时发生的,还有人工智能计算中心的产业化布局。

与同样集约化部署的超算中心只要单纯服务好科研不同,人工智能计算中心带有产业使命,要帮助智慧城市、智慧金融、智能制造、智慧交通等产业的发展,单纯的算力还需要与产业发展协同,所以,地方政府建设人工智能计算中心,已经形成了一中心四平台的格局:依托人工智能计算中心,打造了公共算力服务平台(普惠算力)、行业应用创新孵化平台(打造AI应用示范标杆)、产业聚合发展平台(推动AI产业集约化发展)以及科研创新和人才培养平台。

阶段三:人工智能算力网络

在包括人工智能计算中心在内的算力基础设施不断发展后,新的问题冒了出来:

不同区域的AI算力也有自己的波峰波谷,且在更充沛算力基础上发展的AI大模型对算力的使用又是阶段性、高密度的,自然而然,业界人士就开始思考跨区域调配算力资源的问题,把各地人工智能计算中心之间算力网络互连,实现资源共享、协同调度。

于是,人工智能算力网络应运而生,它用新型网络技术将各地分布的人工智能计算中心节点连接起来,在区域内感知、分配、调度人工智能算力,根据各中心算力资源的情况和各地区的需求情况进行算力动态调配。

考虑到当前人工智能计算中心的发展实际和中国区域经济状况,未来人工智能算力网络在具体互联方式上,或可以参照有关专家提出的“三加一”政策:依托长三角、粤港澳大湾区、京津冀、成渝经济圈等区域的互联建设,循序渐进。

值得一提的是,除了算力,通过人工智能算力网络,数据、算法资源也在全国范围内汇聚与融合,“一网络,三汇聚”的价值构想也在白皮书中提出,简单说就是:

一网络,即人工智能算力网络;

算力汇聚,即节点高速互联、统一管理与运维;

数据汇聚,即实现不同节点公共数据资源的安全开放,建设高质量人工智能公共数据集;

生态汇聚,即不同节点的大模型能力开放与应用创新成果共享,其目的是为了强化跨区域科研和产业协作。

可以看到,从基础软硬件创新到人工智能算力网络,一步步走下来,算力资源供给越来越充足,且算力与算法、数据的协同,与产业的融合也越来越紧密。当然,这三个阶段并没有严格的时间先后顺序,目前也在同时进行当中。

为什么只有中国能建设好人工智能算力网络?

人工智能算力网络的出现是产业需求发展的一种必然,只不过,这种必然只可能发生在中国,它是中国独特的AI技术与产业发展现实所决定,也是独属于中国的优势所在。

其原因,至少包括四个方面:

1、新基建同步发展的大背景

一方面,人工智能算力网络本身作为一种新型基础设施而存在,另一方面,它的背后还需要更底层的新型基础设施建设来支撑。

例如,不同节点算力的统筹,需要能够支撑海量数据的传输与接入的通信网络,按照规划,在其落地过程中的未来十年,宽带要实现从千兆到百G的跨越,而IP等资源要支撑百倍的容量提升。此外,还需要强大的边缘计算软硬件基础设施来实现中心+边缘分布式的算力模式实现百倍容量的增长。

而从人工智能算力网络到产业应用,这个过程中也需要大量新基建,从出产算力到最终用上、用好算力,没有一个很好的新基建底子是无法落地的。

而中国的新基建从宏观政策到具体落地已经在轰轰烈烈进行当中,人工智能基础设施被明确成为新基建的核心任务,在政策层面也是支撑科技自立自强和数字经济发展的基础设施,5G、wifi6、IPv6等技术正在广泛普及,这在全球范围内是独一无二的。

2、“节点”本身的快速发展

从人工智能算力网络的形成可以发现,这是一个宏观层面的统筹规划,其实现过程并不是从一无所有到全面具备的建设过程,人工智能计算中心“节点”成为核心资源,如果不具备大量的“节点”或者无法推动“节点”的快速建设和落地,人工智能算力网络只能是空中楼阁。

这也是为什么关于人工智能算力网络的讨论也有很多了,但能付诸行动的却几乎没有。

而在中国,人工智能计算中心早已是国务院《新一代人工智能发展规划》“建设高效能计算基础设施”的落地实体。到目前为止,在地方政府主导建设、华为等科技企业的参与下,深圳、武汉、西安等城市均已建成人工智能计算中心并投入运营,成都、中原等人工智能计算中心正在建设中,此外还有北京、南京等地的人工智能计算中心建设也陆续规划中。

这些只有在中国才出现的密集的节点,推动着人工智能算力网络快速落地。

3、产业集群化发展的需求汇聚

没有庞大需求的支撑,或者市场上存在的需求无法对接起来将算力有效“供给”出去,人工智能算力网络就无法落地,或者说,落地的过程本身就是一种资源和精力的浪费。

这时候,中国社会经济发展过程中独有的产业集群化发展路径的价值显露出来。

一方面,由于各地AI产业的发展都以集群化的方式进行,需求庞大而集中,将地区有效的需求都汇聚起来,可以实现供与需的充分对接;

另一方面,产业集群需求的庞大,使得各地一般都会存在属于自己的算力波峰波谷,在人工智能算力网络下,有效的算力供给需求总能在本地或跨区域找到恰当的使用者。

这使得人工智能算力网络可以做到“物尽其用”,最大化价值落地而远离“屠龙之术”,形成良性发展。

最终,人工智能算力网络的高效率运行,又将推动全国各个产业集群得到高速发展,一个正反馈循环就此形成。

4、具备突围内驱力的科技企业在努力

进一步往落地的细节看,人工智能算力网络需要大量技术创新来支撑,例如,仅在算力网络的一体化标准方面,就要完成算力网络架构及接口、应用及算力感知研究、算力需求量化与建模研究、算网资源可信与协同等标准的建设。

这些实打实的技术如果不突破,就会成为木桶的短板,严重影响人工智能算力网络的算力和产业推进效果。

但是,由于人工智能算力网络本身就是全新的事物,很多匹配技术也都是全新的,在全球范围内很难找到可参照的对象。这时候,在特殊复杂的局势下具备自主创新内驱力的中国科技企业,将更愿意在这些技术上进行投入,这是赶超世界、树立技术话语权的重要机会。

从技术创新、产业推进到科技高地,人工智能算力网络的价值凸显

手握利剑,人工智能算力网络到底能起到什么作用,答案有太多难以详述,但至少,有三个方面的价值是一定的。

首先,是对突破性技术创新的大力支持。

这方面,多模态大模型是典型。作为面向未来强人工智能、通用人工智能的重要技术创新,多模态大模型已经在人工智能领域提出了很多年,业界也有不少技术突破,但是,多模态大模型进一步往下走,算力需求呈几何式上升,一般的算力基础设施很快将难以胜任。

从图像、文字