互联网资讯 · 2023年12月5日 0

秦淮数据张炳华:适应AIGC时代 数据中心必备5大能力

9月14日消息,近日,由开放数据中心委员会(ODCC)主办的“2023开放数据中心大会”在北京举行。ODCC 技术专家组主任专家、秦淮数据集团CTO张炳华在演讲中深入探讨了生成式人工智能(AIGC)时代给数据中心行业带来的挑战和机遇,以及数据中心基础设施必须具备的五大能力,并分享了关于产业变革的前沿洞察和应对行业挑战的全栈式解决方案。

秦淮数据张炳华:适应AIGC时代 数据中心必备5大能力

秦淮数据集团CTO 张炳华

AIGC风起云涌及能效要求不断提升,是影响数据中心未来发展趋势的两大核心变量。张炳华表示,随着主流CPU、GPU功耗和服务器节点功耗指数级增长,数据中心亟需进行技术创新和模式变革,要具备大规模、高算力、高弹性、高能效和智能化五大能力,才能应对人工智能大模型带来的算力供给和能耗挑战。五大能力具体是:

大规模:单个AZ(可用分区)需能提供1~5万卡GPU大规模的算力和存储资源,满足人工智能应用对数据和计算的需求,未来单个数据中心的IT容量规模将超30MW;

高算力:机柜功率密度达到21kW或更高,具备高性能的计算和数据处理能力,以支持复杂的人工智能算法和模型训练;

高弹性:分布式、全预制模块化设计,风冷、液冷等多种兼容架构,支持多种功率密度机柜场景,能够灵活地调整计算和存储资源,以适应AI应用在不同时间段的波动需求;

高能效:极简供电,极致冷却,充分利用自然资源,采用融合式数据中心全栈式解决方案,通过优化设计和运营策略,降低数据中心的能源消耗,提高能效比;

智能化:借助AI和机器学习技术,实现数据中心的自动化管理和优化,实现智能监控、智能预测、智能散热、故障智能定位,提高运营效率。

秦淮数据对算力发展的趋势有所预见,通过持续的技术研发和创新,成功打造出“磐石”模块数据中心架构。该架构包含六大系统和24个产品模块,以技术先进、灵活弹性、产品预制、按需搭建为目标,全面覆盖从建筑模型到供电、冷却等全周期业务场景。基于该框架,秦淮数据近期发布AIGC新一代数据中心全栈解决方案,包括“玄铁”智能电力模块3.0、“玄冰”磁悬浮相变冷却系统、大规模全预制数据中心技术、鲲鹏IDC运营平台四大产品,为大模型时代数据中心提供了全新的技术框架和演进路线。

此外,在大会现场,秦淮数据主持编写的《冷板液冷工程标准化及技术优化》白皮书和《新型电力系统背景下源网荷储一体化发展白皮书》正式发布。其中,《冷板液冷工程标准化及技术优化》白皮书详细介绍了冷板液冷的技术特点、标准化发展方向,提出了关于冷板组件、快速接头、冷量分配单元CDU等产品的标准制定建议,为推动冷板液冷技术在行业的充分落地起到了积极的推动作用。

该项目负责人、秦淮数据集团产品研发规划总监王舜在解读白皮书时表示,冷板液冷以往以定制化为主,不利于产品的规模性推广。希望通过此白皮书的技术普及,推动冷板液冷产品标准化,提升冷板式液冷的兼容性,加速冷板液冷系统的推广及应用,同时降低产品成本,助力规模性应用。白皮书还专门介绍了接液材料最新发展方向,并详解负压液冷、相变液冷和气-液混合技术等最前沿的冷板液冷技术。

秦淮数据创新与实践紧密结合,已经建立冷板液冷标准架构体系,实现20~30kW及以上的高密度液冷液体冷却的规模部署。在实际运营中,使用该技术的数据中心全年PUE低至1.15,WUE低至0.2,达到节能节水双赢。

面对AIGC时代的挑战,数据中心必须进行深度的技术变革和模式创新。张炳华表示,秦淮数据将积极拥抱这一变革,以全栈式解决方案帮助客户构建更高效、更绿色、更具竞争力的数据中心。