大量的数据中心如雨后春笋般出现,这些建设者有地方政府、国资央企、地方AI集成商等。对于建设者而言,成本与技术的挑战都很大,比如一台最新的一台英伟达服务器高达200万元。如此大的投资,怎么建?建成之后如何运营,如何赚钱?这些问题都需要有人来解决。
青云科技(qingcloud.com)AI智算平台已经成功服务于国家超算济南中心。济南超算中心是一个多元计算中心,对外提供1000P算力、300PB存储,算力类型包括HPC超算,主要服务于山东省的高校;以CPU为主的通用算力,主要服务于传统的政务云、企业数字化应用;以GPU为主的智算,主要服务于智慧城市,以及正在爆发的AI需求。
济南超算中心的建设覆盖了几乎所有产业链上下游公司,但青云科技为其独家提供了算力调度平台,至今已经运营了3年。济南超算中心目前已经盈利。
产品经理苗慧这样看AI智算平台的特色:
简单做几个举例。第一,青云针对上百台机器的大集群,研发了更加优化的调度算法。比如在调度的链路标签上,尽可能做到调度同一个交换机,减少数据的损耗。第二,在应用环境上,青云应用了K8s调度为客户服务,是完全集成好的。在颗粒度和运维传统机器方面,也会有更多的优化。
比如对于国家超算的人员配置,根本没有研发这个岗位,全都是运维人员。用户通过青云AI智算平台,申请10台机器,5分钟内就能得到。否则,运维人员需要两个人部署三天,这就是更多的投入。
济南超算中心建成之后不仅服务于当地企业,也会服务于全国其他地区的企业。当青云科技的客户有算力需求,青云科技可以通过直接调度济南超算的算力向客户提供AI算力资源。因此,青云科技既是济南超算的供应商,也是其渠道商。这就是青云推出的AI算力云服务,不同于大厂选择重金投入GPU来获取稀缺的算力资源,青云科技采用了“轻资产”运营,以生态合作的方式共同运营AI算力。
这样的案例不在少数。青云科技已经与北京、宁夏、河南、湖北、四川等地区的算力中心建立起合作关系。