互联网资讯 · 2024年2月8日 0

解决算力困局的科教研究-第四范式视角

图灵奖得主吉姆·格雷曾将科学技术发展史总结为四个范式:

第一范式是经验证据,源于对自然现象的观察和实验总结;第二范式是理论科学,对自然界某些规律做出原理性的解释;第三范式是计算科学,通过计算模型与系统模拟进行复杂过程的科学研究;第四范式是数据科学,即在实验观测、理论推演、计算仿真之后数据驱动的科学研究方式。

站在科学研究的立场上,数据驱动的研究分析无疑令人兴奋。多尺度复杂化学系统模型的建立、引力波的发现以及人类首张黑洞照片,都属于第四范式下的典型案例,越来越多的前沿领域由此开启了“新篇章”。

可对许多高校来说,数据驱动的科教研既是机遇也是挑战:“第四范式”对大算力的需求持续增长、对大数据的要求越发严苛、对知识生产的逻辑不断刷新……而能否针对新问题给出新答案,将直接影响未来教育的发展方向。

01 人才培养与算力困局

可能不少人看到过这样的新闻报道:中国人工智能人才缺口超过500万,但当前的供求比例只有1:10。

其实早在2018年的时候,教育部就印发了《高等学校人工智能创新行动计划》,并逐渐在国内掀起了开设人工智能专业的浪潮。到了2020年初,教育部再次印发了《关于“双一流”建设高校促进学科融合 加快人工智能领域研究生培养的若干意见》,呼吁构建基础理论人才与“人工智能+X”的复合型人才体系。

据不完全统计,国内已经有800多所高校开设了人工智能相关专业,逐渐从双一流高校延伸到了普通本科和高职高专,包括戴尔科技在内的企业相继和高校联合开设人工智能实践落地课程,国内围绕人工智能人才的培养体系已经初步成型。

同时也出现了一个新的问题:人工智能不是一门纯理论研究的学科,按照金字塔的形式进行梯度划分的话,理论创新人才的需求并不高,亟需的恰恰是将算法模型转化为工程路径、将人工智能与落地场景结合的应用型人才。相较于理论研究的教学方式,人工智能人才培养的焦点在于应用实践。

然而人工智能落地的第一道关卡就是算力,算力话语权的大小某种程度上决定着高校在人工智能前沿研究中的占位,以至于国外不少高校在算力基础上进行了大量投入,算力规模几乎不输于科技巨头们。

英国杜伦大学的智能NIC环境超级计算机拥有16个节点的计算集群,配备了戴尔科技的PowerEdge C6525服务器和NVIDIA ConnectX 智能网络适配器(SmartNIC),极大地提高了大规模并行代码的计算性能;密歇根大学利用戴尔PowerEdge服务器搭建了拥有13000核强大动力的Great Lakes超级计算机,正在像运营企业一样运营学术超算中心,并且施行了相当严格的日常成本控制。

国内同样意识到了一些高校所面临的算力困局。

比如《“十四五”国家信息化规划》在十项重大任务的第八项“构建普惠便捷的数字民生保障体系”中,明确提出要“提升教育信息化基础设施建设水平,构建高质量教育支撑体系”,重点从优化网络基础设施和升级校园基础设施两大方面推进,目的正是解决一些高校在算力平台上的短板。

02 算力平台的中国方案

和海外高校有所不同的是,国内很多高校需要“恶补”的不只有算力短板,还涉及到教学实训、虚拟仿真、科研创新、课程建设等等。

个中原因并不难解释。人工智能的起步可以溯源到1956年的达特茅斯会议,即便中间的两次人工智能浪潮无疾而终,但麻省理工、斯坦福、卡内基梅隆等高校纷纷在上世纪五六十年代创办了人工智能技术相关的实验室,而国内直到1990年才在清华大学成立智能技术与系统国家重点实验室。

何况国内当前的人工智能人才缺口中,主要集中在将人工智能落地到产线的数字化蓝领人才和应用人才,也是人工智能专业不断向普通本科和高职院校“下沉”的原因。正如教育部副部长孙尧的公开发言:“职业教育要瞄准数字时代的新技术和产业变革,大力培养高素质技术技能人才。”

与之相对应的一幕是:戴尔科技在与剑桥大学、杜伦大学等高校的合作中,主要集中在服务器和运维层面,在中国市场则因地制宜推出了面向教育行业全栈式的AI解决方案,涵盖基础架构层、平台层和应用层。

其中基础架构层包括戴尔PowerEdge系列AI计算服务器,比如PowerEdge T550塔式服务器、PowerEdge XE8545机架式服务器、全新PowerEdge R750xa机架式服务器等等;以及高性能数据存储产品、高速互联的数据交换网络、HPC就绪解决方案等端到端的基础架构解决方案。

值得一提的是,戴尔 PowerEdge 服务器内置 NVIDIA DPU和NVIDIA GPU,可帮助教育行业提升 AI 工作负载性能、建立零信任安全基础,拥有先进的 AI 训练、AI 推理、数据处理、数据科学和零信任安全能力。

平台层包括GPU、FPGA、CPU分布式训练在内的计算资源管理与优化库,TensorFlow、PyTorch等深度学习框架,面向GPU的AI就绪解决方案、GPU虚拟化弹性计算架构、GPU动态加速云等服务。最上层的应用层覆盖了AI+制造、AI+零售、AI+教育、AI+金融、AI+医疗等主流应用场景。

打一个比方的话,戴尔为教育行业提供的是一套功能完备的“中央厨房”,高校可以低成本将食材烹饪成佳肴,即便是一些人工智能基础设施相对薄弱的高校,也能少走很多的弯路。就像一些企业花高价钱购买的GPU,却因为I/O瓶颈拖累了整个AI流程,而全栈式的AI解决方案巧妙地避免了不必要的试错。

03 科教研融合的新范式

毕竟对于绝大多数高校而言,在科教研深度融合的背景下,拥抱人工智能的价值体现不在于过程,而是有怎样的成果。

或许从时间上对比的话,国内高校和人工智能的接触要晚了许多,可一旦消除了算力基础设施的制约,国内庞大的市场体量和人才需求,对人工智能人才培养的高度重视,正在沉淀出适用于不同层次人才的培养方案。何况一个接着一个的实际落地案例,已然让外界看到了科教研融合的新范式。

复旦大学联合戴尔推出了ADAS人工智能实践课,面向时下最为热门的自动驾驶,为学生提供了一种理论结合实践的学习方式:一面是学校精细的理论教学体系,一面是企业带来的行业视野、创新的实践和方法论,进一步拉近了在校学生和自动驾驶的距离,不再像过去那样停留在纸面上。

可以找到的例子还有中南大学的教育可视化平台。中南大学在2020年初启动了线上教学工作,通过戴尔的PowerEdge服务器迅速完成了搭载网站、视频转码等工作,即使在几乎满负荷运行的场景中,依然保持着出色的转码性能和高稳定性,有效提升了中南大学的线上教学质量。

还有一些高职院校,同样和戴尔摩擦出了有借鉴价值的“火花”。哈尔滨职业技术学院利用戴尔Precision工作站,构建了面向元宇宙视觉生态的VR动画制作平台,不仅为学生们打开了VR的新世界,3D动画制作效率提升了2—3倍,动画教学效率提升了3—4倍。

甚至北京师范大学第二附属中学代表的中学,都在戴尔科技的赋能范围内。北京师大二附中曾通过1台戴尔存储和4台Dell PowerEdge 服务器构建了一个虚拟化运行环境,并平稳运行近四年。后来引入戴尔科技的虚拟化方案,并同步升级服务器和存储设备后,学校的IT承载能力提升了300%……

解决算力困局的科教研究-第四范式视角

隐藏在这些案例背后的,其实是国内高校的创新与活力,不断诠释着算力自由后的种种可能性。随着戴尔科技全栈式的AI解决方案等大算力平台逐步在越来越多的高校落地,势必会呈现出更多让人眼前一亮的案例。彼时科教研融合将是一种水到渠成的结果, “第四范式”带来的挑战将切实转变为机遇。

04 写在最后

也许多年后再来审视数据驱动的科教研转型,只盯着人才培养可能会有些“狭隘”。

无论是人工智能的教学还是科研,都是一个由浅入深、由慢到快的过程,至少戴尔科技的大算力平台,已经为教育行业带来了“算力加速度”,让部分高校提前看到了科研教育的新范式。戴尔科技联合NVIDIA将为教育行业提供AI 训练、AI 推理、数据处理、数据科学和零信任安全能力。

当类似的解决方案越来越多,教育行业与算力基础设施间的鸿沟被逐渐抹平,所激起的连锁反应将远超想象。