国产底座完成 GLM-5.2 Day-0 适配,长程任务能力就绪
本次对 GLM-5.2 的 Day-0 适配,聚焦在海光DCU这一国产算力底座的全面对接,旨在实现长程任务的高效执行能力。此次进展标志着在国产算力平台上,开源与旗舰级大模型的协同运行正式进入稳定阶段,面向多端应用的通用能力正在逐步释放。
核心亮点在于对百亿级参数模型的无损“上文–下文”支持的实现。过去受限于算力带宽与显存管理效率,长文本推理常在实际应用中出现性能瓶颈。通过海光DCU的高带宽内存访问能力,以及面向长序列推理的优化指令集,GLM-5.2 在长程任务中展现出更稳定的推理性能与效率提升,为开发者提供了更扎实的物理基础。
在多端应用场景方面,模型已在平台上实现连续覆盖 Web、移动端与小程序等多端开发的实际能力,累计处理数量达到一定规模级别的 Tokens。结合 index R 架构的协同作用,国产底座在有限算力资源下也能支撑超大规模任务的处理需求。
本轮适配的核心还包括对 Affinity 与内存调度的优化,以及对长文本窗口下单位 Token 的推理成本控制。这些改进共同保障了从“辅助对话”向“自主执行”的能力跃迁,使开发者可以在本地平台进行更高效的模型落地与系统集成。

海光 DCU 针对 GLM-5.2 的双核心场景进行了深度优化,覆盖长程任务与复杂代码能力的实际应用。通过对核心算子、内存管理和长序列处理的专项调优,进一步提升了模型在实际软件开发与系统优化中的稳定性与效率。
在实际长程任务与代码能力测试场景中,海光 DCU 为 GLM-5.2 提供持续稳定的算力支撑。模型可在平台上连续完成覆盖 Web、移动端与小程序的多端应用开发,累计处理的 Token 数量达到较高水平,且在上文的稳定性与效率方面表现出良好的一致性。

未来双方将继续推动 GLM-5.2 的深层优化,进一步释放硬件潜力。计划围绕长程任务与代码能力开展更多场景验证,推动模型在真实软件开发与系统优化中的规模化落地。长程任务能力的就绪,将为国产平台上的 AI 代码生成、智能自动化与软件工程协作带来更高效的解决方案,同时提升对核心数据与业务逻辑的自主可控性。
