人工智能 · 2025年7月7日

深度探索与豆包的选择,盘古大模型的方向

华为的盘古大模型终于推出新版本了。

6月20日华为云计算CEO张平安宣布基于CloudMatRix 384超节点的新一代昇腾AI云服务全面上线,盘古大模型5.5同步发布。

不过,当前国内的AI大模型竞争可谓是相当激烈,华为的盘古大模型在众多大模型中并不是十分出众。华为云此次重磅推出的盘古大模型5.5能否从一众强敌面前杀出重围?

强敌环伺

今天,我们的AI大模型与美国Open AI、谷歌等科技公司的大模型已经相差不大,甚至在某些领域已经反超。

一类是由互联网科技巨头开发的大模型,如阿里巴巴开发的通义千问、字节跳动开发的豆包大模型、百度开发的文心一言4.0、科大讯飞开发的星火大模型、腾讯开发的元宝等。通义千问中文理解能力全球领先,支持百万级上下文窗口和多模态交互;豆包大模型月活用户量第二,擅长图像理解和多模态融合。

另一类是由DeepSeek、KiMi为代表的创业公司大模型。DeepSeek如今也是国内最火的大模型,月活用户量高达1.8亿;KiMi由月之暗面开发,支持20万汉字输入,长文本处理能力突出,适合数据分析与专业文档解读,受到不少用户的欢迎。

华为作为国内的科技巨头,虽然有着相当强劲的AI实力,但盘古大模型要从如此众多的竞争对手中杀出重围,也不是一件容易的事。

国产大模型普遍向左,盘古大模型偏偏向右

不管是DeepSeek也好,还是豆包大模型也罢,大多数的国产大模型几乎都选择了面向C端用户。不过盘古大模型则选择了To B,他们选择深耕行业,赋能千行百业,推动产业智能化升级。

在工业领域,盘古预测大模型通过优化生产工艺和系统寻优,提升生产效率,如海螺集团利用盘古大模型实现熟料强度预测,准确率超过85%,降低能耗;在农业领域,盘古大模型帮助农业科学家改良水稻株型,提高抗倒伏能力,同时保持产量,实现精准农业。

在金融领域,盘古金融大模型提供精准的风险评估和客户服务,提升金融机构的运营效率和客户满意度;在政务领域,盘古政务大模型助力政府提供智能化服务,提高政务处理效率和透明度。

在医疗领域,盘古医学大模型加速医学研究,提供精准诊断和治疗建议,推动医疗科技进步;在能源领域,盘古大模型优化能源生产和分配,如云南铝业通过坤安大模型降低电耗,实现节能减排。

在自动驾驶领域,盘古多模态大模型生成高质量训练数据,加速自动驾驶技术发展,如广汽集团与华为云合作实现高效数据生成;在机器人领域,盘古世界模型为具身智能机器人提供数字物理空间,提升操作能力,如火星车避障训练。

在过去的一年中,盘古大模型持续深耕行业,在政务、制造、钢铁、铁路、自动驾驶、气象等领域发挥巨大价值,重塑千行万业。此番重磅推出的盘古大模型5.5,同样继续深耕行业,推动各行业的数智化转型与升级。

盘古大模型5.5,内功究竟几何?

打磨了整整一年的时间,盘古大模型终于迎来了升级版。不得不说,盘古大模型是真沉得住气。那么,我们就来看看盘古大模型5.5打磨了这么长时间,究竟有着怎样的实力。

此次发布的5.5版本,包括比肩全球一流大模型的718B准万亿级NLP深度思考大模型、基于盘古多模态大模型的世界模型、升级的预测大模型、升级的视觉大模型,以及科学计算大模型。

算力支持方面,新一代AI云服务基于CloudMatRix 384超节点的新一代昇腾AI云服务,提供强大算力支持,单卡推理吞吐量提升近4倍,算力有效使用率提升50%以上。

技术性能方面,盘古大模型5.5采用256个专家组成的MoE架构,大幅增强了知识推理、工具调用和数学计算能力,通过自适应快慢思考合一技术,实现推理效率提升8倍,能够根据问题难度智能切换推理速度,兼顾效率与准确性。

创新特性方面,盘古多模态大模型可生成数字物理空间,为智能驾驶、具身智能机器人训练提供大量数据,降低训练成本,提高效率。

行业应用方面,盘古大模型在30多个行业、500多个场景中落地,包括政务、金融、制造、医疗、煤矿、钢铁、铁路、自动驾驶、气象等,发挥巨大价值。

总体看来,从技术实力的角度来看,华为盘古大模型5.5确实是一款先进的AI模型。

技术也是一把双刃剑

盘古大模型5.5可能太在乎对技术的追求了,但它也忽视了技术也是一把双刃剑。任何事情都是有利有弊,有好的一面也有不好的一面。

盘古大模型5.5拥有庞大的参数规模,如盘古UltRa MoE模型参数高达7180亿,这导致其在训练过程中需要消耗大量的计算资源和存储资源,从而使得训练成本较高。

与此同时,盘古大模型5.5采用了许多先进的技术和架构,如MoE架构、自适应快慢思考合一技术等。这些技术的复杂性可能会增加模型开发和调试的难度,同时也对开发人员的技术水平提出了更高的要求。

此外,盘古大模型5.5基于华为的昇腾AI云服务和鲲鹏CPU等硬件进行训练和推理,这种依赖性可能限制了其在非华为硬件平台上的部署和运行。

最后,还有一个不能忽视的问题,那便是数据安全问题。大模型训练需要大量的中文语料库,这可能会涉及到用户隐私和数据安全问题。尽管华为采取了相应的保护措施,但数据安全仍然是一个需要持续关注和优化的方面。

总体来看,国产大模型与国外先进大模型的差距是越来越小了。在DeekSeek、盘古大模型等国产大模型的共同推动下,必然会推动中国式AI走出一条独特发展的道路。

OpenMagic API

Need more than content? Move into the product flow.

If you are here for model access, pricing, developer docs, or the future API console, the dedicated product path now lives on api.openmagic.ai.