阿里云发布AI安全护栏，五大核心能力护航AI安全

9月24日，杭州云栖大会技术主论坛上，阿里云重磅发布AI安全护栏，提供五项核心安全能力，护航AI安全。通过原生安全防护融入AI Agent开发全链路，并持续以AI赋能安全产品智能升级，打造Agentic-SOC安全运营，提升威胁检测与响应效率。

AI安全护栏示意图

在过去一年，AI Agent持续快速发展。在业务流程构建、组件互动与调用中也面临各类安全风险。因此，阿里云在AI Agent开发全链路中原生嵌入安全，从模型基础设施、模型本身和AI应用三层提供全栈防护，使安全无缝融入业务流，提供高效、便捷、低延迟的防护能力。

在基础设施层，云安全中心、云防火墙、IDaaS、数据安全中心、密钥管理服务等产品共同构成全链路防护。今年，云安全中心新增AI-BOM和AI-SPM能力，帮助企业建立云上AI资产管理与安全态势感知，实现从黑箱到透明的资产管理。

在AI模型层，AI安全护栏提供五项能力：内容合规、敏感数据检测、提示词攻击防护、恶意文件/URL防护和数字水印识别，保障输入输出安全、确保内容合规。与开源护栏相比，阿里云的安全护栏具有明显优势。

在AI应用层，Web应用防火墙提供WAAP应用安全防护方案，包括全新LLM-WAF能力，一键集成AI安全护栏，并提升机器人管理、API安全，帮助客户防护AI应用层面临的风险。

AI安全护栏示意图2

在为AI Agent提供全链路安全的同时，AI的快速发展也在反哺安全产品的智能升级。在通义底层模型的支持下，云安全团队构建数十个安全智能体，通过多智能体协同，将AI融入威胁检测、运营、安全认证、内容安全、数据安全等领域，有效提升了安全产品能力。

AI安全护栏示意图3

针对DeepFake挑战，实人认证通过集成通义Qwen-VL模型，相较之前的小模型与专家模型，在人脸识别伪造方面的召回率提升约10%，更有效防范身份伪造。

在内容安全领域，打造内容审核大模型2.0，整合通义Qwen3Guard全系审核模型，支持多模态内容审核，对识别带偏见、暴力恐怖等更隐晦、复杂的违规内容，检测能力提升约30%。

在数据安全领域，覆盖800多种数据类型识别，通过Qwen-Plus模型实现更高精度的语义识别，数据分类准确率提升约35%，尤其在税务登记号、银行卡号等复杂格式识别方面效果显著。

同时，安全智能体与产品的深度融合，显著提升云上运维效率。云威胁检测与响应CTDR今年全面升级，构建Agentic SOC工作流程，通过多源数据接入、智能分析决策、自动化处置与持续优化，形成云威胁分析与响应体系，自动化事件调查成功率从59%提升至74%，显著提高调查与处置效率。

会上，阿里云宣布已有28款云核心产品深度集成云安全能力，将安全能力融入云产品中，降低使用门槛，未来还将扩展集成产品数量。

AI安全护栏示意图4

截至目前，阿里云已与多家企业构建AI基础设施防护、AI模型生态防护等安全方案，在提升防护效果和运营效率方面共同拓展安全智能体的防护边界。未来将继续探索在安全、AI、性能与成本之间的平衡，提供更智能、性价比更高的安全产品。

人工智能 · 2025年9月28日