人工智能 · 2025年9月28日

阿里云发布AI安全护栏,五大核心能力护航AI安全

9月24日,杭州云栖大会技术主论坛上,阿里云重磅发布AI安全护栏,提供五项核心安全能力,护航AI安全。通过原生安全防护融入AI Agent开发全链路,并持续以AI赋能安全产品智能升级,打造Agentic-SOC安全运营,提升威胁检测与响应效率。

AI安全护栏示意图

在过去一年,AI Agent持续快速发展。在业务流程构建、组件互动与调用中也面临各类安全风险。因此,阿里云在AI Agent开发全链路中原生嵌入安全,从模型基础设施、模型本身和AI应用三层提供全栈防护,使安全无缝融入业务流,提供高效、便捷、低延迟的防护能力。

在基础设施层,云安全中心、云防火墙、IDaaS、数据安全中心、密钥管理服务等产品共同构成全链路防护。今年,云安全中心新增AI-BOM和AI-SPM能力,帮助企业建立云上AI资产管理与安全态势感知,实现从黑箱到透明的资产管理。

在AI模型层,AI安全护栏提供五项能力:内容合规、敏感数据检测、提示词攻击防护、恶意文件/URL防护和数字水印识别,保障输入输出安全、确保内容合规。与开源护栏相比,阿里云的安全护栏具有明显优势。

在AI应用层,Web应用防火墙提供WAAP应用安全防护方案,包括全新LLM-WAF能力,一键集成AI安全护栏,并提升机器人管理、API安全,帮助客户防护AI应用层面临的风险。

AI安全护栏示意图2

在为AI Agent提供全链路安全的同时,AI的快速发展也在反哺安全产品的智能升级。在通义底层模型的支持下,云安全团队构建数十个安全智能体,通过多智能体协同,将AI融入威胁检测、运营、安全认证、内容安全、数据安全等领域,有效提升了安全产品能力。

AI安全护栏示意图3

针对DeepFake挑战,实人认证通过集成通义Qwen-VL模型,相较之前的小模型与专家模型,在人脸识别伪造方面的召回率提升约10%,更有效防范身份伪造。

在内容安全领域,打造内容审核大模型2.0,整合通义Qwen3Guard全系审核模型,支持多模态内容审核,对识别带偏见、暴力恐怖等更隐晦、复杂的违规内容,检测能力提升约30%。

在数据安全领域,覆盖800多种数据类型识别,通过Qwen-Plus模型实现更高精度的语义识别,数据分类准确率提升约35%,尤其在税务登记号、银行卡号等复杂格式识别方面效果显著。

同时,安全智能体与产品的深度融合,显著提升云上运维效率。云威胁检测与响应CTDR今年全面升级,构建Agentic SOC工作流程,通过多源数据接入、智能分析决策、自动化处置与持续优化,形成云威胁分析与响应体系,自动化事件调查成功率从59%提升至74%,显著提高调查与处置效率。

会上,阿里云宣布已有28款云核心产品深度集成云安全能力,将安全能力融入云产品中,降低使用门槛,未来还将扩展集成产品数量。

AI安全护栏示意图4

截至目前,阿里云已与多家企业构建AI基础设施防护、AI模型生态防护等安全方案,在提升防护效果和运营效率方面共同拓展安全智能体的防护边界。未来将继续探索在安全、AI、性能与成本之间的平衡,提供更智能、性价比更高的安全产品。

OpenMagic API

Need more than content? Move into the product flow.

If you are here for model access, pricing, developer docs, or the future API console, the dedicated product path now lives on api.openmagic.ai.

登录免费注册