互联网资讯 / 人工智能 · 2024年2月27日

蚂蚁集团与清华大学合作推出AI安全检测平台“蚁鉴2.0”

在2023世界人工智能大会上,蚂蚁集团联合清华大学发布AI安全检测平台“蚁鉴2.0”。蚁鉴2.0可实现用生成式AI能力检测生成式AI模型,可识别数据安全、内容安全、科技伦理三大类的数百种风险,覆盖表格、文本、图像等多种数据和任务类型,是业内首个实现产业级应用的全数据类型AI安全检测平台。据了解,该产品还入选了本届大会的“镇馆之宝”。

蚂蚁集团宣布“蚁鉴2.0”全面开放,面向全球开发者免费提供AIGC安全性、AI可解释性、AI鲁棒性三项检测工具,可服务于数字金融、教育、文化、医疗、电商等领域的大规模复杂业务场景。

“蚁鉴2.0”的两项硬核能力,一是实现了用生成式能力检测生成式模型。检测标准覆盖内容安全、数据安全、伦理安全三大类,可对大模型生成式内容完成包含个人隐私、意识形态、违法犯罪、偏见与歧视等数百个维度的风险对抗检测,并会生成检测报告,帮助大模型更加有针对性地持续优化。

另一项硬核能力是,“蚁鉴2.0”融入了可解释性检测工具。综合AI技术和专家先验知识,通过可视化、逻辑推理、因果推断等技术,从完整性、准确性、稳定性等7个维度及20余项评估指标,对AI系统的解释质量量化分析,帮助用户更清晰验证与优化可解释方案。

“蚁鉴2.0”集成了蚂蚁近10年可信AI实践、1000余项可信AI专利,支持零编码测评。开发者通过API接口,将AI模型接入蚁鉴,就可以一键识别和挖掘模型漏洞。

OpenMagic API

Need more than content? Move into the product flow.

If you are here for model access, pricing, developer docs, or the future API console, the dedicated product path now lives on api.openmagic.ai.

登录免费注册