蚂蚁集团与清华大学合作推出AI安全检测平台“蚁鉴2.0”

在2023世界人工智能大会上，蚂蚁集团联合清华大学发布AI安全检测平台“蚁鉴2.0”。蚁鉴2.0可实现用生成式AI能力检测生成式AI模型，可识别数据安全、内容安全、科技伦理三大类的数百种风险，覆盖表格、文本、图像等多种数据和任务类型，是业内首个实现产业级应用的全数据类型AI安全检测平台。据了解，该产品还入选了本届大会的“镇馆之宝”。

蚂蚁集团宣布“蚁鉴2.0”全面开放，面向全球开发者免费提供AIGC安全性、AI可解释性、AI鲁棒性三项检测工具，可服务于数字金融、教育、文化、医疗、电商等领域的大规模复杂业务场景。

“蚁鉴2.0”的两项硬核能力，一是实现了用生成式能力检测生成式模型。检测标准覆盖内容安全、数据安全、伦理安全三大类，可对大模型生成式内容完成包含个人隐私、意识形态、违法犯罪、偏见与歧视等数百个维度的风险对抗检测，并会生成检测报告，帮助大模型更加有针对性地持续优化。

另一项硬核能力是，“蚁鉴2.0”融入了可解释性检测工具。综合AI技术和专家先验知识，通过可视化、逻辑推理、因果推断等技术，从完整性、准确性、稳定性等7个维度及20余项评估指标，对AI系统的解释质量量化分析，帮助用户更清晰验证与优化可解释方案。

“蚁鉴2.0”集成了蚂蚁近10年可信AI实践、1000余项可信AI专利，支持零编码测评。开发者通过API接口，将AI模型接入蚁鉴，就可以一键识别和挖掘模型漏洞。

chatGPT

近期文章

互联网资讯 / 人工智能 · 2024年2月27日

蚂蚁集团与清华大学合作推出AI安全检测平台“蚁鉴2.0”

Need more than content? Move into the product flow.