中国AI安全评估生态

2024年9月

前沿AI系统的安全性忧虑与日俱增，全球各国政府、开发者和研究者逐渐认识到建立相关机制、评估AI系统危险风险与社会影响的重要性。AI安全评估可以针对模型潜在的风险能力发出前期预警，尽管无法确保百分百的安全无虞，但仍是降低相关风险的重要工具。由于AI安全评估作为一门科学尚处于起步阶段，社会各方均有意提升其科学严谨性，共享最佳实践方案，从而帮助世界各国建立恰当且稳健的风险评估措施。中国的《全球人工智能治理倡议》呼吁“建立基于AI风险等级的测试评估体系”，而《布莱切利宣言》则体现了国际社会对前沿AI系统安全测试与评估的支持。

中国不仅具备先进的AI技术实力，而且已经开展了大量AI评估项目，在AI安全与风险治理的问题上无疑扮演着重要角色。安远AI发布的此份报告，以及最近推出的中国AI安全评估数据库，是国际上首个针对中国在AI安全评估的现状所做的英文全面分析。我们希望在AI安全评估最佳实践方面，促进中国与其他国际领先实体的交流共享，并欢迎与其他有意推动相关议题的组织机构与我们一道，就AI安全评估与风险治理的实践分享与标准制定开展合作。

本文将首先介绍中国的AI治理行动中有关AI安全评估的要求，然后分享我们建立“中国AI安全评估数据库”式所采取的方法论。这一数据库涵盖了来自先进AI系统的一系列安全与社会风险问题，但鉴于在AI安全风险领域，跨国性威胁与灾难性后果更需要、也更有潜力开展国际合作，本文的分析将主要聚焦于“前沿AI风险”。我们将概述数据库中总结呈现的重要趋势与结果，例如主要测试了哪些风险、评估的类型与方法、使用的语言及模态等。最后，本文将就有关的核心政府部门、学术研究和企业团队如何开展AI安全评估工作，给出详细的说明和指引。

作者: 安远AI

中国AI安全评估生态

分享至

合作

关注我们