前沿人工智能风险管理框架：风险评测实践报告

2025年7月

当前，人工智能技术日新月异，一系列风险隐患随之而来。全球顶尖研究机构正积极投身于前沿风险的讨论中，虽已就主要风险维度形成初步共识，但仍面临诸多挑战。现有AI风险治理框架往往难以有效应对高突发性、高不对称性风险。其源于前沿通用性人工智能（General-Purpose AI）的净新增能力，可导致危害规模扩大、滥用门槛降低，且具备高严重性、难以逆转等特性，因此，建立更具前瞻性的治理体系显得尤为关键。 2025年7月27日，在安远AI主办的WAIC 2025人工智能安全与治理论坛上，上海人工智能实验室与安远AI联合发布了《前沿人工智能风险管理框架》v1.0，并配以《风险评测实践报告》。作为国内首个聚焦前沿风险的风险管理框架，《框架》为通用型人工智能模型研发者提供了一套全流程的风险管理指南，旨在主动地识别、评估、缓解和治理一系列对于公共安全和国家安全的严重风险。《框架》识

别了四大核心风险类型：滥用风险、失控风险、意外风险和系统性风险，创新性地提出了“部署环境(E)-威胁源(T)-使能能力(C)”三维分析框架，并给出了针对性的风险识别、评估、缓解与治理建议，推动前沿风险从“模糊的定义”到“精确的坐标”。《框架》同时发布有英文版。点击链接查看《实践报告》。

作者: 上海人工智能实验室

前沿人工智能风险管理框架：风险评测实践报告

分享至

合作

关注我们