Skip to content

前沿人工智能风险管理框架:风险评测实践报告

2025年7月

当前,人工智能技术日新月异,一系列风险隐患随之而来。全球顶尖研究机构正积极投身于前沿风险的讨论中,虽已就主要风险维度形成初步共识,但仍面临诸多挑战。现有AI风险治理框架往往难以有效应对高突发性、高不对称性风险。其源于前沿通用性人工智能(General-Purpose AI)的净新增能力,可导致危害规模扩大、滥用门槛降低,且具备高严重性、难以逆转等特性,因此,建立更具前瞻性的治理体系显得尤为关键。 2025年7月27日,在安远AI主办的WAIC 2025人工智能安全与治理论坛上,上海人工智能实验室与安远AI联合发布了《前沿人工智能风险管理框架》v1.0,并配以《风险评测实践报告》。作为国内首个聚焦前沿风险的风险管理框架,《框架》为通用型人工智能模型研发者提供了一套全流程的风险管理指南,旨在主动地识别、评估、缓解和治理一系列对于公共安全和国家安全的严重风险。《框架》识

别了四大核心风险类型:滥用风险、失控风险、意外风险和系统性风险,创新性地提出了“部署环境(E)-威胁源(T)-使能能力(C)”三维分析框架,并给出了针对性的风险识别、评估、缓解与治理建议,推动前沿风险从“模糊的定义”到“精确的坐标”。《框架》同时发布有英文版。 点击链接查看《实践报告》。

作者: 上海人工智能实验室
Back To Top