北大团队联合国内外多所高校的研究者推出AI对齐全面性综述,覆盖“从反馈学习 (Learning from Feedback)” 、“在分布偏移下学习 (Learning under Distributional Shift)” 、“对齐保证 (Assurance)”、“AI治理(AI Governance)” – 实现AI对齐(AI Alignment)的四个核心问题,并提出AI对齐是一个不断更新、迭代改进的环路。
其中,安远AI的段雅文、吴君仪、谢旻希对综述整体方向、内容框架和第五章AI治理的部分做出了贡献。

