人工智能对齐：全面性综述

2023年

北大团队联合国内外多所高校的研究者推出AI对齐全面性综述，覆盖“从反馈学习 (Learning from Feedback)” 、“在分布偏移下学习 (Learning under Distributional Shift)” 、“对齐保证 (Assurance)”、“AI治理(AI Governance)” – 实现AI对齐（AI Alignment）的四个核心问题，并提出AI对齐是一个不断更新、迭代改进的环路。

其中，安远AI的段雅文、吴君仪、谢旻希对综述整体方向、内容框架和第五章AI治理的部分做出了贡献。

作者: 吉嘉铭，邱天异，陈博远，张柏荣，楼翰涛，王恺乐，段雅文，何忠豪，周嘉懿，张钊为，曾繁志，吴君仪，戴俊韬，潘学海，Aidan O’Gara，徐骅，Brian Tse，付杰，Stephen McAleer，杨耀东，王亦洲，朱松纯，郭毅可，高文

人工智能对齐：全面性综述

分享至

合作

关注我们