智能体安全研究员

安远AI是人工智能安全与治理领域的独立研究与咨询机构，也是目前国内唯一专注于这一领域的社会企业，总部设于北京，并在新加坡设有分部。我们的使命是：以中国视角与全球视野，推动人机关系走向安全、可信、可靠的未来。

我们致力于识别和应对前沿AI技术带来的最紧迫安全风险，随着AI智能体（Agent）成为大模型落地的核心形态，其自主决策、工具调用、多智能体协同、持续进化等特性，催生了指令注入、越权操作、技能供应链攻击、智能体失控等新型安全隐患，成为当前AI安全治理的核心攻坚方向。

我们陆续开展及规划的核心工作包括但不限于：

智能体安全基准测评：搭建行业领先的智能体安全评测体系，针对通用智能体、代码智能体、GUI智能体等多种形态，开展能力边界测试、恶意行为检测，输出专业测评报告与风险画像；
红队攻防与风险加固：开展智能体定向红队测试，挖掘指令注入、越狱、越权操作、数据泄露等安全漏洞，研发针对性缓解策略与安全加固方案；
评测平台与工具研发：将评测方法论转化为工程化能力，参与智能体安全自动化评测平台的研发，为市场上主流智能体提供安全测评和风险评估服务；
管理框架与标准共建：跟踪国内外智能体安全实践，参与智能体安全标准、风险管理框架的制定与修订，推动行业规范化发展。

我们期待兼具技术功底、评测经验与工程思维的人才加入，共同破解智能体安全难题，推动AI技术安全、可控、负责任落地。

你将作为团队核心骨干，聚焦智能体全生命周期安全评测与风险治理，深度参与智能体安全技术研究、测评基准建设、红队攻防实战、风险管理框架搭建等工作，联动政策端、产业端、学术端资源，推动评测成果转化为行业标准与落地实践，筑牢智能体技术的安全底线。

独立设计智能体安全评测方案，构建多维测评指标体系；针对各类商用/开源智能体产品开展全流程测试，精准定位风险漏洞，输出详细测评报告、风险评级与整改建议。

跟踪智能体安全前沿攻防技术，开展定向红队测试、渗透攻击与对抗性评测，挖掘智能体潜在漏洞与风险，探索创新型风险检测、拦截与缓解技术，最终形成学术论文、技术报告或可复用的代码组件。

主笔或参与撰写智能体安全测评报告、技术白皮书，梳理行业风险痛点与解决方案；跟踪并参与国际、国家、行业级智能体安全标准制定，将评测实践转化为标准化规范。

将评测方法论工程化落地，参与智能体自动化评测平台、风险监测工具的需求设计、开发调试与迭代优化；搭建评测数据集、测试用例库，提升测评效率、精准度与可扩展性。

配合团队完成企业客户咨询、项目交付、行业论坛分享等工作；联动国内外高校、科研机构、AI企业开展智能体安全合作研究，参与高端研讨会、闭门会议，传递专业洞察与机构影响力。

认同安远AI使命，具备强烈的责任感、风险意识与解决复杂问题的能力，既能独立攻坚核心任务，也擅长跨团队协作；工作积极主动，具备严谨的科研态度与极致的工程思维。

本科及以上学历，计算机科学、人工智能、机器学习、网络安全、软件工程等相关专业优先；2年及以上AI安全、大模型评测、智能体研发/安全、红队攻防相关工作经验者优先。

具备优秀的文档撰写、逻辑表达与沟通能力，能清晰输出专业报告与技术方案；具备良好的英文读写能力，可查阅外文前沿文献、与国内外同行开展书面沟通。

前沿领域的学习与自我提升机会
- 参与构建国际领先的前沿AI智能体风险评测体系，参与AI安全前沿技术报告的撰写
- 参与并主导前沿智能体安全技术研究，塑造AI安全技术领域的发展与成就
- 参与AI安全前沿会议与社区活动，与国内外顶级机构和学者合作互动
- 在我们小而精的团队中，快速成长并承担重要责任
平等包容的工作氛围
- 与心系社会、拥有理想、热爱AI安全事业的伙伴共事
- 团队年轻，架构扁平，我们无视头衔与资历，只重贡献与创新
- 平等、友爱、有趣的工作氛围（团队每周共进午餐、交流探讨）
- 充分发挥主观能动性，你可以自主决定达成工作目标的方式和计划
- 充分参与机构决策的讨论，你的想法和建议都会被尊重和倾听
超有竞争力的福利待遇
- 在互联网和咨询行业具有竞争力的薪资
- 灵活上下班，不打卡，周末双休
- 法定节假日调休不补班；每年有30%的时间可远程办公
- 每年带薪的22天年假和10天病假
- 五险一金（按照最高比例12%缴纳）和补充商业医疗保险
- 舒适现代化的办公空间，每人可享受年度办公用品购置资金和个人发展基金

扫码填写申请表（预计用时15-30分钟），确保在6月20日（周六）23:59前提交：

如有任何问题，请邮件联系我们：info@concordia-ai.com，并在邮件主题注明“智能体安全研究员申请”