Skip to content

智能体安全研究员

工作地点

北京市朝阳区CBD

申请截止日期

5月27日(周三)23:59

关于安远AI

安远AI是人工智能安全与治理领域的独立研究与咨询机构,也是目前国内唯一专注于这一领域的社会企业,总部设于北京,并在新加坡设有分部。我们的使命是:以中国视角与全球视野,推动人机关系走向安全、可信、可靠的未来。

我们致力于识别和应对前沿AI技术带来的最紧迫安全风险,随着AI智能体(Agent)成为大模型落地的核心形态,其自主决策、工具调用、多智能体协同、持续进化等特性,催生了指令注入、越权操作、技能供应链攻击、智能体失控等新型安全隐患,成为当前AI安全治理的核心攻坚方向。

我们陆续开展及规划的核心工作包括但不限于:

  • 智能体安全基准测评搭建行业领先的智能体安全评测体系,针对通用智能体、代码智能体、GUI智能体等多种形态,开展能力边界测试、恶意行为检测,输出专业测评报告与风险画像;
  • 红队攻防与风险加固开展智能体定向红队测试,挖掘指令注入、越狱、越权操作、数据泄露等安全漏洞,研发针对性缓解策略与安全加固方案;
  • 评测平台与工具研发:将评测方法论转化为工程化能力,参与智能体安全自动化评测平台的研发,为市场上主流智能体提供安全测评和风险评估服务;
  • 管理框架与标准共建:跟踪国内外智能体安全实践,参与智能体安全标准、风险管理框架的制定与修订,推动行业规范化发展。

我们期待兼具技术功底、评测经验与工程思维的人才加入,共同破解智能体安全难题,推动AI技术安全、可控、负责任落地。

岗位职责

你将作为团队核心骨干,聚焦智能体全生命周期安全评测与风险治理,深度参与智能体安全技术研究、测评基准建设、红队攻防实战、风险管理框架搭建等工作,联动政策端、产业端、学术端资源,推动评测成果转化为行业标准与落地实践,筑牢智能体技术的安全底线。

  1.  智能体安全评测体系搭建与实战测评

独立设计智能体安全评测方案,构建多维测评指标体系;针对各类商用/开源智能体产品开展全流程测试,精准定位风险漏洞,输出详细测评报告、风险评级与整改建议。

  1. 智能体红队攻防与风险研究

跟踪智能体安全前沿攻防技术,开展定向红队测试、渗透攻击与对抗性评测,挖掘智能体潜在漏洞与风险,探索创新型风险检测、拦截与缓解技术,最终形成学术论文、技术报告或可复用的代码组件。

  1. 研究成果输出与标准落地

主笔或参与撰写智能体安全测评报告、技术白皮书,梳理行业风险痛点与解决方案;跟踪并参与国际、国家、行业级智能体安全标准制定,将评测实践转化为标准化规范。

  1. 评测工程化与工具研发

将评测方法论工程化落地,参与智能体自动化评测平台、风险监测工具的需求设计、开发调试与迭代优化;搭建评测数据集、测试用例库,提升测评效率、精准度与可扩展性。

  1. 团队协作与外部合作

配合团队完成企业客户咨询、项目交付、行业论坛分享等工作;联动国内外高校、科研机构、AI企业开展智能体安全合作研究,参与高端研讨会、闭门会议,传递专业洞察与机构影响力。

任职要求

  1. 基本素养与价值观

认同安远AI使命,具备强烈的责任感、风险意识与解决复杂问题的能力,既能独立攻坚核心任务,也擅长跨团队协作;工作积极主动,具备严谨的科研态度与极致的工程思维。

  1. 学历与专业背景

本科及以上学历,计算机科学、人工智能、机器学习、网络安全、软件工程等相关专业优先;2年及以上AI安全、大模型评测、智能体研发/安全、红队攻防相关工作经验者优先。

  1. 核心技能与经验
  • 熟悉AI智能体核心原理,熟悉大模型技术栈与工具调用机制,具备智能体开发或评测实操经验;
  • 掌握大模型安全评测、红队测试、对抗攻防技术,熟悉业界主流AI安全基准与测评规范,有智能体/大模型安全/网络安全测评项目经验者优先;
  • 熟练使用Python等多种编程语言,熟练掌握数据结构与算法;
  • 有参与行业标准、学术论文、研究报告撰写经验者优先。
  1. 软技能与语言能力

具备优秀的文档撰写、逻辑表达与沟通能力,能清晰输出专业报告与技术方案;具备良好的英文读写能力,可查阅外文前沿文献、与国内外同行开展书面沟通。

你将获得

  • 前沿领域的学习与自我提升机会
    • 参与构建国际领先的前沿AI智能体风险评测体系,参与AI安全前沿技术报告的撰写
    • 参与并主导前沿智能体安全技术研究,塑造AI安全技术领域的发展与成就
    • 参与AI安全前沿会议与社区活动,与国内外顶级机构和学者合作互动
    • 在我们小而精的团队中,快速成长并承担重要责任
  • 平等包容的工作氛围
    • 与心系社会、拥有理想、热爱AI安全事业的伙伴共事
    • 团队年轻,架构扁平,我们无视头衔与资历,只重贡献与创新
    • 平等、友爱、有趣的工作氛围(团队每周共进午餐、交流探讨)
    • 充分发挥主观能动性,你可以自主决定达成工作目标的方式和计划
    • 充分参与机构决策的讨论,你的想法和建议都会被尊重和倾听
  • 超有竞争力的福利待遇
    • 在互联网和咨询行业具有竞争力的薪资
    • 灵活上下班,不打卡,周末双休
    • 法定节假日调休不补班;每年有30%的时间可远程办公
    • 每年带薪的22天年假和10天病假
    • 五险一金(按照最高比例12%缴纳)和补充商业医疗保险
    • 舒适现代化的办公空间,每人可享受年度办公用品购置资金和个人发展基金

申请方式

扫码填写申请表(预计用时15-30分钟),确保在5月27日(周三)23:59前提交:

如有任何问题,请邮件联系我们:info@concordia-ai.com,并在邮件主题注明“智能体安全研究员申请”

Back To Top