岗位名称:大模型测评工程师(AI)
工作地点:长沙
薪资范围:15-30k·13薪
学历要求:统招本科
经验要求:3年以上
1.负责 AI Agent 及相关大模型应用的全流程测试工作,包括需求分析、功能点提取、测试项设计及测试用例编写、执行,保障产品质量。
2.针对 Agent 业务场景,设计合理的测试指标与评测方案,构建专项评测集,支撑模型效果与产品体验的量化评估。
3.开发与维护自动化评测脚本及评测平台,将评测方案落地为可稳定执行的自动化工具,提升测试效率与覆盖率。
4.参与代码层面的问题分析与排查,结合编程能力定位模型调用、工具链及业务逻辑中的潜在问题。
5.与算法、开发、产品团队协作,推动评测标准的建立与持续优化,形成闭环质量保障机制。
1.本科及以上学历,计算机相关专业,3年以上岗位相关工作经验。
2.具备扎实的测试功底,熟悉需求分析、测试项设计、用例编写等完整测试流程,有系统化质量保障意识。
3.熟悉大模型及 Agent 应用,有提示词工程、测试集构建、大模型评测经验优先。
4.掌握 Python、Java、C 等至少一种主流编程语言,能够完成自动化脚本及评测平台的开发。
5.具备较强的责任感、团队合作精神、逻辑思维能力和表达能力,能独立分析问题,善于研究业务、分析产品。

泛联新安成立于2017年,深耕国内AI驱动开发支撑类与验证EDA类基础软件。公司以“推动可信智能开发”为使命,公司提出“AI+可信开发”理念,以AI驱动高智能、高质量、高安全,全面确保代码可信、开发可靠。公司现有员工300余人,技术实力雄厚,成立至今获得中国互联网投资基金、达晨财智、兴湘资本、农银国际、西部证券、汇川产投、钧犀资本、天惠基金等国家产业资本战略投资,并与国防科技大学、清华大学、复旦大学等知名院校达成深度产学研合作。