某知名公司
AI模型调优
信息技术
数字技术
上海
5-10年
本科
¥40 - 60K/月
职位描述
聚焦网络安全场景,负责公司专属大模型的指令微调全流程落地,结合安全业务需求(如漏洞分析、威胁研判、安全问答、日志解读等),搭建SFT 训练体系,优化训练效果,确保模型能精准理解安全领域指令、输出专业且符合业务需求的结果,支撑安全产的AI能力落地。
核心岗位职责
1. 负责网络安全领域SFT数据集的需求拆解、格式设计、清洗与优化,结合漏洞库、安全日志、威胁情报、安全知识库等专属数据,构建贴合业务的指令数据集(如{指令:漏洞分析,输入:漏洞详情,输出:风险等级+修复建议))。
2.搭建SFT训练流程,基于公司选定的基础大模型(开源/自研),调试训练超参(学习率、batch size、epoch等),解决训练过程中的收敛慢、过拟合、指令跟随偏差等问题,确保训练高效、效果达标。
3.建立 SFT模型效果评估体系,结合安全业务场景,设计自动评估+人工评估指标,跟踪模型迭代效果,定位模型在安全指令理解、专业输出上的不足,持续优化数据集与训练策略。
4.协同数据团队、安全研发团队,明确安全领域数据标准,参与安全数据的筛选、标注、增强工作,提升数据质量,保障SFT训练的数据支撑。
5.配合对齐工程师,完成SFT模型的对齐适配,参与模型迭代优化,确保模型输出符合安全业务规范与合规要求。
6.
记录训练过程、效果数据,输出SFT训练报告,同步项目进展与问题,推进项目快速落地。
任职要求
1.本科及以上学历,计算机科学、软件工程、人工智能、机器学习、NLP等相关专业,1年及以上大模型SFT相关工作经验;有网络安全领域AI相关经验者优先。
2.熟练掌握Python编程语言,熟悉PyTorch、TensorFlow等深度学习框架,理解Transformer架构及大模型训练原理,能独立搭建SFT训练流程。
3.熟悉SFT训练的核心流程与超参调优方法,能解决训练过程中的常见问题;了解分布式训练相关知识者优先。
4.具备一定的数据敏感度,能结合业务需求优化数据集;了解网络安全基础概念(如漏洞、威胁情报、日志、防火墙等)者优先。
5.工作严谨负责,具备良好的逻辑思维与问题解决能力,能快速适应团队的紧凑节奏,具备较强的团队协作与沟通能力。
分享