AI模型调优

聚焦网络安全场景，负责公司专属大模型的指令微调全流程落地，结合安全业务需求（如漏洞分析、威胁研判、安全问答、日志解读等），搭建SFT 训练体系，优化训练效果，确保模型能精准理解安全领域指令、输出专业且符合业务需求的结果，支撑安全产的AI能力落地。核心岗位职责 1. 负责网络安全领域SFT数据集的需求拆解、格式设计、清洗与优化，结合漏洞库、安全日志、威胁情报、安全知识库等专属数据，构建贴合业务的指令数据集（如｛指令：漏洞分析，输入：漏洞详情，输出：风险等级＋修复建议）)。 2．搭建SFT训练流程，基于公司选定的基础大模型（开源／自研），调试训练超参（学习率、batch size、epoch等），解决训练过程中的收敛慢、过拟合、指令跟随偏差等问题，确保训练高效、效果达标。 3．建立 SFT模型效果评估体系，结合安全业务场景，设计自动评估＋人工评估指标，跟踪模型迭代效果，定位模型在安全指令理解、专业输出上的不足，持续优化数据集与训练策略。 4．协同数据团队、安全研发团队，明确安全领域数据标准，参与安全数据的筛选、标注、增强工作，提升数据质量，保障SFT训练的数据支撑。 5．配合对齐工程师，完成SFT模型的对齐适配，参与模型迭代优化，确保模型输出符合安全业务规范与合规要求。 6. 记录训练过程、效果数据，输出SFT训练报告，同步项目进展与问题，推进项目快速落地。任职要求 1．本科及以上学历，计算机科学、软件工程、人工智能、机器学习、NLP等相关专业，1年及以上大模型SFT相关工作经验；有网络安全领域AI相关经验者优先。 2．熟练掌握Python编程语言，熟悉PyTorch、TensorFlow等深度学习框架，理解Transformer架构及大模型训练原理，能独立搭建SFT训练流程。 3．熟悉SFT训练的核心流程与超参调优方法，能解决训练过程中的常见问题；了解分布式训练相关知识者优先。 4．具备一定的数据敏感度，能结合业务需求优化数据集；了解网络安全基础概念（如漏洞、威胁情报、日志、防火墙等）者优先。 5．工作严谨负责，具备良好的逻辑思维与问题解决能力，能快速适应团队的紧凑节奏，具备较强的团队协作与沟通能力。

职位描述