后训练工程师Post training engineer

公司介绍

我们为一家国际领先的医疗科技企业招聘高级知识产权法律顾问。该职位将作为知识产权团队的核心成员，全面负责公司在知识产权领域的战略布局与法律保障，专注于医药专利管理与知识产权合规事务。

职位描述

岗位职责一、模型后训练（Post-training）负责大语言模型（LLM）或多模态模型的后训练流程，包括 SFT（监督微调）、RLHF、RLAIF、DPO、PPO 等。设计并实现高质量的训练数据集，包括数据清洗、标注、合成、过滤、质量评估等。优化模型对齐（Alignment）能力，包括安全性、价值观对齐、指令遵循能力提升。参与模型评估体系建设，设计评测集、自动评估指标、人工评估流程等。二、训练工程与优化负责后训练 pipeline 的搭建与优化，包括分布式训练、混合精度、训练加速、模型压缩等。优化训练效率与成本，提升 GPU 利用率、训练吞吐、数据加载性能等。参与模型部署前的模型调优，包括推理性能优化、量化、蒸馏等。三、数据与对齐工程构建高质量指令数据、对话数据、偏好数据、奖励模型数据等。设计数据增强策略，提升模型泛化能力与任务适配能力。参与构建安全数据集，提升模型在敏感场景下的稳健性与合规性。四、跨团队协作与算法研究、基础模型团队协作，推动模型能力迭代。与产品、应用团队协作，理解业务需求并将模型能力落地到实际场景。输出技术文档、训练复盘、数据分析报告等。

职位要求

任职要求计算机、人工智能、数学、统计等相关专业本科及以上学历。熟悉大模型训练流程，了解 Transformer、LLM 架构及其训练原理。熟练掌握 Python，熟悉 PyTorch、DeepSpeed、Megatron-LM、Colossal-AI 等训练框架。熟悉分布式训练、混合精度训练、模型并行、数据并行等技术。熟悉 SFT、RLHF、DPO、奖励模型训练等后训练技术。熟悉数据处理、数据清洗、数据标注流程，有大规模数据处理经验。具备良好的工程能力，能构建稳定高效的训练 pipeline。具备优秀的沟通能力、跨团队协作能力与问题分析能力。

公司介绍

职位描述

职位要求

Fiona Lu