国际领先医疗科技
后训练工程师Post training engineer
生物科技
软件开发
上海
5-10年
本科
¥30 - 45K15薪
公司介绍
我们为一家国际领先的医疗科技企业招聘高级知识产权法律顾问。该职位将作为知识产权团队的核心成员,全面负责公司在知识产权领域的战略布局与法律保障,专注于医药专利管理与知识产权合规事务。
职位描述
岗位职责
一、模型后训练(Post-training)
负责大语言模型(LLM)或多模态模型的后训练流程,包括 SFT(监督微调)、RLHF、RLAIF、DPO、PPO 等。
设计并实现高质量的训练数据集,包括数据清洗、标注、合成、过滤、质量评估等。
优化模型对齐(Alignment)能力,包括安全性、价值观对齐、指令遵循能力提升。
参与模型评估体系建设,设计评测集、自动评估指标、人工评估流程等。
二、训练工程与优化
负责后训练 pipeline 的搭建与优化,包括分布式训练、混合精度、训练加速、模型压缩等。
优化训练效率与成本,提升 GPU 利用率、训练吞吐、数据加载性能等。
参与模型部署前的模型调优,包括推理性能优化、量化、蒸馏等。
三、数据与对齐工程
构建高质量指令数据、对话数据、偏好数据、奖励模型数据等。
设计数据增强策略,提升模型泛化能力与任务适配能力。
参与构建安全数据集,提升模型在敏感场景下的稳健性与合规性。
四、跨团队协作
与算法研究、基础模型团队协作,推动模型能力迭代。
与产品、应用团队协作,理解业务需求并将模型能力落地到实际场景。
输出技术文档、训练复盘、数据分析报告等。
职位要求
任职要求
计算机、人工智能、数学、统计等相关专业本科及以上学历。
熟悉大模型训练流程,了解 Transformer、LLM 架构及其训练原理。
熟练掌握 Python,熟悉 PyTorch、DeepSpeed、Megatron-LM、Colossal-AI 等训练框架。
熟悉分布式训练、混合精度训练、模型并行、数据并行等技术。
熟悉 SFT、RLHF、DPO、奖励模型训练等后训练技术。
熟悉数据处理、数据清洗、数据标注流程,有大规模数据处理经验。
具备良好的工程能力,能构建稳定高效的训练 pipeline。
具备优秀的沟通能力、跨团队协作能力与问题分析能力。