初创科技公司
大模型算法
互联网
数字技术
上海
3-5年
本科
¥30 - 45K15薪
公司介绍
我们的客户是一家明星AI科技公司
职位描述
1. 负责大规模预训练模型(LLM、VLM、Diffusion 等)的算法研发,包括模型架构设计、训练策略优化、推理加速等核心工作。
2. 参与大模型从预训练、对齐(SFT、RLHF、DPO 等)、评测到部署的全流程研发,持续提升模型的理解、生成与推理能力。
3. 针对不同业务场景(如对话、搜索、代码生成、多模态理解等)进行模型微调、能力增强与效果优化。
4. 研究并实现前沿大模型技术,包括 MoE、长文本建模、检索增强(RAG)、多模态融合、知识蒸馏等方向。
5. 分析模型性能瓶颈,推动训练效率优化,包括数据处理、分布式训练、混合精度、算子优化等。
6. 与数据、平台、工程团队协作,推进大模型在实际产品中的落地与持续迭代。
职位要求
1. 计算机科学、人工智能、数学、电子信息等相关专业硕士及以上学历(优秀本科生亦可)。
2. 扎实的机器学习与深度学习基础,熟悉 Transformer、Attention、LLM 训练范式等核心技术。
3. 熟练使用 Python,掌握至少一种主流深度学习框架(PyTorch / TensorFlow),具备良好的工程实现能力。
4. 熟悉大模型训练流程,包括数据构建、预训练、微调、对齐、评测等环节,有实际项目经验者优先。
5. 了解分布式训练框架(DeepSpeed、Megatron-LM、FSDP、Horovod 等)或具备大规模训练经验者优先。
6. 对大模型前沿技术(如 RAG、MoE、长上下文、SFT/RLHF、蒸馏、量化等)有深入理解或实践经验。
7. 具备良好的问题分析能力、学习能力与团队协作能力,能够快速跟进前沿研究并推动落地。
咨询顾问
Cassie Lin
Section Manager行业经理
分享