500强医疗设备公司
高性能计算工程师
Medical Devices & Equipment
Medical
Beijing
3-5 years
Master
Negotiable
Company Introduction
a leading global medical technology and digital solutions innovator.
Job Description
岗位职责
负责大语言模型(LLM,如GPT、Llama等)在高性能计算平台上的部署、优化与维护;
参与AI模型的分布式训练、推理加速、并行计算等相关技术研发;
设计和实现高效的模型推理服务,支持大规模并发和低延迟需求;
跟踪前沿AI模型和HPC技术,推动新技术在团队内落地;
与算法、平台、运维等团队协作,保障模型在生产环境的稳定运行;
编写相关技术文档,参与团队技术分享。
Job Requirements
任职要求
计算机、人工智能、数学、物理等相关专业本科及以上学历;
熟悉主流大语言模型(如GPT、Llama、Mistral等)原理及其训练/推理流程;
有大模型(LLM)在GPU/多机多卡环境下的部署、优化经验;
熟悉高性能计算(HPC)相关技术,如MPI、NCCL、分布式训练、模型并行/数据并行等;
熟练掌握Python,了解C++/CUDA等底层优化加分;
熟悉主流深度学习框架(如PyTorch、TensorFlow、DeepSpeed、Megatron等);
有云平台(如AWS、Azure、阿里云等)或本地集群的模型部署经验优先;
具备良好的沟通能力和团队协作精神,具备较强的分析和解决问题能力。
加分项
有大模型推理引擎(如vLLM、Triton Inference Server、TensorRT-LLM等)实际部署经验;
参与过开源大模型社区或有相关论文/专利发表;
有AI产品化落地经验
Share