岗位职责:协助工程研究员开展AI模型工程化相关工作,如框架设计、模型优化、推理加速等。
岗位要求:
1、计算机、人工智能等相关专业硕士以上学历,具备C/C++/Python/CUDA等编程经验及工程化经验
2、了解深度学习算法(transformer、LLM、VLM、DM等)及及常用开源大模型
3、了解AI常用训练和部署(PyTorch/DeepSpeed/QNN/vllm/
TensorRT/sglang/ktransformer/openvino/ncnn/onnx等)应用与原理
4、了解常见模型轻量化方法(量化AWQ/GPTQ、剪枝、蒸馏等)和大模型推理加速(off-loading、投机采样等)及相关工具链
5、有CUDA性能优化及其他硬件(如 CPU、NPU 等)的使用、相关的性能调优经验,如FastTransformer、TensorRT、triton等经验优先
6. 加分项:有大模型分布式推理引擎开发经验;国际竞赛和核心会议发文
7、加分项:有AI Infra公司和AI芯片公司、大语言模型推理框架研发经验优先
8、加分项:有内存管理、算子优化、机器学习编译、异步并发、IO优化相关研发经验优先
企业其他招聘信息
测试技术支持工程师
2025-08-15
光学技术支持工程师
2025-08-15
结构技术支持工程师
2025-08-15
高频技术支持工程师
2025-08-15
电话销售
2025-08-15
测试工程师
2025-08-15