岗位职责:
1.大模型训练与优化: 参与大规模语言模型(LLM)推理引擎的整体设计和开发,优化引擎,算法和模型架构,提高计算性能,并参与设计与开发LLM模型和应用的端到端部署系统,提升模型与应用的交付效率;
2.应用场景落地: 结合业务需求(如对话系统、内容生成、ChatBI、Agent),熟练运用不同训练方法解决实际问题,研究和洞察大模型测试体系和数据构建方法,评估大模型在理解、推理、agent、rag等全方面的能力,有实际项目经验者优先;
3.参与产品研发: 参与公司多智能体编排框架、模型智能体库和大模型平台等相关产品的研发,追踪并实现前沿思想;
4.前沿技术研究: 跟踪大模型领域最新论文(如Transformer梨构改进、多模态融合、Agent技术等),了解行业前沿动态,不断迭代大模型相关算法模块,实现产品愿景及目标;
5.经验总结: 协助撰写技术文档、报告。
任职要求:
1.计算机、人工智能等相关专业,本科及以上学历;
2.技术基础:
· 熟悉Python和至少一种主流深度学习框架(PyTorch/TensorFlow/Paddle)
· 掌握NLP基础知识(如Transformer/BERT/GPT等模型原理);
3. 学习能力: 对大模型技术有强烈兴趣,对未来的大模型技术发展有热情和信心,能够解决实际问题;
4. 沟通能力: 良好的逻辑思维能力,沟通表达流畅。