1.负责服务器硬件日常工单监控确保稳定运行、及时处理硬件故障维护与故障排查;
2.负责GPU服务器及相关设备的硬件更换(如GPU卡、硬盘、内存、电源、主板等)和基础配置;
3.收集日志分析故障根本原因,提供详细的故障分析报告;
4.有服务器(NVLINK/PCIE)故障定位/维修更换能力经验;
5.严格遵守数据中心的各项安全规则、维修操作和设备保密协议。
企业其他招聘信息
运维开发工程师
2026-03-11
网络工程师
2026-03-11
Python/go开发工程师
2026-03-11
高性能集群调优工程师
2026-03-11
AI推理框架工程师
2026-03-11
Golang开发工程师
2026-03-11