🔥 主题:
运维工程师 (Operations Engineer)
💸 薪水:面议
🏢 地点:洛杉矶 大洛杉矶县
🍻 分类:技师工程
🕕 时间:05/04/25
💬 联系:[email protected]
职位:运维工程师 (Operations Engineer)
性质:全职
地点:洛杉矶(OC/LA)
语言:中/英文流利
福利:带薪假,退休计划, 午餐/油费补贴
起薪:根据应聘者经验,面议
应聘:请Email简历 [email protected]
职责覆盖:
硬件运维: GPU服务器的上架、布线、硬件巡检、告警处理。
系统运维: Linux操作系统安装、驱动(CUDA/NVIDIA)部署、AI框架环境(如 PyTorch)安装。
性能监控与资源管理: 使用如 nvidia-smi 等工具监控 GPU 利用率、温度等指标。
文档与流程规范: 操作文档维护,参与 SOP 流程建设。
资源与工单管理: 协助登记设备资源、执行工单任务等。
任职要求:
熟悉 Linux 命令与系统调试,了解主流 GPU 型号, 熟悉 CUDA 驱动、Docker 容器
有1年+数据中心或GPU环境经验
加分技能:
有 DGX/HGX 的运维经验
熟悉 Prometheus、Grafana、Zabbix
有 Python/Bash 脚本经验
联系时请说是在美国工作网上看到的😎