【本科以上學(xué)歷,計算機相關(guān)專業(yè)優(yōu)先,學(xué)信網(wǎng)可查,能接受長期穩(wěn)定駐場辦公】
崗位職責(zé):
1.協(xié)助完成AI管理平臺功能測試、產(chǎn)品選型及平臺實施。
2.協(xié)助完成AI服務(wù)器選型和測試,包括GPU服務(wù)器基準(zhǔn)性能和精度測試,為采購提供選型依據(jù);
3.協(xié)助管理GPU資源和有效分配,優(yōu)化集群資源利用率,提升AI訓(xùn)推效率和吞吐量。
4.協(xié)助GPU集群的日常運維,包括但不限于系統(tǒng)部署、配置管理、監(jiān)控告警、故障排查與解決,確保集群的高效穩(wěn)定運行。
任職要求:
1.了解Linux系統(tǒng)操作及Shell/Python腳本編寫,能完成自動化腳本的簡單調(diào)整;
2.熟悉GPU、NPU芯片架構(gòu),及主流AI服務(wù)器性能特性;
3. 了解虛擬化、容器化技術(shù)(如Docker/Kubernetes),具備云計算平臺(如阿里云/華為云)基礎(chǔ)操作經(jīng)驗優(yōu)先;
4.掌握服務(wù)器硬件基礎(chǔ)維護知識,了解GPU/NPU等異構(gòu)算力資源管理邏輯;
5.對AI技術(shù)有熱情,具備強烈的探索精神、優(yōu)秀的動手能力、較強的問題分析解決能力,具備良好的問題解決能力和團隊合作精神,及良好的文檔編寫和知識沉淀能力。