1.負(fù)責(zé)智能網(wǎng)卡服務(wù)Oncall,處理用戶關(guān)于智能網(wǎng)卡功能異常、性能瓶頸、權(quán)限開通等咨詢,輸出故障分析報告及優(yōu)化建議(如RDMA延遲優(yōu)化、VxLAN配置調(diào)優(yōu));推動智能網(wǎng)卡服務(wù)流程標(biāo)準(zhǔn)化,建立常見問題知識庫,縮短故障平均恢復(fù)時間(MTTR)。
2.負(fù)責(zé)智能網(wǎng)卡運(yùn)維,負(fù)責(zé)智能網(wǎng)卡告警處理、建立分級告警、提升告警有效性,推動告警自動化處置及工具建設(shè); 負(fù)責(zé)智能網(wǎng)卡版本升級工作,推動升級自動化流程和工具建設(shè);編寫運(yùn)維文檔(SOP、故障處理手冊),推動運(yùn)維流程標(biāo)準(zhǔn)化;
3.負(fù)責(zé)智能網(wǎng)卡運(yùn)維質(zhì)量,缺陷改進(jìn)推動、長期問題跟進(jìn)、供應(yīng)商對接、運(yùn)營質(zhì)量數(shù)據(jù)統(tǒng)計分析、報表制作輸出等。
任職要求
1.大學(xué)??萍耙陨蠈W(xué)歷,2年及以上云計算基礎(chǔ)設(shè)施運(yùn)維經(jīng)驗(yàn);
2.掌握Linux操作系統(tǒng)、Shell/Python腳本開發(fā),熟悉網(wǎng)絡(luò)協(xié)議(TCP/IP、VxLAN、RDMA),熟悉云計算架構(gòu)(虛擬化、容器化),具備數(shù)據(jù)中心物理/虛擬網(wǎng)絡(luò)運(yùn)維經(jīng)驗(yàn);
3.熟悉FPGA/DPU、PCIE、SPDK等技術(shù),熟練使用相關(guān)工具,具有DPDK/SPDK/Virtio驅(qū)動開發(fā)或調(diào)優(yōu)經(jīng)驗(yàn)、熟悉服務(wù)器硬件,持有云計算或網(wǎng)絡(luò)認(rèn)證者優(yōu)先;
4.具備多部門協(xié)作能力,良好的溝通表達(dá)能力,對智能網(wǎng)卡相關(guān)技術(shù)有熱情,主動追蹤智能網(wǎng)卡技術(shù)演進(jìn)(如DPU編程模型、eBPF卸載技術(shù)),能通過工具研發(fā)提升運(yùn)維效率。