崗位要求:
1.熟練運(yùn)維主流Linux操作系統(tǒng)如SUSE,RHEL和Ubunty,有系統(tǒng)運(yùn)維經(jīng)驗(yàn)
2.對 HPC 集群和高性能存儲有一定的了解,能基本操作數(shù)據(jù)中心以太網(wǎng)絡(luò)和 InfiniBand 網(wǎng)絡(luò)
3.熟悉基本的系統(tǒng)和集群監(jiān)控工具,如Zabbix和Grafana,有基本的腳本編寫能力
工作職責(zé):
1.監(jiān)控數(shù)據(jù)處理平臺,及時處理告警,并定期對平臺進(jìn)行巡檢。
2.負(fù)責(zé)平臺運(yùn)行中的各種故障,必要時按照流程進(jìn)行升級。按照客戶的流程執(zhí)行維護(hù)和變更