1. 負責Linux系列操作系統(tǒng)(含Ubuntu、CentOS、RedHat等)服務(wù)器的部署、安裝、配置、初始化及日常運維管理,保障服務(wù)器集群穩(wěn)定、高效運行。
2. 承擔Ubuntu等系統(tǒng)環(huán)境下的應(yīng)用服務(wù)(如Nginx、Apache、MySQL、Redis、Docker等)的部署、配置、優(yōu)化及故障排查,確保業(yè)務(wù)應(yīng)用正常上線與持續(xù)運行。
3. 制定并執(zhí)行服務(wù)器及系統(tǒng)的監(jiān)控策略,利用Zabbix、Prometheus、Grafana等監(jiān)控工具,實時監(jiān)控系統(tǒng)資源(CPU、內(nèi)存、磁盤、網(wǎng)絡(luò))、服務(wù)狀態(tài)及業(yè)務(wù)指標,及時發(fā)現(xiàn)并預(yù)警異常問題。
4. 負責Linux/Ubuntu系統(tǒng)及業(yè)務(wù)的備份與恢復(fù)方案設(shè)計、實施,定期執(zhí)行數(shù)據(jù)備份操作,驗證備份有效性,確保在突發(fā)故障時能快速恢復(fù)數(shù)據(jù)與服務(wù)。
5. 開展系統(tǒng)安全防護工作,包括但不限于Ubuntu/Linux系統(tǒng)漏洞掃描與修復(fù)、防火墻規(guī)則配置、SSH安全加固、權(quán)限管理、病毒防護、入侵檢測等,保障服務(wù)器集群與業(yè)務(wù)數(shù)據(jù)的安全性。
6. 優(yōu)化Linux/Ubuntu系統(tǒng)性能,針對系統(tǒng)資源占用、網(wǎng)絡(luò)延遲、應(yīng)用響應(yīng)速度等問題進行分析與調(diào)優(yōu),提升服務(wù)器集群的整體運行效率;參與服務(wù)器硬件選型、資源擴容規(guī)劃與實施。
7. 負責運維自動化腳本(Shell、Python等)的編寫與優(yōu)化,實現(xiàn)服務(wù)器批量管理、配置自動化、故障自動告警與初步處理等,提升運維工作效率。
8. 處理日常運維故障,包括系統(tǒng)宕機、服務(wù)異常、網(wǎng)絡(luò)故障、數(shù)據(jù)異常等,快速定位問題根源并實施解決方案;記錄故障處理過程,形成運維知識庫。
9. 配合開發(fā)團隊完成應(yīng)用上線、版本迭代、測試環(huán)境搭建等工作,提供Linux/Ubuntu系統(tǒng)層面的技術(shù)支持,協(xié)助解決開發(fā)過程中遇到的運維相關(guān)問題。
10. 關(guān)注Linux及Ubuntu系統(tǒng)相關(guān)技術(shù)動態(tài),學習前沿運維技術(shù)(如容器化、云原生、K8s等),并結(jié)合實際業(yè)務(wù)場景推動運維架構(gòu)優(yōu)化與技術(shù)升級。
11. 編寫并完善運維文檔,包括系統(tǒng)配置手冊、運維操作手冊、故障處理手冊、應(yīng)急預(yù)案等,規(guī)范運維工作流程。