1.負(fù)責(zé)公有云/專有云平臺的日常運維、資源管理與架構(gòu)優(yōu)化,保障系統(tǒng)高可用與安全。
2.維護(hù)基于Docker和Kubernetes的容器化環(huán)境,實現(xiàn)服務(wù)的穩(wěn)定部署與高效編排。
3.設(shè)計和優(yōu)化CI/CD流水線,支持Java微服務(wù)的持續(xù)集成與自動化發(fā)布。
4.建立監(jiān)控告警體系,及時響應(yīng)和處理系統(tǒng)故障,推動穩(wěn)定性改進(jìn)。
5.通過Ansible、Terraform等工具實現(xiàn)運維自動化,提升基礎(chǔ)設(shè)施管理效率。
6.協(xié)同開發(fā)、業(yè)務(wù)等多團(tuán)隊,高效推進(jìn)技術(shù)問題解決與項目落地。
【崗位要求】
1.計算機(jī)相關(guān)專業(yè),本科及以上學(xué)歷,至少5年及以上互聯(lián)網(wǎng)運維工作經(jīng)驗。
2.熟悉AWS、阿里云等云平臺服務(wù),具備云資源運維和成本管理經(jīng)驗。
3.精通Docker和Kubernetes,能夠部署維護(hù)集群并處理常見故障。
4.掌握J(rèn)enkins/GitLab CI等CI/CD工具,有微服務(wù)自動化部署實踐經(jīng)驗。
5.具備較強(qiáng)的故障定位和應(yīng)急處理能力,熟悉監(jiān)控工具如Prometheus/Grafana。
6.熟練使用Ansible、Terraform等自動化運維工具,有Python/Shell腳本開發(fā)能力。
7.良好的溝通協(xié)作能力和責(zé)任心,能適應(yīng)一定工作壓力。
8.持有阿里云ACP、CKA/CKS、HCIP/HCIE證書者優(yōu)先。