崗位職責(zé)
1、負(fù)責(zé)云資源池項目運維工具(監(jiān)控、自動化、CMDB等模塊)的端到端敏捷交付,制定迭代計劃(Sprint Backlog),把控需求拆解、任務(wù)分派、進度跟蹤(甘特圖/燃盡圖)及風(fēng)險管理,確保按期高質(zhì)量交付。
2、建立持續(xù)交付流水線67(CI/CD),優(yōu)化開發(fā)-測試-部署流程,提升工程效能(如代碼交付效率、缺陷密度控制)。
3、管理8-10人跨職能團隊(需求/前后端/運維開發(fā)/測試),動態(tài)分配任務(wù),解決資源沖突,組織技術(shù)評審會(架構(gòu)設(shè)計、代碼規(guī)范)、每日站會及迭代復(fù)盤,推動技術(shù)債務(wù)清理與流程改進。
4、理解云資源池業(yè)務(wù)場景,將客戶需求轉(zhuǎn)化為技術(shù)方案(如將“自動化擴容”拆解為可執(zhí)行Story點),管理需求變更并調(diào)整優(yōu)先級。
5、基于SRE框架定義SLI/SLO/SLA67(如監(jiān)控覆蓋率≥99%、自動化腳本執(zhí)行成功率≥99.9%),設(shè)計錯誤預(yù)算(Error Budget)管理機制,超閾值時暫停新功能開發(fā)并優(yōu)先修復(fù)。推動穩(wěn)定性專項治理67(容災(zāi)設(shè)計、應(yīng)急預(yù)案、故障演練),實現(xiàn)“1-5-10”故障響應(yīng)目標(biāo)(1分鐘發(fā)現(xiàn)、5分鐘響應(yīng)、10分鐘恢復(fù))。
崗位要求
1、大專及以上學(xué)歷,計算機、軟件工程或相關(guān)專業(yè),5年以上研發(fā)項目管理經(jīng)驗,至少2年運營商云計算/云資源池相關(guān)項目經(jīng)驗。
2、精通敏捷開發(fā)67(Scrum/Kanban)及DevOps工具鏈67(如GitLab CI/Jenkins/Prometheus),持有PMP或CSM認(rèn)證者優(yōu)先。
3、熟悉云原生技術(shù)棧(Kubernetes/Docker)、微服務(wù)架構(gòu)及自動化運維體系,能評審技術(shù)方案合理性(如高并發(fā)場景下的緩存設(shè)計)。
4、具備SRE實踐能力67,包括不限SLI指標(biāo)設(shè)計、監(jiān)控告警配置、容災(zāi)方案設(shè)計經(jīng)驗,熟悉AIOps應(yīng)用者優(yōu)先。
5、優(yōu)秀的客戶溝通與抗壓能力,適應(yīng)快節(jié)奏交付環(huán)境,具備技術(shù)風(fēng)險預(yù)判及決策能力(如制定功能降級策略)。
6、出色的跨團隊協(xié)調(diào)能力,能驅(qū)動開發(fā)、測試、運維高效協(xié)作,解決接口延遲、數(shù)據(jù)不一致等協(xié)作瓶頸。