崗位職責(zé)
1. 參與容器云平臺(tái)開(kāi)發(fā)與維護(hù),參與可觀測(cè)性體系建設(shè),負(fù)責(zé)指標(biāo)、日志系統(tǒng)開(kāi)發(fā)與維護(hù),提升采集與查詢效率。
2. 保障Kubernetes集群的穩(wěn)定性,包括容量管理、巡檢、性能優(yōu)化和資源治理;參與容器云內(nèi)業(yè)務(wù)負(fù)載上線、故障定位與問(wèn)題解決,推動(dòng)自動(dòng)化與可靠性改進(jìn)。
3. 保障網(wǎng)關(guān)組件的穩(wěn)定性,優(yōu)化流量策略管理,推進(jìn)全鏈路追蹤、灰度發(fā)布和流量觀測(cè)能力建設(shè)。
4. 參與7x24小時(shí)告警響應(yīng)體系,處理線上突發(fā)問(wèn)題,推進(jìn)問(wèn)題復(fù)盤,推動(dòng)根因修復(fù)和穩(wěn)定性提升。
崗位要求
1. 熟練掌握Golang,有容器云相關(guān)開(kāi)發(fā)經(jīng)驗(yàn)。
2. 掌握容器技術(shù)和Kubernetes,深入理解K8s核心原理及其生態(tài),有K8s集群運(yùn)維管理經(jīng)驗(yàn)。
3. 熟悉可觀測(cè)性技術(shù)棧,包括Prometheus、Alertmanager、Grafana、阿里云SLS、華為云LTS、ELK等;能基于此進(jìn)行二次開(kāi)發(fā)。
4. 理解服務(wù)網(wǎng)關(guān)和流量治理,熟悉 APISIX、Envoy 或 Nginx的路由、限流、熔斷、鑒權(quán)等能力;能基于此進(jìn)行二次開(kāi)發(fā)。
5. 具備線上問(wèn)題定位與處理經(jīng)驗(yàn),能高效處理K8s與網(wǎng)關(guān)故障;能接受 On-call。