崗位職責(zé)
1. 負(fù)責(zé)公司系統(tǒng)的日常運(yùn)維工作并量化相關(guān)指標(biāo),及時(shí)響應(yīng)、定位、處理各類生產(chǎn)問題,要求:具備“7×24小時(shí)故障響應(yīng)意識(shí)”,能承受突發(fā)問題處理壓力。
2. 負(fù)責(zé)網(wǎng)絡(luò)、服務(wù)器、數(shù)據(jù)庫系統(tǒng)的建設(shè)、運(yùn)維和監(jiān)控,規(guī)劃、設(shè)計(jì)、完善運(yùn)維流程,推動(dòng)自動(dòng)化建設(shè),提高運(yùn)維效率,降低運(yùn)維成本;
3. 主動(dòng)發(fā)現(xiàn)業(yè)務(wù)系統(tǒng)的問題和隱患,及時(shí)對(duì)系統(tǒng)功能優(yōu)化提出合理化建議,提高系統(tǒng)的健壯性;
4. 完善監(jiān)控體系,通過各類監(jiān)控自動(dòng)化手段,確保系統(tǒng)的穩(wěn)定運(yùn)行;
5. 負(fù)責(zé)測試、灰度、生產(chǎn)多套環(huán)境的搭建、部署和維護(hù),配合研發(fā)、測試團(tuán)隊(duì)進(jìn)行應(yīng)用部署;
6. 負(fù)責(zé)參與及推動(dòng)CI/CD平臺(tái)開發(fā),推動(dòng)及開發(fā)高效的自動(dòng)化運(yùn)維、管理工具,提升運(yùn)維工作效率,提高研發(fā)效能;
7. 負(fù)責(zé)數(shù)據(jù)庫系統(tǒng)設(shè)計(jì)、實(shí)施、備份、容災(zāi)、監(jiān)控、優(yōu)化及故障處理,保障各數(shù)據(jù)系統(tǒng)安全和高可用;
8. 負(fù)責(zé)各類運(yùn)維文檔及相關(guān)工作技術(shù)文檔的撰寫工作,編制相關(guān)系統(tǒng)技術(shù)資料,推進(jìn)運(yùn)維工作標(biāo)準(zhǔn)化、規(guī)范化。;
9. 完成上級(jí)領(lǐng)導(dǎo)安排的其他任務(wù)工作。
任職要求:
工作經(jīng)驗(yàn):具備互聯(lián)網(wǎng)項(xiàng)目運(yùn)維經(jīng)驗(yàn),具備物流平臺(tái)高并發(fā)場景運(yùn)維經(jīng)驗(yàn),或熟悉OMAP/DMR等物流產(chǎn)品版本管理流程者優(yōu)先
專業(yè)要求:計(jì)算機(jī)、信息技術(shù)等相關(guān)專業(yè),持有AWS Certified SysOps Administrator、RHCE(紅帽認(rèn)證工程師)等證書者優(yōu)先。
1. 熟悉華為云、阿里云、騰訊云等云平臺(tái)常見產(chǎn)品,有云上大規(guī)模、高并發(fā)業(yè)務(wù)維護(hù)經(jīng)驗(yàn),必須掌握阿里云產(chǎn)品/服務(wù)的環(huán)境和管理,具體一定網(wǎng)絡(luò)安全知識(shí)和網(wǎng)絡(luò)安全配置能力;
2. 熟悉網(wǎng)絡(luò)原理和TCP/IP協(xié)議,精通HTTP(S)協(xié)議,能抓包分析并快速定位故障原因,熟悉交換機(jī)、路由器、防火墻、WAF等軟硬件產(chǎn)品的參數(shù)配置及優(yōu)化,能對(duì)網(wǎng)絡(luò)故障快速定位,能追蹤相關(guān)協(xié)議包深層次分析解決問題。
3. 熟練編寫shell運(yùn)維腳本、熟悉Linux(CentOS)、能熟練編寫linux系統(tǒng)命令,熟悉防火墻配置和網(wǎng)絡(luò)安全加固。
4. 熟悉Zabbix、prometheus、CAT、skywalking等監(jiān)控工具,持續(xù)集成jenkins+saltstack自動(dòng)化部署工具;
5. 熟悉Nginx、ELK、redis、RocketMQ等的高可用架構(gòu),熟悉其部署及配置調(diào)優(yōu)。有分布式、大規(guī)模數(shù)據(jù)處理維護(hù)經(jīng)驗(yàn)的優(yōu)先;
6. 熟悉容器云技術(shù),深入了解微服務(wù)架構(gòu),有豐富的docker和k8s管理經(jīng)驗(yàn),有大規(guī)模k8s集群運(yùn)維經(jīng)驗(yàn),能夠熟練部署和運(yùn)維Kubernetes環(huán)境,能夠編寫常見應(yīng)用的編排文件。
7. 具備良好的溝通能力和問題解決能力,可以接受早晚班及特殊時(shí)間段運(yùn)維工作安排能夠有效地與同事、管理層和其他部門進(jìn)行溝通和協(xié)作。
8. 悉MySQL、Postgres數(shù)據(jù)庫結(jié)構(gòu)與原理、數(shù)據(jù)結(jié)構(gòu)設(shè)計(jì)、性能調(diào)優(yōu)和日常故障解決方法;
9. 熟悉MySQL主從復(fù)制,讀寫分離、分庫分表設(shè)計(jì);熟悉主流數(shù)據(jù)庫細(xì)粒度資源管理策略優(yōu)化,掌握數(shù)據(jù)備份與恢復(fù)方案;
10. 熟練使用Tidb集群、Redis集群、Elasticsearch集群 ,了解Doris、ClickHouse等數(shù)據(jù)庫優(yōu)先。
11. 熟悉數(shù)據(jù)庫安全?管理,包括權(quán)限控制、審計(jì)日志、數(shù)據(jù)加密(TLS/SSL)。