工作職責:
1、負責公司 AI 產(chǎn)品的穩(wěn)定性、可擴展性和性能優(yōu)化;
2、管理和維護阿里云 / AWS 上的基礎(chǔ)設(shè)施與服務(wù),保證高可用與容災(zāi)能力;
3、參與 后端服務(wù)(Python / Node.js) 的運維與性能調(diào)優(yōu),支持研發(fā)團隊快速迭代;
4、維護 Postgres 數(shù)據(jù)庫與 Weaviate 向量數(shù)據(jù)庫,確保數(shù)據(jù)的可靠性與可擴展性;
5、建立并優(yōu)化監(jiān)控、日志和告警體系(Prometheus / Grafana / ELK / OpenTelemetry 等),快速響應(yīng)線上問題;
6、優(yōu)化 GitHub Actions CI/CD 流程,提升自動化程度與交付效率;
7、與前端團隊緊密協(xié)作,推動全鏈路的可觀測性與性能優(yōu)化。
任職要求:
1、本科及以上學(xué)歷,計算機或相關(guān)專業(yè),2年以上相關(guān)經(jīng)驗。
2、熟悉 Linux 系統(tǒng),精通至少一種腳本語言(Python / Go / Shell 等),熟悉React 技術(shù)棧;
3、有 云原生架構(gòu) 經(jīng)驗,熟悉 Docker、Kubernetes 的部署與運維;
4、有 阿里云 / AWS 實際運維經(jīng)驗,能獨立管理和優(yōu)化資源;
5、熟悉 Postgres 運維與優(yōu)化,有數(shù)據(jù)庫高可用和備份容災(zāi)經(jīng)驗;
6、有 CI/CD 實踐經(jīng)驗,能獨立維護和優(yōu)化 GitHub Actions 工作流;
7、具備較強的故障排查能力和系統(tǒng)性思維,能在壓力下快速響應(yīng)問題;
8、良好的團隊溝通協(xié)作能力,愿意在快速迭代的環(huán)境中保障產(chǎn)品的穩(wěn)定上線。