崗位職責(zé):
1. 企業(yè)級AI中臺架構(gòu)設(shè)計(jì)
a) 主導(dǎo)AI能力中臺核心模塊研發(fā)(含數(shù)據(jù)治理、模型管理、服務(wù)編排、資源調(diào)度),設(shè)計(jì)標(biāo)準(zhǔn)化AI能力接口(REST/gRPC)
b) 構(gòu)建服務(wù)化組件(如特征計(jì)算引擎、統(tǒng)一監(jiān)控告警平臺),支持業(yè)務(wù)部門快速復(fù)用AI基礎(chǔ)能力
2. SDK/API服務(wù)體系建設(shè)
a) 設(shè)計(jì)開發(fā)者友好的SDK工具鏈(含多語言支持、安全鑒權(quán)、Mock測試環(huán)境)
b) 主導(dǎo)API網(wǎng)關(guān)架構(gòu)升級,實(shí)現(xiàn)服務(wù)限流熔斷、灰度發(fā)布、調(diào)用鏈追蹤一體化
c) 開發(fā)自動化API文檔生成與版本兼容性檢測工具
3. 全棧效能提升
a) 搭建模型即服務(wù)(MaaS)平臺,實(shí)現(xiàn)從模型訓(xùn)練到API發(fā)布的自動化流水線
b) 構(gòu)建企業(yè)內(nèi)部AI資產(chǎn)中心(含預(yù)訓(xùn)練模型庫、數(shù)據(jù)集管理、Prompt模板市場)
4. 企業(yè)級支持系統(tǒng)
a) 設(shè)計(jì)分布式調(diào)試工具鏈,支持跨部門協(xié)作問題定位(如日志血緣追蹤、GPU資源爭用分析)
b) 開發(fā)SDK兼容性驗(yàn)證套件(適配Windows/Linux多版本、ARM/X86架構(gòu))
任職要求:
1.本科以上學(xué)歷,5年以上AI架構(gòu)設(shè)計(jì)經(jīng)驗(yàn);
2.負(fù)責(zé)過完整參與過2個(gè)以上AI中臺架構(gòu)建設(shè)(必須包含數(shù)據(jù)/模型/服務(wù)管理至少兩大子系統(tǒng));深度掌握微服務(wù)治理框架(Spring Cloud/Dubbo,需提供設(shè)計(jì)方案示例);實(shí)現(xiàn)過日均調(diào)用量>10萬次的API服務(wù)集群調(diào)優(yōu)
3.具備SDK/API開發(fā)能力:主導(dǎo)過企業(yè)級SDK開發(fā)(包含自動更新/埋點(diǎn)上報(bào)等機(jī)制),精通OpenAPI規(guī)范,具備API網(wǎng)關(guān)二次開發(fā)經(jīng)驗(yàn),完成過API調(diào)用成功率>99.99%的服務(wù)保障方案設(shè)計(jì),有兼容 OpenAI API 接口標(biāo)準(zhǔn)的 API 開發(fā)經(jīng)驗(yàn)
4. 核心技術(shù)棧:
a) Kubernetes+Docker生態(tài)、Protobuf/gRPC協(xié)議棧、ELK日志體系
b) 前端:React/Vue+數(shù)據(jù)可視化(ECharts/D3),Headless 組件開發(fā)
c) 后端:Go/Python高并發(fā)服務(wù)開發(fā),熟悉Celery/RabbitMQ異步任務(wù)調(diào)度
d) AI框架:PyTorch/TensorFlow模型優(yōu)化,主流推理服務(wù)部署框架
5. 行業(yè)適配性要求
a) 具有企業(yè)私有化部署支持經(jīng)驗(yàn)(需提供鯤鵬/飛騰平臺兼容性驗(yàn)證報(bào)告)
b) 熟悉IDC機(jī)房與云原生混合部署模式的基礎(chǔ)設(shè)施差異
c) 曾推動過中臺能力在至少3個(gè)業(yè)務(wù)部門的規(guī)?;瘧?yīng)用