1、負(fù)責(zé)公司 AI 技術(shù)體系整體架構(gòu)設(shè)計(jì)、技術(shù)選型與演進(jìn)規(guī)劃,保障系統(tǒng)高可用、高性能、可擴(kuò)展、低成本。
2、主導(dǎo)大模型、NLP、ASR/TTS、多模態(tài)、知識(shí)圖譜、向量數(shù)據(jù)庫(kù)等 AI 能力的架構(gòu)落地與工程化。
3、負(fù)責(zé) AI 服務(wù)的訓(xùn)練 / 推理部署、分布式架構(gòu)、調(diào)度優(yōu)化、性能瓶頸攻堅(jiān),提升模型吞吐與響應(yīng)效率。
4、牽頭解決 AI 系統(tǒng)核心技術(shù)難題:模型微調(diào)、RAG 架構(gòu)、Prompt 工程、知識(shí)庫(kù)構(gòu)建、Bad Case 治理、內(nèi)容安全與合規(guī)。
5、帶領(lǐng) / 支撐研發(fā)團(tuán)隊(duì),制定技術(shù)規(guī)范、代碼質(zhì)量標(biāo)準(zhǔn)、CI/CD 與運(yùn)維體系,推動(dòng)技術(shù)落地與迭代效率。
6、跟蹤前沿 AI 技術(shù)與開源生態(tài),進(jìn)行技術(shù)預(yù)研與落地,構(gòu)建公司核心技術(shù)壁壘。
7、與產(chǎn)品、業(yè)務(wù)、算法團(tuán)隊(duì)深度協(xié)同,輸出技術(shù)方案、架構(gòu)文檔、風(fēng)險(xiǎn)評(píng)估與排期規(guī)劃。
8、負(fù)責(zé)技術(shù)團(tuán)隊(duì)人才梯隊(duì)建設(shè),提升整體技術(shù)能力。
任職要求:
1、研究生及以上學(xué)歷,計(jì)算機(jī)、軟件工程、人工智能、自動(dòng)化等相關(guān)專業(yè),3-5 年及以上AI 架構(gòu)經(jīng)驗(yàn)。
2、精通至少一種主流語言:Python/Java/C++/Go,具備扎實(shí)的分布式系統(tǒng)、微服務(wù)、高并發(fā)架構(gòu)能力。
3、深入理解 AI 工程化全流程:模型訓(xùn)練、微調(diào)、蒸餾、量化、導(dǎo)出、打包、部署、服務(wù)化、監(jiān)控運(yùn)維。
4、熟練掌握大模型相關(guān)技術(shù)棧:LLM、RAG、Embedding、向量庫(kù)、Promp優(yōu)化、LangChain、LlamaIndex 等。
5、有實(shí)際 AI 服務(wù) / 大模型應(yīng)用從 0 到 1 架構(gòu)與落地經(jīng)驗(yàn),具備性能優(yōu)化、成本優(yōu)化、穩(wěn)定性保障實(shí)戰(zhàn)經(jīng)驗(yàn)。
6、具備良好的系統(tǒng)分析、架構(gòu)設(shè)計(jì)、技術(shù)攻關(guān)與跨團(tuán)隊(duì)推動(dòng)能力,能獨(dú)立負(fù)責(zé)復(fù)雜系統(tǒng)架構(gòu)。
7、熟悉云原生:Docker、K8s、微服務(wù)、中間件、云服務(wù)優(yōu)先。
8、積極主動(dòng),抗壓能力強(qiáng),有技術(shù)負(fù)責(zé)人 / 架構(gòu)師帶隊(duì)經(jīng)驗(yàn)優(yōu)先。