崗位職責:
1.負責大規(guī)模預(yù)訓練模型的研發(fā)工作,包括架構(gòu)設(shè)計、訓練優(yōu)化、分布式加速等核心技術(shù)攻關(guān) ;
2.主導大模型在具體業(yè)務(wù)場景(NLP/CV/多模態(tài)/生理信號等)的應(yīng)用落地,設(shè)計創(chuàng)新解決方案 ;
3.構(gòu)建模型微調(diào)、提示工程、模型壓縮等工業(yè)化應(yīng)用技術(shù)體系;
4.與產(chǎn)品、數(shù)據(jù)、工程團隊緊密協(xié)作,推動算法到產(chǎn)品的全流程落地 ;
5.跟蹤學術(shù)界與工業(yè)界前沿技術(shù)動態(tài),探索大模型領(lǐng)域創(chuàng)新方向 。
任職要求:
【硬性條件】
1.計算機/數(shù)學/ 人工智能相關(guān)專業(yè)統(tǒng)招碩士及以上學歷 ;
2.兩年以上大模型及五年以上AI算法相關(guān)研發(fā)經(jīng)驗 ;
3.深入理解Transformer/BERT/GPT等架構(gòu),掌握PyTorch/TensorFlow框架
4.具備分布式訓練實戰(zhàn)經(jīng)驗(Megatron/DeepSpeed/FairScale等) ;
5.熟悉主流大模型技術(shù)棧(LangChain/LLAMA/擴散模型等)。
【核心能力】
1.扎實的算法基礎(chǔ):精通 機器學習 / 深度學習 理論,代碼實現(xiàn)能力強(LeetCode中級以上);
2.工程落地能力:具有億級參數(shù)模型訓練調(diào)優(yōu)經(jīng)驗,熟悉模型服務(wù)化部署
3.業(yè)務(wù)洞察力:能準確理解業(yè)務(wù)需求,設(shè)計合理的模型應(yīng)用方案 ;
4.團隊協(xié)作力:優(yōu)秀的跨團隊溝通能力,能有效協(xié)調(diào)多方資源推進項目。
優(yōu)先條件:
△在ACL/NeurIPS/CVPR等頂會發(fā)表過相關(guān)論文
△有開源項目核心貢獻或Kaggle等競賽top成績
△具備多模態(tài)大模型/強化學習/知識圖譜交叉經(jīng)驗
△熟悉中醫(yī)/醫(yī)療/ 生物醫(yī)藥 等垂直領(lǐng)域知識者優(yōu)先
此職位為專家方向和工程師職位同步招聘,通過面試情況定崗,專家級直接匯報總裁,薪酬OPEN可再溝通