【任職要求】
1. 教育背景:
- 計(jì)算機(jī)科學(xué)、人工智能相關(guān)領(lǐng)域的本科及以上學(xué)歷,985、211、雙一流優(yōu)先。
2. 技術(shù)能力:
- 熟悉深度學(xué)習(xí)、自然語(yǔ)言處理、計(jì)算機(jī)視覺(jué)等領(lǐng)域的基本理論和算法。
- 具備大規(guī)模預(yù)訓(xùn)練模型(如GPT、BERT、Transformer等)的研發(fā)經(jīng)驗(yàn)。
- 熟悉分布式訓(xùn)練框架(如PyTorch、TensorFlow、Horovod等),并具備性能優(yōu)化經(jīng)驗(yàn)。
- 熟悉模型壓縮技術(shù)(如剪枝、量化、蒸餾等)者優(yōu)先。
- 具備多模態(tài)大模型研發(fā)經(jīng)驗(yàn)者優(yōu)先。
3. 編程能力:
- 熟練掌握Python、C++、C等任意一種編程語(yǔ)言,具備良好的代碼風(fēng)格和工程能力。
- 熟悉Linux開(kāi)發(fā)環(huán)境,具備大規(guī)模數(shù)據(jù)處理和分布式系統(tǒng)開(kāi)發(fā)經(jīng)驗(yàn)。
4.成功案例:
-有提供解決方案能力。
-有工程方向AI研究案例。
【工作職責(zé)】
1. 大模型研發(fā)與優(yōu)化:
- 負(fù)責(zé)大規(guī)模預(yù)訓(xùn)練模型(如NLP、CV、多模態(tài)等)的算法設(shè)計(jì)與研發(fā),包括模型架構(gòu)創(chuàng)新、訓(xùn)練策略?xún)?yōu)化等。
- 探索大模型的高效訓(xùn)練方法,解決數(shù)據(jù)并行、模型并行、流水線(xiàn)并行等技術(shù)難題。
- 針對(duì)特定業(yè)務(wù)場(chǎng)景,進(jìn)行模型剪枝、量化、蒸餾等優(yōu)化,提升模型推理效率。
2. 分布式訓(xùn)練與性能優(yōu)化:
- 設(shè)計(jì)和優(yōu)化大規(guī)模分布式訓(xùn)練框架,提升訓(xùn)練效率與資源利用率。
- 解決大規(guī)模訓(xùn)練中的性能瓶頸問(wèn)題,包括通信優(yōu)化、內(nèi)存優(yōu)化等。
3. AI技術(shù)落地與應(yīng)用:
- 將大模型技術(shù)與云計(jì)算業(yè)務(wù)場(chǎng)景結(jié)合,推動(dòng)AI技術(shù)在智能客服、智能體、知識(shí)庫(kù)、內(nèi)容生成、數(shù)據(jù)分析等領(lǐng)域的應(yīng)用落地。
- 與產(chǎn)品團(tuán)隊(duì)緊密合作,提供技術(shù)支持和解決方案,確保技術(shù)成果的快速轉(zhuǎn)化。
4. 前沿技術(shù)研究:
- 跟蹤AI領(lǐng)域的最新研究成果,探索大模型技術(shù)的前沿方向,如自監(jiān)督學(xué)習(xí)、強(qiáng)化學(xué)習(xí)、多模態(tài)融合等。
- 參與學(xué)術(shù)交流與技術(shù)分享,提升團(tuán)隊(duì)的技術(shù)影響力。