崗位職責(zé):
1、負(fù)責(zé)大模型推理、訓(xùn)練、微調(diào)等相關(guān)算法和技術(shù)的研發(fā),包括但不限于分布式訓(xùn)練、推理加速與優(yōu)化等;
2、對(duì)業(yè)務(wù)需求,設(shè)計(jì)和實(shí)現(xiàn)大模型推理與訓(xùn)練的解決方案,并對(duì)模型性能進(jìn)行極致的優(yōu)化;
3、跟蹤和關(guān)注大模型推理訓(xùn)練領(lǐng)域的前沿技術(shù)和趨勢(shì),進(jìn)行技術(shù)調(diào)研和應(yīng)用。
任職要求:
1、計(jì)算機(jī)、人工智能、數(shù)學(xué)等相關(guān)專業(yè);
2、熟練掌握python\c++、CUDA編程語言,熟練掌握GPU優(yōu)化技術(shù);
3、熟悉深度學(xué)習(xí)、神經(jīng)網(wǎng)絡(luò)等相關(guān)理論,具有扎實(shí)的數(shù)學(xué)基礎(chǔ)和編程能力;
4、至少熟練掌握一種主流深度學(xué)習(xí)框架,如 TensorFlow、PyTorch 等。
5、具有大模型推理訓(xùn)練相關(guān)項(xiàng)目經(jīng)驗(yàn),包括但不限于自然語言處理、計(jì)算機(jī)視覺等領(lǐng)域;
6、具備良好的團(tuán)隊(duì)合作精神和溝通能力,能夠承受工作壓力。
7、應(yīng)屆畢業(yè)生需具備大模型相關(guān)項(xiàng)目經(jīng)驗(yàn)或?qū)嵙?xí)經(jīng)歷,1-3年大模型相關(guān)工作經(jīng)驗(yàn)者優(yōu)先考慮。