崗位職責(zé):
1. 預(yù)訓(xùn)練模型(LM),包括多語言LM,多模態(tài)LM;
2. 研究融入知識的語言大模型;
3. 探索預(yù)訓(xùn)練語言模型的蒸餾、壓縮;
4.可控內(nèi)容生成、文字-圖像生成;
5. 研究模型訓(xùn)練、推理的加速算法、微調(diào)技巧等;
6. 研發(fā)預(yù)訓(xùn)練模型的相關(guān)應(yīng)用,例如:對話、推薦、內(nèi)容生成、翻譯等。
任職要求:
1.研究生及以上學(xué)歷,計算機(jī)、數(shù)學(xué)、自動化、信號處理等相關(guān)專業(yè);
2.具備優(yōu)秀的代碼能力、數(shù)據(jù)結(jié)構(gòu)和基礎(chǔ)算法功底,熟練使用C/C++或Python,ACM/ICPC、NOI/IOI、Top Coder、Kaggle等比賽獲獎?wù)邇?yōu)先;
3.熟悉NLP相關(guān)算法和技術(shù),熟悉大模型訓(xùn)練、知識圖譜、LangChain、Multi Agent或流程編排者優(yōu)先,有相關(guān)論文或主導(dǎo)過優(yōu)秀開源項目者優(yōu)先;
4.具備出色的問題分析、定位和解決能力,能深入解決大模型訓(xùn)練和應(yīng)用中存在的問題。
5.積極良好的溝通協(xié)作能力,能和團(tuán)隊一起探索新技術(shù),推動技術(shù)進(jìn)步。