崗位職責:
1. 面向人工智能、科學計算與大數(shù)據(jù)處理融合的智能體系結(jié)構(gòu),開展大規(guī)模預訓練模型相關研究。包括但不限于數(shù)據(jù)清洗、算法設計、訓練推理、模型壓縮等研究方向。
2. 與團隊成員協(xié)同工作,設計實現(xiàn)各種模塊或功能,并進行性能調(diào)優(yōu);解決大規(guī)模預訓練模型研發(fā)過程中遇到的算法問題,如進行模型評測、緩解模型幻覺等。
3. 探索創(chuàng)新:積極探索新方法、不斷提升工作效率及團隊協(xié)調(diào)開發(fā)能力。
任職要求:
1.碩士及以上學歷,計算機科學與技術專業(yè)優(yōu)先, 軟件工程/人工智能/大數(shù)據(jù)/電子信息/通信等相關專業(yè)優(yōu)先。
2.良好的編程風格與文檔撰寫能力,有多人協(xié)作開發(fā)及 Code Review 經(jīng)驗,對代碼有嚴格的質(zhì)量要求;熟悉常見開發(fā)規(guī)范,熟悉git等開發(fā)工具,熟悉代碼庫的創(chuàng)建與維護操作。
3.掌握深度學習基礎知識,至少熟悉一種深度學習編程框架,如PyTorch、Tensorflow、Paddle、MindSpore等,有模型開發(fā)、部署、微調(diào)經(jīng)驗。
4. 對Transformer、預訓練模型有一定深度的理解和經(jīng)驗,能根據(jù)論文復現(xiàn)相關算法,有大規(guī)模預訓練模型研發(fā)和訓練經(jīng)驗者優(yōu)先;高質(zhì)量相關論文ACL,EMNLP,COLING,NAACL作者優(yōu)先。