崗位職責(zé):
1.參與大模型訓(xùn)練框架的開發(fā)和優(yōu)化, 包括但不限于:
參與大規(guī)模分布式訓(xùn)練框架的設(shè)計(jì)、開發(fā)和優(yōu)化,提升訓(xùn)練效率和穩(wěn)定性。
參與大模型訓(xùn)練數(shù)據(jù)的預(yù)處理、清洗和增強(qiáng)等工作。
參與大模型訓(xùn)練過程中的性能監(jiān)控、問題排查和調(diào)優(yōu)。
2.參與大模型推理引擎的開發(fā)和優(yōu)化, 包括但不限于:
參與大模型推理引擎的設(shè)計(jì)、開發(fā)和優(yōu)化,提升推理速度和效率。
參與大模型壓縮、量化、蒸餾等技術(shù)的研發(fā)和應(yīng)用。
參與大模型在不同硬件平臺(tái)上的部署和優(yōu)化。
3.參與大模型相關(guān)工具和平臺(tái)的開發(fā), 包括但不限于:
參與大模型訓(xùn)練、推理、評(píng)估等工具鏈的開發(fā)。
參與大模型可視化、可解釋性等平臺(tái)的開發(fā)。
跟蹤大模型領(lǐng)域的前沿技術(shù), 進(jìn)行技術(shù)調(diào)研和原型開發(fā)。
任職要求:
1.學(xué)歷要求: 本科及以上學(xué)歷,計(jì)算機(jī)科學(xué)、軟件工程、人工智能等相關(guān)專業(yè)優(yōu)先。
2.工作經(jīng)驗(yàn): 3 年以上相關(guān)工作經(jīng)驗(yàn),有大模型開發(fā)經(jīng)驗(yàn)者優(yōu)先。
3.技能要求:
熟練掌握 Python、C++ 等編程語(yǔ)言,具備良好的代碼風(fēng)格和文檔習(xí)慣。
熟悉深度學(xué)習(xí)框架,如 PyTorch、TensorFlow 等,了解其底層原理和機(jī)制。
熟悉分布式訓(xùn)練、模型壓縮、量化、蒸餾等技術(shù)。
熟悉 Linux 操作系統(tǒng),具備良好的 shell 腳本編寫能力。
具備良好的溝通能力和團(tuán)隊(duì)合作精神。