崗位職責(zé)
1.主導(dǎo)代碼大模型的架構(gòu)設(shè)計與研發(fā)工作,參與模型核心算法的迭代優(yōu)化?;
2.深度參與大模型原理研究,制定針對性的微調(diào)策略,重點提升模型在代碼生成、邏輯推理、多語言支持等任務(wù)中的效果?;
3.負(fù)責(zé)模型訓(xùn)練全流程管控,包括數(shù)據(jù)去重、預(yù)處理、訓(xùn)練參數(shù)調(diào)優(yōu)及算子優(yōu)化等關(guān)鍵環(huán)節(jié)?;
4.推動研發(fā)成果在實際項目中的落地應(yīng)用,跟進(jìn)技術(shù)驗證與問題修復(fù),確保模型性能達(dá)標(biāo)。
任職要求
1.211/985 院校研究生及以上學(xué)歷(在讀、應(yīng)屆或畢業(yè)五年內(nèi)均可)計算機科學(xué)、人工智能、軟件工程等相關(guān)專業(yè)優(yōu)先?;
2.具備代碼生成大模型或其他大模型微調(diào)相關(guān)項目經(jīng)驗,熟悉模型訓(xùn)練全流程(數(shù)據(jù)處理 - 模型調(diào)優(yōu) - 效果驗證)?;
3.?精通 Python/C++ 編程語言,能獨立完成算法代碼實現(xiàn)與工程化落地?
熟悉 CUDA、TVM 或 OpenCL 等加速框架,了解 GPU 并行計算原理?;擁有扎實的算法推導(dǎo)能力與工程實踐經(jīng)驗,能解決模型訓(xùn)練中的復(fù)雜技術(shù)問題?;
4.協(xié)作能力:具備優(yōu)秀的遠(yuǎn)程協(xié)作意識與獨立推進(jìn)能力,能在無現(xiàn)場監(jiān)督的情況下高效完成工作任務(wù)。
亮點
1.彈性工作時間,無需坐班,平衡工作與個人安排,遠(yuǎn)程線上協(xié)作,通過視頻會議、即時通訊工具同步項目進(jìn)展?;
2.清晰的任務(wù)目標(biāo)與合理的交付周期,避免無效加班;
3.項目結(jié)束后可獲得項目參與證明,優(yōu)秀貢獻(xiàn)者有機會建立長期合作關(guān)系。