崗位職責(zé):
1.跟蹤主流開源大模型(如 GPT 、 LLaMA 、 DeepSeek 、 Qwen 等)技術(shù)演進(jìn),結(jié)合業(yè)務(wù)場景進(jìn)行模型預(yù)訓(xùn)練、微調(diào)與定制化開發(fā);2.負(fù)責(zé)大模型在對話系統(tǒng)、代碼生成、知識問答、智能寫作等方向的應(yīng)用落地;
3.與產(chǎn)品、工程、行業(yè)專家緊密協(xié)作,實現(xiàn)語言模型在實際業(yè)務(wù)中的高性能部署與持續(xù)優(yōu)化;
任職要求:
1.本科及以上學(xué)歷,計算機、人工智能、數(shù)學(xué)等相關(guān)專業(yè);
2.深入理解 Transformer 、 Attention 機制、預(yù)訓(xùn)練﹣微調(diào)范式、指令微調(diào)、 RLHF 等語言模型核心技術(shù);
3.有大模型訓(xùn)練經(jīng)驗,熟悉分布式訓(xùn)練框架(如 Deepspeed 、 FSDP 、 Megatron );
4.至少有1個成功的大模型應(yīng)用落地項目經(jīng)驗,具備完整的工程與評估閉環(huán);
5.熟悉中文語料構(gòu)建與清洗,具備 Prompt 工程、 RAG 、長上下文建模等實踐經(jīng)驗者優(yōu)先;
6.具備優(yōu)秀的技術(shù)文檔編寫能力與團(tuán)隊溝通協(xié)作能力。
注:可購買深圳或成都的社保,但具體工作地點base潮州/德陽/南充。