1.模型調(diào)優(yōu)與部署,負(fù)責(zé)大模型(如LLaMA、
ChatGLM、deepseek)的本地化微調(diào)(SFT/RLHF)及輕量化部署,適配企業(yè)業(yè)務(wù)場景。
2.數(shù)據(jù)處理與工具開發(fā),構(gòu)建垂直領(lǐng)域數(shù)據(jù)集,設(shè)計(jì)數(shù)據(jù)清洗和增強(qiáng)方案,開發(fā)自動化評測腳本,搭建簡易版Prompt工程工具鏈,降低業(yè)務(wù)團(tuán)隊(duì)使用門檻。
3.分析模型訓(xùn)練/推理瓶頸,通過CUDA優(yōu)化、TensorRT加速、內(nèi)存管理等技術(shù)提升性能。
4.前沿技術(shù)研究,跟蹤MoE架構(gòu)、長上下文優(yōu)化:多模態(tài)對齊等前沿方向,探索創(chuàng)新性解決方案
崗位要求:
1.計(jì)算機(jī)科學(xué)、人工智能、數(shù)學(xué)等相關(guān)專業(yè)碩士及以上學(xué)歷(優(yōu)秀本科生可放寬)。
2.至少參與過1個(gè)完整的大模型應(yīng)用項(xiàng)目(如 RAG、Agent搭建)。
3.熟練使用Python,掌握PyTorchVTensorFlow框架,悉LORA、P-Tuming等輕量化微調(diào)方法。
4.了解主流大模型(如GPT、BERT)原理,能快速實(shí)現(xiàn)開源模型二次開發(fā)。
5.具備獨(dú)立解決問題能力,能快速學(xué)習(xí)新技術(shù)并適配業(yè)務(wù)需求。
6.良好的溝通能力,能與非技術(shù)團(tuán)隊(duì)協(xié)作推動模型落地