崗位內(nèi)容:
1、研究前沿算法(如多模態(tài)對齊、推理加速、Agent記憶機制)
2、訓(xùn)練/微調(diào)大模型(全參數(shù)調(diào)、LoRA、QLoRA)
3、優(yōu)化模型推理速度與顯存占用(量化、剪枝、蒸餾)
4、構(gòu)建評估體系,對比不同模型在業(yè)務(wù)指標(biāo)上的表現(xiàn)
5、將模型部署到生產(chǎn)環(huán)境(API服務(wù)、邊緣設(shè)備)
6、設(shè)計并實現(xiàn)基于大模型的智能應(yīng)用(如AI客服、智能寫作、知識問答系統(tǒng))
7、使用RAG(檢索增強生成)構(gòu)建企業(yè)知識庫問答系統(tǒng)
8、編寫高質(zhì)量Prompt并進(jìn)行A/B測試,優(yōu)化輸出效果
9、開發(fā)Agent工作流(如自動訂票、多輪任務(wù)執(zhí)行)
10、對模型輸出進(jìn)行后處理(過濾、格式化、合規(guī)校驗)
11、配合產(chǎn)品團隊完成需求對接與功能上線
任職要求:
1、熟練掌握前端、后端、模型訓(xùn)練基礎(chǔ)、部署運維、模型壓縮、推理加速以及嵌入式/移動端部署;
2、熟悉PyTorch/TensorFlow;
3、有完整AI項目(如智能識別網(wǎng)站)、有大型項目(如智能客服、AI助手)。