崗位職責:
1、負責大模型的訓練流程設(shè)計、微調(diào)策略優(yōu)化(SFT/DPO/ 增量預訓練等)及推理效率提升,保障模型效果、穩(wěn)定性與落地性能。
2、主導大模型在 RAG與 Agent 領(lǐng)域的能力構(gòu)建,涵蓋數(shù)據(jù)體系設(shè)計、算法調(diào)優(yōu)、評估迭代全鏈路。
3、推動大模型在具體業(yè)務(wù)場景的適配,完成 Prompt 工程、工具調(diào)用、多輪對話規(guī)劃等功能開發(fā),結(jié)合 self-play/MCTS 等技術(shù)提升通用問題解決能力。
4、與產(chǎn)品、工程團隊協(xié)作,實現(xiàn) AI 功能的產(chǎn)品化落地,根據(jù)用戶反饋快速迭代模型。
5、跟蹤大模型領(lǐng)域(如多模態(tài)、長上下文、邏輯推理)的前沿研究,探索新應(yīng)用方向,將創(chuàng)新技術(shù)融入產(chǎn)品。
6、完成上級安排的其他工作任務(wù)。
任職要求:
1、計算機科學、人工智能等相關(guān)專業(yè)。
2、2 年以上大模型研發(fā)經(jīng)驗,精通主流模型(如 GPT、LLaMA、Qwen 等)的原理與微調(diào)技術(shù)(SFT/DPO/RLHF)。
3、熟悉 RAG架構(gòu)、Agent 開發(fā),掌握檢索/排序/意圖識別等技術(shù),熟練使用 LangChain、Llamalndex 等工具。
4、精通 Python 及深度學習框架(PyTorch/TensorFlow),具備高性能代碼實現(xiàn)與問題調(diào)試能力。
5、良好的跨團隊協(xié)作與溝通能力,能高效推動技術(shù)落地;
6、對 AI 技術(shù)有熱情,具備獨立研究與創(chuàng)新能力。