工作職責(zé)
1. 聚焦公共安全、政務(wù)大數(shù)據(jù)、智能安防場景,主導(dǎo)大語言模型/多模態(tài)模型的有監(jiān)督微調(diào)(SFT)、偏好對齊(DPO/RLHF)全流程研發(fā)與業(yè)務(wù)落地。
2. 負(fù)責(zé)行業(yè)指令數(shù)據(jù)集的構(gòu)建、清洗、標(biāo)注、配比與去重工作,搭建符合垂類需求的高質(zhì)量微調(diào)數(shù)據(jù)體系。
3. 運(yùn)用LoRA/QLoRA/Adapter等高效微調(diào)技術(shù),完成7B–70B級大模型的訓(xùn)練、調(diào)優(yōu)及穩(wěn)定性保障,解決loss異常、過擬合、顯存溢出等訓(xùn)練問題。
4. 搭建模型自動化評測與人工評測體系,持續(xù)優(yōu)化模型在理解、生成、檢索、問答等維度的性能表現(xiàn)。
5. 配合工程團(tuán)隊(duì)完成模型量化、蒸餾、壓縮與部署,支撐業(yè)務(wù)系統(tǒng)的高效推理需求。
6. 跟蹤大模型前沿技術(shù)動態(tài),結(jié)合公司業(yè)務(wù)場景沉淀垂類大模型的最佳實(shí)踐方案。
任職要求
1. 本科及以上學(xué)歷,計算機(jī)、人工智能、軟件工程、數(shù)學(xué)、自動化等相關(guān)專業(yè)背景。
2. 具備1–3年大模型微調(diào)實(shí)戰(zhàn)經(jīng)驗(yàn),能夠獨(dú)立完成SFT/偏好對齊的全流程訓(xùn)練與迭代。
3. 精通Python與PyTorch,熟練使用Hugging Face Transformers、PEFT、Datasets、Accelerate等工具鏈。
4. 熟悉Linux、CUDA環(huán)境及GPU訓(xùn)練排障,了解DeepSpeed分布式訓(xùn)練框架者優(yōu)先。
5. 掌握數(shù)據(jù)處理、提示工程、模型評測與效果優(yōu)化的方法體系。
6. 具備良好的文檔撰寫與跨團(tuán)隊(duì)溝通能力,能快速理解政務(wù)、安防、公共安全領(lǐng)域的業(yè)務(wù)需求。
7. 能夠熟練閱讀英文技術(shù)文檔,具備復(fù)現(xiàn)前沿論文與開源方案的能力。
加分項(xiàng):
有公共安全、政務(wù)、警務(wù)、安防、大數(shù)據(jù)分析類項(xiàng)目或大模型落地經(jīng)驗(yàn);具備多模態(tài)(圖像/文本)模型微調(diào)、RAG系統(tǒng)優(yōu)化、Agent交互優(yōu)化經(jīng)驗(yàn);熟悉vLLM/TensorRT-LLM/TGI等推理部署框架;有涉密項(xiàng)目、政企項(xiàng)目算法研發(fā)經(jīng)驗(yàn);有頂會論文、開源項(xiàng)目貢獻(xiàn)或技術(shù)博客產(chǎn)出。