崗位職責(zé)
1.負責(zé)大模型(LLM)的本地部署與集群部署工作,確保模型穩(wěn)定高效運行,優(yōu)化大模型推理性能,提高響應(yīng)速度及資源利用率
2.進行大模型的訓(xùn)練、微調(diào)及知識庫掛載RAG,提升模型在特定場景的表現(xiàn)
3.與團隊協(xié)作開發(fā)大模型應(yīng)用,適配新場景并持續(xù)優(yōu)化性能
崗位要求
1.熟悉Transformer架構(gòu)及大模型原理,了解主流開源大模型(如QwQ-32B、DeepSeek-R1、Gemma3等)
2.具備大模型部署經(jīng)驗,熟悉vlm、DeepSeek、ONNX、TensorRT等推理加速技術(shù)
3.有大模型微調(diào)(如LORA、QLORA、SFT等)和知識庫掛載RAG相關(guān)經(jīng)驗,能適配大模型在不同場景的應(yīng)用
4.良好的溝通能力,對項目有責(zé)任心,富有團隊合作精神
工作經(jīng)驗及學(xué)歷要求
1.本科及以上學(xué)歷,非應(yīng)屆2年以上工作經(jīng)驗,學(xué)歷學(xué)位證書學(xué)信網(wǎng)可查
2.人工智能、自然語言處理、計算機科學(xué)等相關(guān)專業(yè),211/985碩士優(yōu)先
3.在大模型開發(fā)、部署或微調(diào)方向有1-2個成功項目經(jīng)驗者優(yōu)先
4.有開源大模型相關(guān)貢獻者特別優(yōu)先