崗位職責(zé)
1.負(fù)責(zé)大模型相關(guān)應(yīng)用與系統(tǒng)的研發(fā)、落地與迭代,參與從需求分析、方案設(shè)計(jì)到部署上線的全流程;
2.負(fù)責(zé) RAG 系統(tǒng)工程實(shí)現(xiàn)與性能調(diào)優(yōu),完成向量數(shù)據(jù)庫(Milvus、ChromaDB 等)選型、部署、索引構(gòu)建與查詢優(yōu)化,保障檢索 - 生成鏈路穩(wěn)定高效;
3.參與大模型訓(xùn)練、微調(diào)、量化、壓縮等工程化落地,解決訓(xùn)練與推理性能瓶頸;
4.基于智能體框架進(jìn)行 AI Agent 開發(fā),完成插件開發(fā)、工具鏈設(shè)計(jì)與 prompt 工程優(yōu)化;
5.參與分布式訓(xùn)練、集群部署與高性能計(jì)算優(yōu)化,支撐業(yè)務(wù)規(guī)?;涞?。
任職要求
1.本科及以上學(xué)歷,計(jì)算機(jī)、人工智能、數(shù)學(xué)、軟件工程等相關(guān)專業(yè);
2.3-5 年相關(guān)開發(fā)經(jīng)驗(yàn),熟練使用 Python/Java 等語言,具備扎實(shí)的工程實(shí)現(xiàn)能力;
3.熟悉 NLP、深度學(xué)習(xí)基礎(chǔ),掌握 Transformer、LLM 等大模型架構(gòu),熟練使用 PyTorch/TensorFlow 等框架;
4.具備大模型全流程實(shí)戰(zhàn)經(jīng)驗(yàn):訓(xùn)練、微調(diào)、推理、量化、壓縮、部署落地;
5.熟練使用 LangChain、LlamaIndex 等框架,熟悉 Dify/Coze/OpenManus 等至少一種智能體框架;
6.有 RAG 實(shí)戰(zhàn)經(jīng)驗(yàn),熟悉向量數(shù)據(jù)庫選型與優(yōu)化,具備 AI Agent 開發(fā)經(jīng)驗(yàn)優(yōu)先;
7.主導(dǎo)或參與過至少 1 個大模型應(yīng)用項(xiàng)目(對話系統(tǒng)、智能問數(shù)、知識庫問答等),具備全流程落地經(jīng)驗(yàn);
8.有分布式訓(xùn)練、集群部署、高性能計(jì)算優(yōu)化、插件開發(fā)與工具鏈設(shè)計(jì)經(jīng)驗(yàn)優(yōu)先;
9.邏輯清晰,溝通協(xié)作能力強(qiáng),能高效對接跨部門需求,對大模型前沿技術(shù)有強(qiáng)烈學(xué)習(xí)與探索意愿。