1、架構(gòu)設(shè)計(jì)與開發(fā)
主導(dǎo)智能問答系統(tǒng)全鏈路開發(fā),構(gòu)建基于RAG的高效混合檢索框架(融合語義/關(guān)鍵詞/圖檢索),解決大模型幻覺問題。
設(shè)計(jì)大模型微調(diào)方案(LoRA/P-Tuning等),提升領(lǐng)域問答準(zhǔn)確性。
2、算法攻關(guān)
研發(fā)對話狀態(tài)跟蹤(DST)、知識圖譜嵌入、多輪問答推理等NLP模塊。
優(yōu)化大模型壓縮與推理加速技術(shù)(量化/蒸餾),實(shí)現(xiàn)低成本高并發(fā)部署。
探索多模態(tài)問答技術(shù)(文本+圖像/表格),提升復(fù)雜問題解答能力。
3、數(shù)據(jù)與實(shí)驗(yàn)
構(gòu)建領(lǐng)域知識增強(qiáng)的指令微調(diào)數(shù)據(jù)集,開發(fā)數(shù)據(jù)合成與自動評估工具。
設(shè)計(jì)AB實(shí)驗(yàn)體系,量化模型迭代效果(準(zhǔn)確性/流暢度/安全性)。
4、技術(shù)前瞻
跟蹤LLM/RAG領(lǐng)域前沿(如Agentic RAG, Self-RAG),推動技術(shù)迭代。
任職要求
1、基礎(chǔ)能力
本科及以上學(xué)歷,計(jì)算機(jī)/人工智能相關(guān)專業(yè),3年以上NLP算法實(shí)戰(zhàn)經(jīng)驗(yàn)。
精通Python,熟練使用PyTorch/TensorFlow,有分布式訓(xùn)練調(diào)優(yōu)經(jīng)驗(yàn)。
深入理解Transformer/BERT/GPT等模型架構(gòu)與訓(xùn)練范式。
2、技術(shù)專長
大模型方向:
具備LLM微調(diào)全流程經(jīng)驗(yàn)(LoRA/QLoRA/Prompt Tuning等)
熟悉LangChain/LLamaIndex等開發(fā)框架,有LangChain自定義模塊開發(fā)案例
RAG方向:
精通稠密檢索技術(shù)(DPR/ANCE),掌握rerank模型(ColBERT/BGE)優(yōu)化
有RAG pipeline性能調(diào)優(yōu)經(jīng)驗(yàn)(召回率@K>95%,響應(yīng)時間<500ms)
3、工程落地:
熟悉vLLM/Text Generation Inference等推理加速方案。
具備云原生(AWS/GCP)部署經(jīng)驗(yàn),掌握Docker/K8s。
4、思維特質(zhì)
極強(qiáng)的業(yè)務(wù)抽象能力:能將模糊需求轉(zhuǎn)化為可量化的技術(shù)指標(biāo)。
數(shù)據(jù)驅(qū)動決策思維:擅長通過Bad Case分析驅(qū)動模型迭代。