崗位職責(zé):
1、深入跟蹤調(diào)研大模型等AI技術(shù)的前沿動(dòng)態(tài),研究制定AI新技術(shù)在本公司相關(guān)領(lǐng)域內(nèi)的實(shí)施方案,牽頭推進(jìn)核心代碼的研發(fā)和實(shí)施;
2、深入研究大模型相關(guān)的技術(shù),分析不同模型和方案的優(yōu)劣勢(shì),評(píng)估最合適的技術(shù)方案;熟悉大模型技術(shù)解決方案,包括數(shù)據(jù)處理、模型優(yōu)化、數(shù)據(jù)評(píng)測(cè)等;利用框架(例如Langchain/LangGraph等)開(kāi)發(fā)基于大模型的智能體(Agent)和檢索增強(qiáng)生成技術(shù)(RAG)相關(guān)的產(chǎn)品,參與大模型應(yīng)用平臺(tái)、RAG知識(shí)庫(kù)平臺(tái)等項(xiàng)目落地;使用pretrain、 PEFT、SFT、RLHF 等大模型優(yōu)化技術(shù),深度優(yōu)化場(chǎng)景問(wèn)題中的大模型效果;使用數(shù)據(jù)去噪、知識(shí)增強(qiáng)、知識(shí)外掛等技術(shù),緩解或消除業(yè)務(wù)應(yīng)用中的大模型幻覺(jué)現(xiàn)象;基于大模型技術(shù)構(gòu)應(yīng)用服務(wù),解決業(yè)務(wù)中的場(chǎng)景問(wèn)題。
3、根據(jù)大模型場(chǎng)景應(yīng)用,進(jìn)行大模型應(yīng)用平臺(tái)的關(guān)鍵代碼開(kāi)發(fā)和系統(tǒng)調(diào)優(yōu)。
任職要求:
1.計(jì)算機(jī)、數(shù)學(xué)或統(tǒng)計(jì)學(xué)相關(guān)專業(yè),精通Python、Java等開(kāi)發(fā)語(yǔ)言,精通 pytorch、tensorflow 等至少1種深度學(xué)習(xí)框架,具有3年以上 NLP 相關(guān)工作經(jīng)驗(yàn);
2.熟悉大模型技術(shù)解決方案,包括數(shù)據(jù)處理、模型優(yōu)化、數(shù)據(jù)評(píng)測(cè)等;
3.精通 attention、transformer 及其變型,能熟練應(yīng)用預(yù)訓(xùn)練、PEFT、SFT、 RLHF 等各種優(yōu)化技術(shù);
4.熟悉業(yè)界領(lǐng)先的大模型系列,包括但不限于Deepseek、GPT、LLaMA、GLM、qwen等,對(duì)DeepSpeed、Megatron有一定了解和使用經(jīng)驗(yàn);