職位描述:
(1)參與大模型應(yīng)用場(chǎng)景的技術(shù)方案設(shè)計(jì),結(jié)合具體業(yè)務(wù)提供算法層面的支持,協(xié)助產(chǎn)品團(tuán)隊(duì)定義功能邊界與技術(shù)指標(biāo),推動(dòng)技術(shù)方案落地。
(2)開(kāi)展大模型預(yù)訓(xùn)練、微調(diào)策略研究,針對(duì)不同任務(wù)場(chǎng)景設(shè)計(jì)適配的訓(xùn)練流程,優(yōu)化數(shù)據(jù)篩選、清洗與預(yù)處理方案,提升模型訓(xùn)練效率與效果。
(3)負(fù)責(zé)大模型的性能優(yōu)化,在保證模型精度的前提下,降低模型顯存占用與推理延遲,滿足業(yè)務(wù)端低延遲、高并發(fā)的需求。
(4)協(xié)同多方團(tuán)隊(duì),明確大模型服務(wù)的接口規(guī)范、數(shù)據(jù)交互格式與性能指標(biāo),推動(dòng)模型服務(wù)與業(yè)務(wù)系統(tǒng)的無(wú)縫集成,確保上線前功能與性能達(dá)標(biāo)。
(5)跟蹤大模型領(lǐng)域的技術(shù)動(dòng)態(tài)與研究成果,推動(dòng)模型技術(shù)的持續(xù)迭代與創(chuàng)新,實(shí)現(xiàn)關(guān)鍵技術(shù)突破。
(6)開(kāi)展技術(shù)分享與知識(shí)沉淀工作,整理大模型研發(fā)過(guò)程中的技術(shù)文檔,定期在團(tuán)隊(duì)內(nèi)部進(jìn)行技術(shù)培訓(xùn)。
任職資格:
1.學(xué)歷要求:碩士研究生及以上學(xué)歷,計(jì)算機(jī)、人工智能相關(guān)專業(yè)優(yōu)先。
2.工作經(jīng)歷:具備8年以上AI算法工作經(jīng)驗(yàn),熟練掌握Python或C/C++,并具有深度學(xué)習(xí)算法相關(guān)經(jīng)驗(yàn),了解國(guó)內(nèi)外大模型演進(jìn)及應(yīng)用趨勢(shì),3年以上大模型相關(guān)經(jīng)驗(yàn)者優(yōu)先。
3.熟悉至少一種深度學(xué)習(xí)框架,如Pytorch、TensorFlow、JAX、PaddlePaddle或MindSpore,熟悉行業(yè)術(shù)語(yǔ)、流程和標(biāo)準(zhǔn),可以提煉出模型真正需要解決的問(wèn)題。
4. 精通多模態(tài)預(yù)訓(xùn)練模型架構(gòu)設(shè)計(jì)開(kāi)發(fā)、訓(xùn)練優(yōu)化、行業(yè)大模型微調(diào)與知識(shí)庫(kù)構(gòu)建、領(lǐng)域知識(shí)融合、業(yè)務(wù)場(chǎng)景驅(qū)動(dòng)的模型性能調(diào)優(yōu)及高并發(fā)推理部署。
5.可快速理解業(yè)務(wù)痛點(diǎn)、數(shù)據(jù)特性和價(jià)值場(chǎng)景,具備跨行業(yè)知識(shí)遷移能力;具有政務(wù)、金融、交通、旅游、能源、電力等垂直行業(yè)工程落地經(jīng)驗(yàn)者優(yōu)先。
6.具有較強(qiáng)的溝通協(xié)調(diào)能力,面對(duì)問(wèn)題能夠靈活處理;具備較強(qiáng)的學(xué)習(xí)能力,有團(tuán)隊(duì)合作精神與較高的工作熱情。