崗位描述:
1.SFT 和RL 數(shù)據(jù)質(zhì)檢與驗收:對大模型監(jiān)督微調(diào)(SFT)、強(qiáng)化學(xué)習(xí)(RL)任務(wù)的數(shù)據(jù)進(jìn)行全流程質(zhì)檢,包括數(shù)據(jù)標(biāo)注的準(zhǔn)確性、一致性、合規(guī)性核查,依據(jù)標(biāo)注規(guī)范和業(yè)務(wù)需求,嚴(yán)格驗收數(shù)據(jù)質(zhì)量,保障數(shù)據(jù)符合算法訓(xùn)練要求。
2.問題分析與優(yōu)化:深度分析質(zhì)檢過程中發(fā)現(xiàn)的數(shù)據(jù)問題,如標(biāo)注錯誤、邏輯矛盾、格式不統(tǒng)一等,提出優(yōu)化建議并推動標(biāo)注團(tuán)隊改進(jìn);定期總結(jié)數(shù)據(jù)質(zhì)量問題,協(xié)助完善標(biāo)注規(guī)則和驗收標(biāo)準(zhǔn)。
3.跨部門協(xié)作:與數(shù)據(jù)標(biāo)注團(tuán)隊、算法研發(fā)團(tuán)隊、產(chǎn)品團(tuán)隊緊密溝通,及時反饋數(shù)據(jù)質(zhì)量情況,根據(jù)業(yè)務(wù)需求調(diào)整質(zhì)檢策略;參與數(shù)據(jù)標(biāo)注流程優(yōu)化,為大模型訓(xùn)練提供高質(zhì)量數(shù)據(jù)支持。
崗位要求:
專業(yè)知識:熟悉大模型數(shù)據(jù)標(biāo)注流程,深入了解 SFT、RL 等技術(shù)原理及在數(shù)據(jù)標(biāo)注中的應(yīng)用,具備扎實的機(jī)器學(xué)習(xí)或自然語言處理理論基礎(chǔ)。
實踐經(jīng)驗:1 年以上大模型數(shù)據(jù)標(biāo)注質(zhì)檢或相關(guān)工作經(jīng)驗,有 SFT、RL 任務(wù)數(shù)據(jù)質(zhì)檢經(jīng)驗者優(yōu)先;熟練使用常見數(shù)據(jù)質(zhì)檢工具,能夠高效處理大規(guī)模數(shù)據(jù)。
其他要求:邏輯思維嚴(yán)謹(jǐn),具備較強(qiáng)的問題排查和解決能力;擁有出色的溝通協(xié)調(diào)能力,能夠在跨部門協(xié)作中高效推進(jìn)工作;對人工智能行業(yè)充滿熱情,具備持續(xù)學(xué)習(xí)新技術(shù)的能力。