工作內(nèi)容:
1. 標(biāo)注標(biāo)準(zhǔn)制定與優(yōu)化:
● 負(fù)責(zé)大模型多模態(tài)(圖像+文本)標(biāo)注項(xiàng)目的需求分析、標(biāo)注標(biāo)準(zhǔn)設(shè)計(jì)與持續(xù)迭代優(yōu)化;
● 針對視覺語言理解任務(wù)(如圖文匹配、視覺問答VQA、圖像描述生成、細(xì)粒度視覺推理等),制定清晰、可執(zhí)行的標(biāo)注規(guī)范;
● 根據(jù)模型反饋和bad case分析,動態(tài)調(diào)整標(biāo)注標(biāo)準(zhǔn),提升數(shù)據(jù)對模型訓(xùn)練的有效性。
2. 標(biāo)注團(tuán)隊(duì)管理與培訓(xùn):
● 組織并培訓(xùn)內(nèi)外部標(biāo)注團(tuán)隊(duì),確保其準(zhǔn)確理解多模態(tài)任務(wù)的語義邏輯與標(biāo)注要求;
● 設(shè)計(jì)標(biāo)注培訓(xùn)材料與考核機(jī)制,提升團(tuán)隊(duì)在復(fù)雜視覺語義理解任務(wù)中的標(biāo)注一致性與準(zhǔn)確性;
● 持續(xù)監(jiān)控標(biāo)注過程中的典型錯誤,推動流程改進(jìn)與質(zhì)量提升。
3. 數(shù)據(jù)質(zhì)量控制與交付管理:
● 主導(dǎo)標(biāo)注數(shù)據(jù)的質(zhì)量抽檢、問題歸因與閉環(huán)優(yōu)化,確保交付數(shù)據(jù)符合大模型訓(xùn)練的高標(biāo)準(zhǔn)要求;
● 配合算法團(tuán)隊(duì)進(jìn)行數(shù)據(jù)有效性驗(yàn)證,支持模型迭代中的數(shù)據(jù)需求響應(yīng);
● 建立數(shù)據(jù)質(zhì)量評估體系,輸出質(zhì)量報(bào)告并推動系統(tǒng)性改進(jìn)。
4. 跨部門協(xié)同與技術(shù)支持:
● 與算法、產(chǎn)品、工程團(tuán)隊(duì)緊密協(xié)作,深入理解VLM模型的技術(shù)需求,將算法目標(biāo)轉(zhuǎn)化為可落地的標(biāo)注策略;
● 參與標(biāo)注工具的設(shè)計(jì)與優(yōu)化,提升標(biāo)注效率與人機(jī)協(xié)同能力;
● 推動標(biāo)注流程自動化與智能化,探索AI輔助標(biāo)注的可行性路徑。
崗位需求:
1. 教育背景與經(jīng)驗(yàn):
● 本科及以上學(xué)歷,計(jì)算機(jī)、醫(yī)療、金融等相關(guān)專業(yè)優(yōu)先;
● 2年及以上數(shù)據(jù)標(biāo)注或數(shù)據(jù)質(zhì)量管理經(jīng)驗(yàn),有大模型、多模態(tài)(VLM)、視覺語言任務(wù)(預(yù)訓(xùn)練、SFT)標(biāo)注項(xiàng)目經(jīng)驗(yàn)者優(yōu)先。
2. 核心能力要求:
● 具備出色的多模態(tài)語義理解能力,能精準(zhǔn)捕捉圖像與文本之間的細(xì)粒度語義關(guān)聯(lián);
● 優(yōu)秀的邏輯分析與問題診斷能力,擅長從bad case中提煉共性問題并提出解決方案;
● 熟悉主流視覺語言任務(wù)類型(如VQA、Captioning、Visual Reasoning、OCR+理解等)者優(yōu)先。
3. 文檔與溝通能力:
● 能獨(dú)立撰寫結(jié)構(gòu)清晰、邏輯嚴(yán)謹(jǐn)?shù)臉?biāo)注標(biāo)準(zhǔn)文檔、培訓(xùn)材料與質(zhì)量分析報(bào)告;
● 具備良好的跨團(tuán)隊(duì)溝通能力,能高效對接算法與工程團(tuán)隊(duì),推動項(xiàng)目落地。
4. 技術(shù)視野與學(xué)習(xí)能力:
● 對AI大模型技術(shù)有濃厚興趣,了解CLIP、BLIP、Qwen-VL、LLaVA、InternVL等主流VLM模型的基本原理與應(yīng)用場景;
● 關(guān)注多模態(tài)AI領(lǐng)域前沿動態(tài),具備快速學(xué)習(xí)新技術(shù)并應(yīng)用于標(biāo)注實(shí)踐的能力。