崗位職責(zé)
1、負(fù)責(zé) AI 相關(guān)業(yè)務(wù)的數(shù)據(jù)獲取與數(shù)據(jù)生產(chǎn)體系建設(shè),搭建穩(wěn)定高效的外部數(shù)據(jù)采集能力;
2、規(guī)劃并落地 AI 訓(xùn)練數(shù)據(jù)全流程,包括數(shù)據(jù)采集、清洗、標(biāo)注、增強(qiáng)及質(zhì)量控制;
3、推動(dòng)數(shù)據(jù)能力與 AI 模型訓(xùn)練、自動(dòng)化業(yè)務(wù)場(chǎng)景深度結(jié)合,持續(xù)提升數(shù)據(jù)價(jià)值與業(yè)務(wù)效果;
4、持續(xù)關(guān)注爬蟲技術(shù)、數(shù)據(jù)工程及 AI 數(shù)據(jù)生產(chǎn)領(lǐng)域的新技術(shù)與行業(yè)趨勢(shì),推動(dòng)技術(shù)能力持續(xù)演進(jìn)。
崗位要求
1、本科及以上學(xué)歷,計(jì)算機(jī)科學(xué)、軟件工程、數(shù)據(jù)工程、人工智能等相關(guān)專業(yè)優(yōu)先;
2、3 年以上爬蟲開發(fā)或數(shù)據(jù)工程相關(guān)經(jīng)驗(yàn),具備大規(guī)模數(shù)據(jù)采集與處理實(shí)戰(zhàn)經(jīng)驗(yàn);
3、精通 Python 爬蟲開發(fā),熟悉常見反爬策略及應(yīng)對(duì)方案(動(dòng)態(tài)渲染、驗(yàn)證碼、風(fēng)控機(jī)制等);
4、熟悉數(shù)據(jù)處理與 ETL 流程,具備數(shù)據(jù)清洗、去重、結(jié)構(gòu)化處理及質(zhì)量評(píng)估能力;
5、熟悉至少一種數(shù)據(jù)標(biāo)注或眾包標(biāo)注流程,了解任務(wù)拆分、質(zhì)量抽檢及標(biāo)注規(guī)范設(shè)計(jì);
6、具備良好的溝通能力與跨團(tuán)隊(duì)協(xié)作能力,能夠推動(dòng)數(shù)據(jù)能力在業(yè)務(wù)中的落地。