職位描述
負(fù)責(zé)大模型(LLM)數(shù)據(jù)全流程管理,包括數(shù)據(jù)采集、清洗、標(biāo)注及預(yù)處理,構(gòu)建高質(zhì)量訓(xùn)練數(shù)據(jù)集;
設(shè)計(jì)并實(shí)現(xiàn)高效的數(shù)據(jù)管道(Pipeline),支持分布式數(shù)據(jù)處理與迭代。
任職要求
教育背景?:計(jì)算機(jī)科學(xué)、數(shù)學(xué)、統(tǒng)計(jì)學(xué)或相關(guān)專業(yè)??萍耙陨蠈W(xué)歷
?工作經(jīng)驗(yàn)?:2年以上大數(shù)據(jù)處理或AI數(shù)據(jù)工程經(jīng)驗(yàn),有LLM項(xiàng)目經(jīng)歷者優(yōu)先
技能要求:熟悉Java語(yǔ)言,熟悉SQL/NoSQL數(shù)據(jù)庫(kù),具備ETL流程開發(fā)經(jīng)驗(yàn)。