崗位要求:
● 本科及以上學(xué)歷,語言學(xué)、心理學(xué)、計(jì)算機(jī)、認(rèn)知科學(xué)、哲學(xué)、新聞傳播、教育學(xué)等相關(guān)專業(yè)優(yōu)先;
● 有1年以上內(nèi)容審核、編輯校對(duì)、用戶研究、UX評(píng)估、測(cè)試用例設(shè)計(jì)或AI數(shù)據(jù)獎(jiǎng)勵(lì)建模標(biāo)注經(jīng)驗(yàn);
● 熟悉大語言模型基本概念(如token、prompt、temperature、RLHF流程等);
● 使用過主流大模型(如GPT、Claude、通義千問、文心一言等)并對(duì)其優(yōu)缺點(diǎn)有觀察。
● 出色的中文閱讀理解能力,對(duì)語言細(xì)微差異敏感,具備較強(qiáng)的邏輯分析與批判性思維;
● 對(duì)模型輸出的文本回答,有優(yōu)秀的范式理解;
● 對(duì)AI倫理、模型安全、內(nèi)容合規(guī)等議題有一定認(rèn)知,能夠在指導(dǎo)下理解并嚴(yán)格執(zhí)行標(biāo)注規(guī)范,注重細(xì)節(jié),責(zé)任心強(qiáng);
● 能熟練使用辦公軟件(如Excel、Google Sheets)及內(nèi)部標(biāo)注平臺(tái);
● 熟悉大語言模型評(píng)測(cè),對(duì)大語言模型機(jī)理敏感;
● 良好的溝通能力與團(tuán)隊(duì)協(xié)作意識(shí)。
工作內(nèi)容:
1. 高質(zhì)量偏好數(shù)據(jù)標(biāo)注
○ 對(duì)同一提示(prompt)下由大語言模型生成的2–4個(gè)回復(fù)進(jìn)行成對(duì)或全局排序(ranking),依據(jù)標(biāo)準(zhǔn)判斷哪個(gè)回復(fù)更符合人類偏好;
○ 在多維評(píng)估維度(如:事實(shí)準(zhǔn)確性、安全性、指令遵循度等)下進(jìn)行細(xì)粒度打分或分類;
○ 識(shí)別并標(biāo)記模型輸出中的潛在風(fēng)險(xiǎn)內(nèi)容,包括但不限于:事實(shí)錯(cuò)誤、偏見歧視、誘導(dǎo)性語言、安全風(fēng)險(xiǎn)內(nèi)容等。
2. 標(biāo)注質(zhì)量保障與反饋閉環(huán)
○ 定期參與標(biāo)注一致性校準(zhǔn)會(huì)議,與團(tuán)隊(duì)對(duì)齊判斷標(biāo)準(zhǔn);
○ 主動(dòng)記錄模糊案例、邊界情況或指南沖突點(diǎn),提出改進(jìn)建議;
○ 配合質(zhì)檢流程,接受隨機(jī)抽查與回溯評(píng)估,確保個(gè)人標(biāo)注準(zhǔn)確率 ≥95%(以內(nèi)部標(biāo)準(zhǔn)為準(zhǔn))。
3. 協(xié)作與知識(shí)沉淀
○ 與Prompt工程師協(xié)作,理解任務(wù)背景與模型能力邊界,提升標(biāo)注上下文感知能力;
○ 參與標(biāo)注文檔(SOP)的撰寫、更新與本地化(中英雙語場(chǎng)景);
○ 必要時(shí)撰寫簡(jiǎn)要標(biāo)注理由(justification),用于模型可解釋性分析或人工審核復(fù)盤。
上班時(shí)間:早九晚六、周末雙休
薪資:
6800/8200面試定級(jí)定薪