工作內(nèi)容
1. 視覺檢測(cè)數(shù)據(jù)體系建設(shè)
? 深入理解分類、檢測(cè)、分割等視覺任務(wù)的標(biāo)注規(guī)范,制定并持續(xù)迭代數(shù)據(jù)質(zhì)量檢查方案;
? 負(fù)責(zé)百萬級(jí)圖像/視頻的接收、初篩、質(zhì)量檢查、異常樣本歸類與回流,形成可追溯的數(shù)據(jù)版本;
? 建立數(shù)據(jù)分層、標(biāo)簽體系與元信息管理規(guī)范,支撐視覺大模型的高效訓(xùn)練與評(píng)測(cè);
2. 知識(shí)庫數(shù)據(jù)整理
? 在算法工程師指導(dǎo)下,完成已有領(lǐng)域文檔的結(jié)構(gòu)化建設(shè),可支撐智能問答助手開發(fā);
3. 工具與腳本開發(fā)
? 編寫 Python 腳本,實(shí)現(xiàn)圖像批量處理、數(shù)據(jù)自動(dòng)歸檔、日常功能腳本開發(fā);
? 與算法團(tuán)隊(duì)協(xié)作,將關(guān)鍵數(shù)據(jù)流程(如自動(dòng)預(yù)標(biāo)注、主動(dòng)學(xué)習(xí)篩選)落地為可復(fù)用模塊;
任職要求
? 熟練使用 Python,掌握 OpenCV、PIL / Pillow、NumPy、Pandas 等常用庫;
? 熟悉常見視覺任務(wù)(圖像分類、目標(biāo)檢測(cè)、實(shí)例分割、關(guān)鍵點(diǎn)等)的數(shù)據(jù)格式與評(píng)價(jià)指標(biāo);
? 具備扎實(shí)的圖像處理基礎(chǔ),能獨(dú)立完成去噪、幾何變換、顏色空間轉(zhuǎn)換等操作;
? 了解 Linux 常用命令及 Git 版本管理,能閱讀并簡(jiǎn)單修改 C++ 代碼;
? 良好的邏輯思維與數(shù)據(jù)敏感度,對(duì)“數(shù)據(jù)質(zhì)量”有潔癖;
? 本科及以上學(xué)歷,計(jì)算機(jī)、電子、自動(dòng)化、數(shù)學(xué)等相關(guān)專業(yè)優(yōu)先。
加分項(xiàng)
? 有使用 C++ 開發(fā)圖像/視頻處理或高性能計(jì)算模塊的經(jīng)驗(yàn);
? 熟悉 Labelme、CVAT、Label Studio 等標(biāo)注平臺(tái)的數(shù)據(jù)流轉(zhuǎn)與二次開發(fā);
? 了解深度學(xué)習(xí)訓(xùn)練流程,能使用 PyTorch/TensorFlow 做簡(jiǎn)單可視化或數(shù)據(jù)分析;
? 熟悉 RAG、知識(shí)圖譜或 LLM Prompt Engineering,有多模態(tài)數(shù)據(jù)對(duì)齊經(jīng)驗(yàn)。