【崗位職責(zé)】
1、數(shù)據(jù)集構(gòu)建與維護(hù)
主導(dǎo)具身智能相關(guān)多模態(tài)數(shù)據(jù)集(圖像、點(diǎn)云、語言、動(dòng)作等)的采集、標(biāo)注、清洗、處理、存儲(chǔ)、版本管理與持續(xù)優(yōu)化,確保數(shù)據(jù)集的可追溯性、一致性與多樣性。支持空間理解、視覺定位、任務(wù)規(guī)劃、多模態(tài)推理、可用性等方向的數(shù)據(jù)集設(shè)計(jì)、構(gòu)建與迭代,涵蓋真實(shí)世界與仿真環(huán)境(如AI2THOR、AirSim、Gazebo、Isaac、Libero、ALOHA等)。
2、數(shù)據(jù)合成與增強(qiáng)
設(shè)計(jì)并實(shí)施數(shù)據(jù)合成與增強(qiáng)方案,利用生成式AI、物理仿真、數(shù)字孿生等技術(shù),高效生成高質(zhì)量具身智能訓(xùn)練數(shù)據(jù),降低真機(jī)采集成本,提升數(shù)據(jù)多樣性與覆蓋度。跟蹤并實(shí)踐前沿?cái)?shù)據(jù)合成方法(如Sim2Real、視頻生成大模型后訓(xùn)練等),探索跨平臺(tái)、跨模態(tài)的數(shù)據(jù)遷移與泛化能力。
3、數(shù)據(jù)質(zhì)量評(píng)估與治理
建立并完善數(shù)據(jù)質(zhì)量評(píng)估體系,包括數(shù)據(jù)完整性、準(zhǔn)確性、一致性、時(shí)效性、可用性等維度,結(jié)合自動(dòng)化與人工審核,保障數(shù)據(jù)質(zhì)量滿足算法訓(xùn)練需求。
推動(dòng)數(shù)據(jù)治理標(biāo)準(zhǔn)化,制定數(shù)據(jù)采集、標(biāo)注、評(píng)測(cè)、迭代等規(guī)范,參與行業(yè)標(biāo)準(zhǔn)制定與推廣。數(shù)據(jù)Pipeline與工具開發(fā),設(shè)計(jì)并開發(fā)高效、可擴(kuò)展的數(shù)據(jù)處理Pipeline,支持大規(guī)模多源異構(gòu)數(shù)據(jù)的自動(dòng)化采集、清洗、4 標(biāo)注、檢索、分析與可視化。參與自動(dòng)化數(shù)據(jù)標(biāo)注系統(tǒng)與數(shù)據(jù)挖掘工具開發(fā),持續(xù)優(yōu)化數(shù)據(jù)標(biāo)注效率與質(zhì)量,為算法團(tuán)隊(duì)提供高價(jià)值數(shù)據(jù)支持。
5、 跨團(tuán)隊(duì)協(xié)作與算法支持
與算法、仿真、機(jī)器人等跨職能團(tuán)隊(duì)緊密合作,理解算法數(shù)據(jù)需求,支持技能學(xué)習(xí)、多模態(tài)模型、端到端學(xué)習(xí)、遷移學(xué)習(xí)等方向的數(shù)據(jù)應(yīng)用與基準(zhǔn)建立。支持?jǐn)?shù)據(jù)集在機(jī)器人技能訓(xùn)練、任務(wù)評(píng)測(cè)、模型微調(diào)等環(huán)節(jié)的落地應(yīng)用,推動(dòng)數(shù)據(jù)集在具身智能領(lǐng)域的快速轉(zhuǎn)化。
【崗位要求】
1 、學(xué)歷與專業(yè)背景
碩士及以上學(xué)歷,人工智能、計(jì)算機(jī)、機(jī)器人、自動(dòng)化、數(shù)學(xué)等相關(guān)專業(yè)優(yōu)先;有3年以上相關(guān)工作經(jīng)驗(yàn),有大模型、大數(shù)據(jù)、自動(dòng)駕駛、機(jī)器人數(shù)據(jù)集項(xiàng)目經(jīng)驗(yàn)者優(yōu)先。
2 、編程與工程能力
精通Python,具備扎實(shí)的編程基礎(chǔ),熟練掌握TensorFlow、PyTorch等深度學(xué)習(xí)框架,熟悉ROS、NVIDIA Isaac、MuJoCo、Gazebo等機(jī)器人仿真與開發(fā)環(huán)境。具備分布式數(shù)據(jù)處理、ETL開發(fā)、數(shù)據(jù)倉庫建設(shè)經(jīng)驗(yàn),熟悉Hadoop、Spark、Flink等大數(shù)據(jù)技術(shù)棧者優(yōu)先。
3 、數(shù)據(jù)集與合成技術(shù)經(jīng)驗(yàn)
熟悉主流具身智能數(shù)據(jù)集(如RoboMIND、OpenX-Embodiment、AgiBot World、DROID、DexonomySim等),了解其特點(diǎn)、適用場(chǎng)景與數(shù)據(jù)規(guī)范。
熟悉數(shù)據(jù)合成與增強(qiáng)技術(shù),包括物理仿真、生成式AI、視頻生成大模型后訓(xùn)練、Sim2Real等,有實(shí)際數(shù)據(jù)合成項(xiàng)目經(jīng)驗(yàn)者優(yōu)先。
4 、數(shù)據(jù)質(zhì)量與評(píng)估能力
熟悉數(shù)據(jù)質(zhì)量評(píng)估方法(如數(shù)據(jù)驗(yàn)證、交叉驗(yàn)證、邏輯檢查、可視化分析、誤差分析等),能夠設(shè)計(jì)并實(shí)施數(shù)據(jù)質(zhì)量監(jiān)控與改進(jìn)方案。
具備數(shù)據(jù)治理、標(biāo)準(zhǔn)化流程建設(shè)經(jīng)驗(yàn),有數(shù)據(jù)集版本管理、可追溯性建設(shè)經(jīng)驗(yàn)者優(yōu)先。
5 、仿真與機(jī)器人系統(tǒng)經(jīng)驗(yàn)
熟悉AI2THOR、AirSim、Gazebo、Isaac、Libero、ALOHA等主流仿真環(huán)境,有機(jī)器人數(shù)據(jù)采集、仿真數(shù)據(jù)生成、真機(jī)部署經(jīng)驗(yàn)者優(yōu)先。
了解空間理解、視覺定位、任務(wù)規(guī)劃、多模態(tài)推理等具身智能關(guān)鍵技術(shù),熟悉相關(guān)數(shù)據(jù)需求與評(píng)測(cè)方法。