崗位職責(zé)
1.負(fù)責(zé)機(jī)器人研發(fā)相關(guān)強(qiáng)化學(xué)習(xí)(RL)算法的研發(fā)、迭代與優(yōu)化,結(jié)合機(jī)器人核心場(chǎng)景設(shè)計(jì)適配的算法方案,支撐機(jī)器人自主決策與運(yùn)動(dòng)控制能力提升。
2.基于Python語(yǔ)言完成強(qiáng)化學(xué)習(xí)算法的代碼實(shí)現(xiàn)、調(diào)試與封裝,搭建高效、可復(fù)用的算法訓(xùn)練框架,優(yōu)化代碼性能,確保算法運(yùn)行穩(wěn)定、高效。
3.負(fù)責(zé)強(qiáng)化學(xué)習(xí)模型的訓(xùn)練、驗(yàn)證與調(diào)優(yōu),設(shè)計(jì)合理的訓(xùn)練策略提升模型性能指標(biāo)。
4.負(fù)責(zé)機(jī)器人強(qiáng)化學(xué)習(xí)相關(guān)數(shù)據(jù)處理工作,包括機(jī)器人運(yùn)行數(shù)據(jù)、傳感器數(shù)據(jù)的采集、清洗、標(biāo)注與分析,提升數(shù)據(jù)對(duì)機(jī)器人模型訓(xùn)練的支撐效果。
任職要求
1.本科及以上學(xué)歷,計(jì)算機(jī)科學(xué)與技術(shù)、人工智能、機(jī)器學(xué)習(xí)、數(shù)據(jù)科學(xué)、自動(dòng)化等相關(guān)專業(yè),2年及以上強(qiáng)化學(xué)習(xí)算法研發(fā)相關(guān)工作經(jīng)驗(yàn)。
2.精通Python編程語(yǔ)言,熟練使用NumPy、Pandas、Matplotlib等數(shù)據(jù)處理與可視化庫(kù),具備扎實(shí)的代碼功底,能夠獨(dú)立完成算法編程、調(diào)試與優(yōu)化。
3.熟練使用至少一種深度學(xué)習(xí)/強(qiáng)化學(xué)習(xí)框架(如TensorFlow、PyTorch、Stable Baselines3等),具備獨(dú)立搭建強(qiáng)化學(xué)習(xí)訓(xùn)練框架、完成模型訓(xùn)練與調(diào)優(yōu)的能力。
4.熟悉強(qiáng)化學(xué)習(xí)仿真環(huán)境(如Gym、MuJoCo、PyBullet等),能夠搭建適配業(yè)務(wù)場(chǎng)景的仿真環(huán)境,用于算法驗(yàn)證與訓(xùn)練。