崗位職責
1、負責機器人具身操作任務的強化學習算法開發(fā),包括架構設計、數(shù)據(jù)處理、訓練優(yōu)化及真機部署;
2、研究多模態(tài)學習方法,結合視覺、觸覺、力反饋提升機器人決策能力;
3、負責視覺感知(物體檢測、語義分割、3D場景重建等)、機器人運動策略學習(模仿學習),機器人專家示范動作的采集和處理;
4、優(yōu)化從模擬到現(xiàn)實(Sim2Real)的遷移技術,如fine-tuning、prompt設計等,提升算法精度、魯棒性、多場景多任務的泛化能力;
5、跟蹤前沿技術,進行強化學習算法的調(diào)研、性能對比和評估;
6、根據(jù)需求完成算法開發(fā)與代碼維護,協(xié)助測試團隊優(yōu)化算法性能。
任職要求
1、碩士及以上學歷,人工智能、計算機、機器人學等相關專業(yè),具有3年以上工作經(jīng)驗,優(yōu)秀應屆生亦可考慮;
2、掌握強化學習理論,熟悉 PPO、DQN、SAC 等主流算法;
3、熟悉深度學習、計算機視覺、自然語言處理等領域的專業(yè)知識
4、精通 Python,熟悉 PyTorch 或 TensorFlow 等深度學習框架;
5、熟悉 Mujoco、Isaac Gym、PyBullet 等機器人仿真工具;
6、熟悉LLM/VLM/VLA,了解OpenVLA、ACT、RDT-1B、PI0等多模態(tài)模型經(jīng)驗者優(yōu)先;
7、在頂會發(fā)表論文或具備機器人項目經(jīng)驗者優(yōu)先;
8、工作積極主動,具備良好的團隊合作與問題解決能力。