崗位職責:
1.、算法研發(fā)與實現(xiàn):研發(fā)基于深度強化學習的人型機器人運動控制算法,設計和優(yōu)化雙足步態(tài)生成、全身協(xié)調(diào)控制等核心算法,實現(xiàn)從仿真到真實硬件的算法遷移(Sim-to-Real)
2.、系統(tǒng)集成與優(yōu)化:將深度學習模型部署到機器人嵌入式系統(tǒng),優(yōu)化推理性能,確保實時控制要求,集成感知、決策、控制的端到端系統(tǒng)
3.、仿真與實驗:在MuJoCo、IsaacLab等仿真平臺構建訓練環(huán)境,設計獎勵函數(shù)和課程學習策略,進行真機實驗驗證,迭代優(yōu)化算法
4、技術創(chuàng)新:跟蹤深度強化學習和機器人領域最新進展,探索新的算法架構和訓練方法,參與技術方案設計和評審
職位要求:
1、本科及以上學歷,計算機科學、機器人學、自動化或相關專業(yè),2年以上深度學習或機器人相關工作經(jīng)驗,扎實的數(shù)學基礎(線性代數(shù)、概率論、優(yōu)化理論);
2、熟悉ROS/ROS2系統(tǒng),熟練使用C++開發(fā)語言,了解機器人運動學、動力學基礎,有傳感器數(shù)據(jù)處理經(jīng)驗
3、精通Python,熟練使用PyTorch或TensorFlow,熟悉C++,能進行嵌入式部署,了解CUDA編程和模型優(yōu)化
4、熟練使用至少一種物理仿真引擎(MuJoCo、IsaacLab、PyBullet),能夠搭建自定義仿真環(huán)境和任務
5、熟悉PPO、SAC、TD3等主流強化學習算法,有實際項目中應用深度強化學習的經(jīng)驗,理解價值函數(shù)、策略梯度等核心概念,能夠獨立完成算法設計、實現(xiàn)、調(diào)試全流程,能夠權衡算法性能與工程實現(xiàn)
加分項:有人型機器人或四足機器人項目經(jīng)驗,在頂級會議(ICRA、IROS、NeurIPS、ICML)發(fā)表過相關論文,參與過開源機器人項目,有模仿學習、元強化學習等前沿技術經(jīng)驗,熟悉模型壓縮和邊緣部署技術,有真實硬件調(diào)試和系統(tǒng)集成經(jīng)驗
福利待遇:
1、五險一金(入職即購買)
2、節(jié)假日福利、免費的停車場
3、年底雙薪
4、股權激勵
5、每年2次調(diào)薪
6、高素質管理團隊,和諧的工作環(huán)境、良好的發(fā)展空間
工作時間:
8:30~12:00,14:00~18:00