工作職責
1. 負責無人機 VLA(Vision-Language-Action)與基座大模型(Foundation Model)的技術(shù)探索與研發(fā),推動多模態(tài)感知、語言理解與動作決策的深度融合;
2. 基于大規(guī)模云端計算資源,對無人機 VLA 大模型進行訓練、優(yōu)化與推理部署,實現(xiàn)復(fù)雜任務(wù)的自動化與智能化;
3. 持續(xù)提升模型在多場景、多任務(wù)、多傳感器融合條件下的泛化能力與魯棒性;
4. 跟蹤并引入前沿 AI 技術(shù)(如自監(jiān)督、多模態(tài)對齊、強化學習、人類反饋訓練等)到無人機任務(wù)中;
5. 與產(chǎn)品、硬件、數(shù)據(jù)平臺團隊協(xié)作,將算法快速落地到實際業(yè)務(wù)場景中,包括巡檢、測繪、安防、農(nóng)業(yè)等領(lǐng)域。
任職要求
1. 計算機科學、人工智能、自動化、電子工程等相關(guān)專業(yè)碩士及以上學歷;
2. 精通多模態(tài)人工智能(視覺、語言、動作決策等)原理與算法,具備 VLM/VLA 相關(guān)研究或落地經(jīng)驗;
3. 熟練掌握并能靈活使用主流開源 VLM 基座模型(優(yōu)先 Qwen2.5-VL),熟悉其架構(gòu)、訓練流程與微調(diào)方法(如 LoRA、SFT、RLHF/DPO 等);
4. 有大語言模型(LLM)、視覺-語言模型(VLM)、Agent 系統(tǒng)或強化學習(RL)技術(shù)的實戰(zhàn)經(jīng)驗;
5. 具備大規(guī)模云端訓練、分布式推理和模型優(yōu)化經(jīng)驗,熟悉 Kubernetes、Ray、DeepSpeed 等工具;
6. 編程能力強(Python/C++),能夠獨立完成從算法設(shè)計到工程實現(xiàn)的全流程;
7. 具備前瞻性技術(shù)視野、良好的溝通與跨團隊協(xié)作能力,有推動技術(shù)創(chuàng)新落地的經(jīng)驗。