l 智能體核心開發(fā),有基于Dify框架設(shè)計決策智能體架構(gòu),實(shí)現(xiàn)狀態(tài)感知、策略推理、動作執(zhí)行全流程開發(fā)優(yōu)先前沿技術(shù)預(yù)研探索大語言模型(LLM)與強(qiáng)化學(xué)習(xí)融合方案(如LLM+RL決策層耦合),研究Dify與Ray/RLlib的協(xié)同訓(xùn)練框架,提升多智能體協(xié)作效率; l 學(xué)歷學(xué)信網(wǎng)可查,3年以上Python開發(fā)經(jīng)驗,精通異步編程/多線程優(yōu)化; l 1年以上智能體開發(fā)經(jīng)驗(游戲AI/機(jī)器人控制/推薦系統(tǒng)等場景); l 深度使用Dify框架經(jīng)驗,了解mcp,agent 等經(jīng)驗者優(yōu)先。