崗位職責:
1、AI服務開發(fā)與優(yōu)化:基于開源知識庫、Agent框架進行開發(fā),優(yōu)化大模型應用性能及功能擴展。構(gòu)建大模型服務化(MaaS),提供模型推理、微調(diào)、Prompt工程等核心能力,支持企業(yè)級業(yè)務場景接入。設計高可用、低延遲的分布式服務架構(gòu),解決模型部署、資源調(diào)度、負載均衡等工程問題;
2、算法與模型開發(fā):參與LLM(大語言模型)訓練、微調(diào)及優(yōu)化,結(jié)合業(yè)務需求改進模型效果(如指令遵循、長文本理解、多模態(tài)推理)。開發(fā)核心算法模塊,如RAG(檢索增強生成)、Agent任務編排、多模型協(xié)同推理等;3、解決方案撰寫:根據(jù)不同業(yè)務場景和客戶需求,結(jié)合公司數(shù)字化基礎,制定可落地的解決方案;
4、系統(tǒng)維護與協(xié)作:監(jiān)控并保障MaaS服務的穩(wěn)定性,優(yōu)化GPU資源利用率及服務成本。協(xié)同算法團隊完成模型工程化落地,與產(chǎn)品團隊協(xié)作定義技術(shù)方案,確保需求高效交付。
任職要求:
1、本科及以上學歷,計算機科學、人工智能、軟件工程、數(shù)學等相關(guān)專業(yè)優(yōu)先;
2、5年以上AI開發(fā)相關(guān)領域的工作經(jīng)驗,具備AI服務開發(fā)、模型優(yōu)化和大規(guī)模數(shù)據(jù)處理的實際經(jīng)驗;
3、熟練掌握至少一種主流編程語言(如Go、Python),具備高并發(fā)和高性能系統(tǒng)開發(fā)經(jīng)驗,能夠針對項目需求做出性能優(yōu)化;
4、扎實的機器學習/深度學習基礎,熟悉PyTorch、TensorFlow等框架,掌握大模型微調(diào)技術(shù)(如LoRA、P-Tuning)。熟悉大規(guī)模AI模型開發(fā)及優(yōu)化,包括LLM、GPT系列、BERT等深度學習模型。具備這些模型在實際項目中的應用經(jīng)驗,能夠針對不同任務選擇合適的模型架構(gòu);
5、熟悉大模型應用開發(fā)全流程,包括數(shù)據(jù)處理、模型部署(vLLM、Triton)、Prompt工程、模型測評體系建設;
6、熟悉容器化技術(shù)(Docker)及容器編排工具(Kubernetes),有在分布式系統(tǒng)中進行AI服務部署的經(jīng)驗,能夠通過容器化技術(shù)進行資源調(diào)配與管理,提高系統(tǒng)穩(wěn)定性和性能;
7、項目經(jīng)驗有大型AI系統(tǒng)(如智能客服、知識庫問答、Agent工作流)開發(fā)經(jīng)驗者優(yōu)先。參與過開源項目貢獻,或主導過高并發(fā)、高可用服務架構(gòu)設計者優(yōu)先;
8、熟悉LangChain、LlamaIndex等框架,或具備開源社區(qū)貢獻經(jīng)歷;
9、優(yōu)秀的邏輯思維能力與問題解決能力,對技術(shù)落地有強烈責任心。良好的團隊協(xié)作與溝通能力,能快速理解業(yè)務需求并輸出技術(shù)方案。具備良好的英語讀寫能力,能夠閱讀并理解英文技術(shù)文檔。