職位描述:
1. 戰(zhàn)略規(guī)劃與技術攻堅
- 負責垂類大模型技術戰(zhàn)略制定,包括模型訓練調優(yōu)、平臺架構設計、應用場景創(chuàng)新(如AI Agent、智能外呼)。
- 主導核心技術突破,如異構計算優(yōu)化、多模態(tài)模型融合、推理性能提升等。
2. 團隊管理與項目落地
- 搭建并管理AI技術團隊,統(tǒng)籌大模型訓練、平臺開發(fā)、應用落地的全流程項目交付。
- 深入業(yè)務場景(如云計算服務、數(shù)據(jù)分析工具),設計端到端解決方案并打造行業(yè)標桿案例。
3. 工具鏈與生態(tài)建設
- 構建企業(yè)級大模型工具鏈(如自動評估、AB實驗體系),提升開發(fā)效率與模型效果。
- 推動開源技術與內部平臺整合,優(yōu)化國產(chǎn)化GPU適配及推理加速框架。
4. 商業(yè)化與行業(yè)影響
- 探索大模型驅動的服務新形態(tài)(如ChatUI升級、智能文檔處理),實現(xiàn)技術變現(xiàn)。
- 代表團隊參與行業(yè)技術交流,提升公司在AI領域的技術影響力。
職位要求:
技術能力
1. 大模型核心技術
- 精通大模型(LLM)訓練、調優(yōu)、推理加速、評估等全流程技術,熟悉Transformer架構、多模態(tài)融合、搜索增強生成(RAG)、AI Agents等方向。
- 具備垂類大模型(如云計算、數(shù)據(jù)分析、文檔處理等)領域落地經(jīng)驗,熟悉Prompt工程、微調、模型對齊等關鍵技術。
- 掌握主流深度學習框架(如PyTorch、TensorFlow)和分布式訓練技術,了解國產(chǎn)GPU(如昇騰、海光)適配經(jīng)驗優(yōu)先。
2. 工程與架構能力
- 熟悉大模型平臺搭建,包括LLMOps/DataOps工具鏈設計、異構GPU混合訓練與推理加速、高性能服務部署等。
- 具備大型系統(tǒng)的算法模型開發(fā)和優(yōu)化經(jīng)驗,熟練掌握Python/Java/C++至少一門語言,熟悉LangChain、vLLM等應用框架。
3. 行業(yè)經(jīng)驗
- 在自然語言處理(NLU/NLG)、對話機器人、智能輔助(Copilot)、搜索推薦等領域有大規(guī)模場景落地經(jīng)驗。
- 熟悉云計算、數(shù)據(jù)分析、企業(yè)服務等垂類業(yè)務場景,能結合大模型解決實際業(yè)務痛點。
---
綜合能力
1. 學術與創(chuàng)新能力
- 計算機科學、人工智能相關碩士及以上學歷,近3年有頂會論文(如NeurIPS、ICML)或開源社區(qū)核心貢獻者優(yōu)先。
- 持續(xù)跟蹤大模型前沿技術(如混合專家、多模態(tài)對齊),具備技術選型與商業(yè)化潛力研判能力。
2. 管理與協(xié)作能力
- 5年以上算法團隊管理經(jīng)驗,能獨立承擔復雜項目規(guī)劃、分解業(yè)務需求并推動跨團隊協(xié)作。
- 優(yōu)秀的溝通能力,能與產(chǎn)品、工程團隊高效配合,制定技術演進路線并推進商業(yè)化落地。