工作職責:
深入分析訓練系統(tǒng),定位和解決訓練系統(tǒng)各個層次的性能瓶頸,不斷提升訓練效率,打造業(yè)界領先的訓練系統(tǒng),推進算法的高效迭代。如:
1. 面向AI推理場景的全局KVCache的多級輕量化存儲計算,與PD分離相結(jié)合,推動整體推理性能提升;
2. 面向AI訓推場景的通訊性能提升;
3. 優(yōu)化推理速度、內(nèi)存占用和能耗,支持多種硬件架構(gòu)(GPU、NPU等 )
4. 模型量化, 剪枝, 編譯
5. 申請并承擔科研任務,發(fā)表高水平研究成果,推動項目合作。
任職資格:
1. 計算機、電子工程、自動控制等專業(yè)博士及以上學歷;
2. 了解深度學習算法基本原理,熟悉CNN/Transformers等主流模型原理與CUDA、MPI、NCCL等相關底層原理;具有AutoML/模型推理/訓練優(yōu)化或AI 相關大模型/重要項目經(jīng)驗者優(yōu)先;熟悉
3. 優(yōu)秀的代碼能力,熟練掌握C/C++或Python/CUDA等編程語言。
薪資:15-40K
工作地點:1。廣東省東莞市南城區(qū)寰宇匯金中心9B33層;2.北京市海淀區(qū)知春路23號量子銀座7層