崗位描述
該崗位負(fù)責(zé)基于公司生產(chǎn)的 AI 硬件開(kāi)發(fā)和部署 AI 模型,進(jìn)行模型量化和加速,提升模型的推理性能。
工作內(nèi)容
- 結(jié)合 AI 硬件,編寫(xiě)典型場(chǎng)景全流程 Demo,包括模型訓(xùn)練、量化、編譯、部署、推理等;
- 使用 TPU-MLIR 等編譯器,將深度學(xué)習(xí)模型高效地映射到 TPU 中運(yùn)行;
- 移植主流或客戶的算法模型,為客戶提供典型場(chǎng)景通用技術(shù)解決方案;
- 支持客戶完成算法移植工作,收集反饋問(wèn)題和需求,并提出改進(jìn)意見(jiàn)。
任職要求
- 2 年以上工作經(jīng)驗(yàn),扎實(shí)的編程基礎(chǔ),良好的編程風(fēng)格;
- 熟悉 Python 的常用庫(kù)和工具,如 NumPy、Pandas、Scikit-learn 等;
- 熟悉 Caffe/TensorFlow/MxNet/PyTorch 等至少一種深度學(xué)習(xí)框架;
- 熟悉圖像分類、目標(biāo)檢測(cè)及跟蹤、圖像分割、自然語(yǔ)言處理等常見(jiàn)深度學(xué)習(xí)算法;
- 有主流 LLM GPT 開(kāi)源衍生模型(Alpaca, LLaMA, Vicuna, Lora 等)的使用經(jīng)驗(yàn);
- 有 NPU/TPU 等硬件加速器的使用經(jīng)驗(yàn),有模型量化和加速的經(jīng)驗(yàn);
- 有 TPU-MLIR 等編譯器的使用經(jīng)驗(yàn),有移植模型到 TPU 的經(jīng)驗(yàn);
- 有基本的英文文檔讀寫(xiě)能力;
- 有良好的工作習(xí)慣和職業(yè)素養(yǎng)。
加分項(xiàng)
- 熟悉編譯器基本知識(shí),了解至少一種通用或者專用的編譯器,如 GCC、LLVM、TVM、MLIR 或者自研編譯器等;
- 熟悉圖像和音視頻相關(guān)基本知識(shí),有 FFmpeg、OpenCV、gstreamer 等開(kāi)發(fā)經(jīng)驗(yàn);
- 有開(kāi)源社區(qū)貢獻(xiàn)或者開(kāi)源項(xiàng)目。