崗位職責
1、負責開發(fā)新型AI芯片的AI加速庫(如BLAS for AI運算、加密算法庫)、算子庫;
2、開展計算密集型任務(并行計算、SIMD指令利用)優(yōu)化等工作;
3、封裝新型計算加速芯片功能為高層API,提供跨平臺支持(Windows/Linux/嵌入式OS);
4、開展AI加速庫的測試及優(yōu)化工作;
5、撰寫相關方案、報告及各類文檔;
6、領導交辦的其他工作任務。
能力要求
1.工作經驗:具備獨立完成AI加速庫、算子庫的開發(fā)工作經驗。
2.能力要求:
(1)掌握PyTorch/TensorFlow/PaddlePaddle/MindSpore等主流AI框架底層實現(xiàn),掌握Transformer、GNN、LSTM等模型開發(fā);
(2)熟悉模型壓縮技術(知識蒸餾、量化感知訓練),有ONNX/TensorRT優(yōu)化經驗;
(3)熟練使用Hugging Face、DGL/PyG圖神經網(wǎng)絡庫等AI開發(fā)工具以及Slurm集群調度、CUDA加速優(yōu)化等高性能計算工具;
(4)具備跨平臺開發(fā)經驗;
(5)工作積極主動,具備較強的責任心和原則性,具有良好的學習能力和抗壓能力。