【崗位職責(zé)】:
1、模型壓縮與加速: 參與大語(yǔ)言模型(LLM)和多模態(tài)模型的剪枝、量化(INT4/INT8/FP8)、知識(shí)蒸餾等算法研發(fā),致力于在極致資源受限的設(shè)備上實(shí)現(xiàn)高性能推理。
2、算法-硬件協(xié)同優(yōu)化: 針對(duì)特定的NPU架構(gòu)(如ARM, RISC-V或自研芯片)進(jìn)行算子(Operator)定制與優(yōu)化,提升推理引擎(如TensorRT, MNN, NCNN)的執(zhí)行效率。
3、端側(cè)推理引擎開(kāi)發(fā): 協(xié)助構(gòu)建高效的端側(cè)推理框架,優(yōu)化內(nèi)存管理與計(jì)算圖調(diào)度,降低延遲并減少功耗。
4、數(shù)據(jù)與評(píng)測(cè): 構(gòu)建端側(cè)場(chǎng)景下的評(píng)測(cè)數(shù)據(jù)集,建立完善的模型輕量化效果評(píng)估體系。
我們希望你是在讀碩士研究生(研二優(yōu)先),具備以下素質(zhì):
1、專(zhuān)業(yè)背景: 計(jì)算機(jī)科學(xué)、軟件工程、人工智能、電子工程等相關(guān)專(zhuān)業(yè)。
2、理論基礎(chǔ): 扎實(shí)的機(jī)器學(xué)習(xí)、深度學(xué)習(xí)理論基礎(chǔ),熟悉CNN, Transformer等主流網(wǎng)絡(luò)結(jié)構(gòu)。
3、編程能力:
4、精通 Python,熟悉 PyTorch 或 TensorFlow 框架。
5、具備優(yōu)秀的 C/C++ 能力,有 Linux 環(huán)境下的開(kāi)發(fā)經(jīng)驗(yàn)(這是端側(cè)開(kāi)發(fā)的關(guān)鍵)。
6、項(xiàng)目經(jīng)驗(yàn): 有以下任意相關(guān)項(xiàng)目經(jīng)驗(yàn)者優(yōu)先:
7、模型量化(Quantization Aware Training / Post-Training Quantization)實(shí)戰(zhàn)經(jīng)驗(yàn)。
8、使用過(guò) ONNX, TensorRT, TVM 等模型轉(zhuǎn)換或推理工具。
9、在手機(jī)、嵌入式板卡(如Jetson, Raspberry Pi)上部署過(guò)深度學(xué)習(xí)模型。
10、加分項(xiàng)(軟性實(shí)力)
(1)對(duì) AI 安全(如對(duì)抗樣本、隱私保護(hù))或后量子密碼(PQC)有一定了解(結(jié)合公司業(yè)務(wù)特色)。
(2)熟悉 RISC-V 或 ARM 體系結(jié)構(gòu),了解 Cache、SIMD 等硬件原理。
(3)在頂級(jí)會(huì)議(CVPR, ICCV, NeurIPS, ACL等)發(fā)表過(guò)論文,或在 Kaggle、天池等競(jìng)賽中取得優(yōu)異成績(jī)。
【實(shí)習(xí)待遇】:
實(shí)習(xí)補(bǔ)貼1200元/月;最高免租房住學(xué)生公寓,免費(fèi)班車(chē)接送,商業(yè)保險(xiǎn)。