崗位職責(zé):
1. 針對(duì)不同端側(cè)設(shè)備的硬件特性(CPU、GPU、NPU 等)進(jìn)行模型適配;
2. 對(duì)大模型進(jìn)行推理加速優(yōu)化,優(yōu)化軟件對(duì)硬件的利用效率,降低軟件的內(nèi)存占用;
3. 與端側(cè)芯片原廠合作,針對(duì)特定硬件架構(gòu)和推理引擎進(jìn)行模型優(yōu)化,以實(shí)現(xiàn)最佳性能。
任職要求:
1. 計(jì)算機(jī)、自動(dòng)化、計(jì)算數(shù)學(xué)、統(tǒng)計(jì)學(xué)等相關(guān)專業(yè),碩士或以上學(xué)歷,具備較好的計(jì)算機(jī)通用算法基礎(chǔ);
2. 熟悉并行計(jì)算框架,如 CUDA,OpenCL 等;
3. 熟悉 C++/Linux 等工具,及 TensorFlow、PyTorch 等深度學(xué)習(xí)框架;
4. 有深度學(xué)習(xí)模型推理實(shí)現(xiàn)經(jīng)驗(yàn)優(yōu)先;
5. 在高性能計(jì)算方向發(fā)表過高水平論文、獲得過相關(guān)賽事獎(jiǎng)項(xiàng)者優(yōu)先;
6. 強(qiáng)烈的責(zé)任心和自我驅(qū)動(dòng)力以及良好的溝通能力。
備注:本崗位投遞有效期截止至2025.3.1,請(qǐng)求職者按照既定時(shí)間投遞簡(jiǎn)歷!