国产中文无码av每日更新在线观看, 亚洲天堂中文字幕一区二区三区免费, 国产口爆吞精在线观视频-黄色国产, 92福利-国内精品久久久久久99,亚洲成AV人A片不卡无码,浪潮AV无码专区,老熟女败火白浆,中文字幕日产av,色情日本免费看大片

更新于 12月22日

算法硬件適配工程師

1.5-2萬
  • 北京豐臺區(qū)
  • 1-3年
  • 碩士
  • 全職
  • 招3人

職位描述

計(jì)算機(jī)硬件人工智能
崗位職責(zé):
1、負(fù)責(zé)面向 GPU、NPU、ASIC 等異構(gòu)計(jì)算平臺的算法加速研究與工程優(yōu)化,構(gòu)建高性能的推理與訓(xùn)練加速能力。
2、深入分析深度學(xué)習(xí)模型的計(jì)算圖結(jié)構(gòu),開展算子級優(yōu)化、內(nèi)核實(shí)現(xiàn)優(yōu)化、圖融合(Graph Fusion)、內(nèi)存訪問優(yōu)化及調(diào)度策略改進(jìn),顯著提升整體計(jì)算效率與吞吐能力。
3、參與異構(gòu)芯片適配工作,設(shè)計(jì)跨平臺算子庫、性能調(diào)優(yōu)工具鏈及編譯優(yōu)化策略,實(shí)現(xiàn)模型在不同硬件架構(gòu)上的高效部署。
4、負(fù)責(zé)模型加速框架的技術(shù)方案設(shè)計(jì),包括模型量化(INT8/INT4)、剪枝、稀疏化、KV Cache 優(yōu)化、并行策略(Pipeline / Tensor Parallel)等關(guān)鍵技術(shù)的落地實(shí)現(xiàn)。
5、參與算法任務(wù)編排系統(tǒng)建設(shè),設(shè)計(jì)并實(shí)現(xiàn)算子調(diào)度、資源分配與執(zhí)行路徑優(yōu)化機(jī)制,提升多算法、多模型并行執(zhí)行下的系統(tǒng)性能與穩(wěn)定性。
6、編寫技術(shù)文檔,包括性能分析報(bào)告、優(yōu)化方案說明、算子接口規(guī)范及部署指南,支撐團(tuán)隊(duì)協(xié)作與工程落地。
7、跟蹤國內(nèi)外硬件加速技術(shù)、AI 編譯器(TensorRT、TVM、XLA、MLIR 等)及新型芯片架構(gòu)發(fā)展趨勢,推動創(chuàng)新技術(shù)在產(chǎn)品中的驗(yàn)證與應(yīng)用。
任職要求:
1、碩士及以上學(xué)歷,計(jì)算機(jī)體系結(jié)構(gòu)、人工智能、電子工程、軟件工程等相關(guān)專業(yè);具備異構(gòu)計(jì)算平臺研發(fā)經(jīng)驗(yàn)者優(yōu)先。
2、熟悉 GPU、NPU或ASIC芯片的原理與架構(gòu),掌握 CUDA、OpenCL 等至少一種底層并行計(jì)算框架。
3、具備扎實(shí)的算法加速與性能優(yōu)化能力,熟悉算子開發(fā)、內(nèi)核優(yōu)化、寄存器/共享內(nèi)存調(diào)度、Warp執(zhí)行機(jī)制等底層細(xì)節(jié)。
4、有 AI 編譯器、圖優(yōu)化框架或推理引擎(如 TensorRT、vLLM、SGLang、OpenVINO)相關(guān)經(jīng)驗(yàn)者優(yōu)先。
5、 熟悉深度學(xué)習(xí)主流框架(PyTorch、TensorFlow)及其底層 IR / 分布式執(zhí)行機(jī)制,具備模型量化、剪枝或稀疏化優(yōu)化實(shí)踐經(jīng)驗(yàn)者優(yōu)先。
6、具備良好的編碼能力,熟練使用 C/C++、Python,具備高性能計(jì)算相關(guān)工程經(jīng)驗(yàn)者優(yōu)先。具有嚴(yán)謹(jǐn)?shù)墓こ棠芰εc性能分析能力,能夠獨(dú)立完成從問題定位、優(yōu)化設(shè)計(jì)到性能驗(yàn)證的完整閉環(huán)。
7、 擁有優(yōu)秀的溝通能力、團(tuán)隊(duì)協(xié)作能力與問題解決能力,能夠支持項(xiàng)目交付過程中的短期出差需求。

工作地點(diǎn)

北京豐臺區(qū)中國鐵路通信信號股份有限公司

職位發(fā)布者

潘帥/人事經(jīng)理

三日內(nèi)活躍
立即溝通
通號信息產(chǎn)業(yè)有限公司
公司主頁