職位描述
基礎(chǔ)研發(fā)平臺(tái)是美團(tuán)的核心技術(shù)平臺(tái),立足于“零售+科技”的戰(zhàn)略定位,通過打造人工智能、大數(shù)據(jù)、云計(jì)算、安全等核心技術(shù)能力,以及研發(fā)效能平臺(tái)、企業(yè)應(yīng)用平臺(tái)等公共服務(wù),為業(yè)務(wù)提供穩(wěn)定安全、擴(kuò)展易用、技術(shù)領(lǐng)先的平臺(tái)技術(shù)和產(chǎn)品服務(wù)。
在這里,我們會(huì)參與到最前沿的技術(shù)研發(fā)和探索;能夠接觸超規(guī)模集群、海量數(shù)據(jù),挑戰(zhàn)高復(fù)雜業(yè)務(wù)場(chǎng)景,有機(jī)會(huì)與業(yè)界一流的工程師一起并肩前行。
在這里,我們有超強(qiáng)的技術(shù)氛圍,持續(xù)向社區(qū)貢獻(xiàn)業(yè)界實(shí)踐,加速行業(yè)技術(shù)發(fā)展;我們有完善的互聯(lián)網(wǎng)學(xué)習(xí)生態(tài)圈,重視底層邏輯和方法論,助力職業(yè)生涯的非線性成長。
真誠地邀請(qǐng)你,和我們一起驅(qū)動(dòng)技術(shù)發(fā)展,創(chuàng)造行業(yè)價(jià)值。
崗位職責(zé)
1、負(fù)責(zé)Diffusion模型在推理階段的性能優(yōu)化,包括但不限于模型量化、稀疏注意力、模型蒸餾、特征緩存復(fù)用等技術(shù)。
2、深入理解Diffusion模型及其相關(guān)算法,分析模型性能瓶頸,設(shè)計(jì)高效的推理加速方案,提出優(yōu)化策略。
3、與算法團(tuán)隊(duì)協(xié)作,推動(dòng)Diffusion模型算法與推理框架的深度融合,提升整體系統(tǒng)效率。
4、跟蹤業(yè)界Diffusion模型優(yōu)化技術(shù)和推理框架,持續(xù)改進(jìn)優(yōu)化效果。
5、編寫清晰的技術(shù)文檔,分享優(yōu)化經(jīng)驗(yàn),支持團(tuán)隊(duì)技術(shù)能力的提升。
崗位基本需求
1、碩士研究生及以上學(xué)歷,計(jì)算機(jī)、統(tǒng)計(jì)學(xué)、數(shù)學(xué)等相關(guān)專業(yè)背景,深度學(xué)習(xí)模型推理優(yōu)化相關(guān)項(xiàng)目經(jīng)驗(yàn)。
2、熟悉Diffusion模型的原理及其常見應(yīng)用場(chǎng)景,有實(shí)際項(xiàng)目經(jīng)驗(yàn)者優(yōu)先。
3、精通深度學(xué)習(xí)框架(如PyTorch、TensorFlow)及其推理優(yōu)化工具(如TensorRT、OneFlow、ONNX Runtime)。
4、熟悉模型量化、剪枝、知識(shí)蒸餾等模型優(yōu)化技術(shù),具備相關(guān)實(shí)踐經(jīng)驗(yàn)。
5、熟悉GPU、TPU等硬件加速原理,有CUDA編程經(jīng)驗(yàn)者優(yōu)先。
6、具備良好的編程能力,熟練掌握Python/C++,有優(yōu)秀的代碼規(guī)范意識(shí)。
7、具備良好的問題分析和解決能力,能夠快速定位和解決模型性能問題。
8、具備團(tuán)隊(duì)合作精神,良好的溝通表達(dá)能力和學(xué)習(xí)能力。
具備以下者優(yōu)先
1、有Diffusion模型在實(shí)際場(chǎng)景中落地優(yōu)化的成功案例。
2、熟悉分布式訓(xùn)練與推理加速技術(shù)。
3、了解模型壓縮及硬件協(xié)同優(yōu)化的研究進(jìn)展。
4、參與或貢獻(xiàn)過開源深度學(xué)習(xí)優(yōu)化工具。
崗位亮點(diǎn)
1、薪資福利優(yōu)厚,提供良好的職業(yè)發(fā)展空間和晉升機(jī)會(huì)。
2、團(tuán)隊(duì)氛圍輕松融洽,注重員工的技能培養(yǎng)和個(gè)人成長。
3、參與項(xiàng)目具有挑戰(zhàn)性和前沿性,能夠接觸到前沿算法技術(shù)和發(fā)展趨勢(shì)。