工作職責(zé):
1. 負(fù)責(zé)智能座艙場(chǎng)景下多模態(tài)大模型的性能優(yōu)化,包括但不限于模型量化、剪枝、蒸餾等加速方法,以確保模型在端、云、端云混合等不同計(jì)算架構(gòu)下的高效運(yùn)行。
2. 深入挖掘不同邊緣設(shè)備的硬件特性,適配和優(yōu)化多模態(tài)大模型,在計(jì)算資源和模型精度之間做出權(quán)衡,通過(guò)技術(shù)創(chuàng)新和優(yōu)化策略獲得性能更優(yōu)的模型,確保在資源受限的環(huán)境能高效運(yùn)行。
3. 參與分布式訓(xùn)練及推理框架的落地與優(yōu)化,提高大規(guī)模數(shù)據(jù)處理性能及硬件資源利用率。
4. 優(yōu)化智能座艙場(chǎng)景下多模態(tài)大模型與其他算法模型(DMS\OMS、語(yǔ)音)的協(xié)同推理全鏈路。
任職要求:
1. 計(jì)算機(jī)、信息、數(shù)學(xué)、電子、自動(dòng)化、機(jī)械、測(cè)控、汽車(chē)等相關(guān)專(zhuān)業(yè)本科及以上學(xué)歷。
2. 具有在視覺(jué)-語(yǔ)言模型(VLM)或其他多模態(tài)AI項(xiàng)目中的模型輕量化部署工作經(jīng)驗(yàn),熟悉LLM、VLM等新興模型。
3. 精通模型性能和資源優(yōu)化技術(shù),如量化、剪枝、蒸餾、NAS搜索等,熟悉LLM模型的優(yōu)化方法如MoE、投機(jī)采樣、LoRA等,有成功優(yōu)化落地的項(xiàng)目經(jīng)歷
4. 深入理解模型性能分析工具和方法,能夠準(zhǔn)確評(píng)估模型在不同硬件上的性能,熟悉GPU/NPU等硬件上的性能分析工具。
5. 對(duì)智能座艙、人機(jī)交互、深度學(xué)習(xí)等領(lǐng)域有濃厚興趣,在技術(shù)上有高追求,能保持長(zhǎng)久投入和飽滿激情;
加分項(xiàng):
1. 在端側(cè)硬件(如英偉達(dá)、高通SOC等)有實(shí)際加速深度學(xué)習(xí)模型的經(jīng)驗(yàn),熟悉常見(jiàn)硬件的體系結(jié)構(gòu)和性能特性
2. 有多核異構(gòu)和并行計(jì)算開(kāi)發(fā)經(jīng)驗(yàn)者優(yōu)先