任職要求:
"1、熟悉大模型常見(jiàn)結(jié)構(gòu)與基礎(chǔ)知識(shí)
2、熟悉Huggingface Transformer/Megatron/vLLM等大模型訓(xùn)推框架,有過(guò)模型適配經(jīng)驗(yàn)
3、有獨(dú)立的分析問(wèn)題和解決問(wèn)題的能力
4、有過(guò)芯片適配經(jīng)驗(yàn)者優(yōu)先
工作職責(zé):
"1、及時(shí)響應(yīng)客戶的請(qǐng)求,現(xiàn)場(chǎng)或遠(yuǎn)程協(xié)助客戶進(jìn)行故障排除,確保及時(shí)響應(yīng),協(xié)助研發(fā)解決客戶使用產(chǎn)品中的阻塞性問(wèn)題。
2、部署或適配過(guò)常見(jiàn)的大模型或小模型,對(duì)齊精度并調(diào)優(yōu)好訓(xùn)練和推理框架的策略
3、根據(jù)業(yè)務(wù)要求,產(chǎn)出各場(chǎng)景benchmark的精度和性能數(shù)據(jù)
4、定位到適配的算子精度和性能問(wèn)題,供業(yè)務(wù)團(tuán)隊(duì)做算子優(yōu)化
5、沉淀和開(kāi)發(fā)模型適配和測(cè)試過(guò)程中的效率工具及相關(guān)技術(shù)文檔"
崗位關(guān)鍵詞:大/小模型泛化適配、芯片適配、模型性能/精度分析、模型準(zhǔn)出