工作職責(zé):
1.負(fù)責(zé)智能座艙場景下的多模態(tài)(艙內(nèi)外語音、艙內(nèi)外視覺、車身狀態(tài)參數(shù)等模態(tài))大模型的指令微調(diào)、偏好對齊等階段的工作,包括但不限于數(shù)據(jù)迭代、模型訓(xùn)練、模型自動化評測等環(huán)節(jié)。
2.搭建訓(xùn)練數(shù)據(jù)處理Pipeline,推動汽車座艙場景的音視頻、文本等數(shù)據(jù)閉環(huán),結(jié)合模型反饋進(jìn)行數(shù)據(jù)動態(tài)篩選與更新,包含但不限于數(shù)據(jù)的質(zhì)量評估、清洗、格式化、分類等。調(diào)優(yōu)訓(xùn)練數(shù)據(jù)配比,持續(xù)構(gòu)建與優(yōu)化數(shù)據(jù)集。
3.基于多模態(tài)大模型,適配智能座艙場景中各類下游應(yīng)用(乘客復(fù)雜意圖理解,情緒健康關(guān)懷,GUI Agent等),探索大模型以及相關(guān)人工智能技術(shù)在車載場景的落地方案。
4.密切追蹤國際多模態(tài)大模型領(lǐng)域的最新研究成果與發(fā)展趨勢,積極引入先進(jìn)理念和技術(shù),保持技術(shù)的領(lǐng)先性。
任職要求:
1.計算機(jī)、人工智能等相關(guān)專業(yè)碩士及以上學(xué)歷,具備豐富的多模態(tài)理解、計算機(jī)視覺、語音識別或強(qiáng)化學(xué)習(xí)算法經(jīng)驗,對多模態(tài)大模型算法有深入理解。
2.熟練應(yīng)用pytorch、deepspeed、megatron、lamma factory、transformers等深度學(xué)習(xí)框架和庫。
3.熟悉多模態(tài)大模型領(lǐng)域的重要算法和模型(如Qwen2.5-VL、GLM-4V等),掌握大模型各類高效微調(diào)方法;
4.有數(shù)據(jù)清洗、采樣、去重、主動學(xué)習(xí)、視頻內(nèi)容檢測等方面的實(shí)戰(zhàn)經(jīng)驗,對大模型數(shù)據(jù)閉環(huán)及主動學(xué)習(xí)有一定了解;
5.對 AI 前沿技術(shù)保持熱情,具備快速學(xué)習(xí)與創(chuàng)新意識,能夠主動探索業(yè)務(wù)需求與技術(shù)創(chuàng)新的結(jié)合點(diǎn);
加分項:
1.具備扎實(shí)的編碼能力,具有優(yōu)秀的基礎(chǔ)算法、代碼能力,熟練掌握C/C++或Python編程語言,ACM/ICPC、NOI/IOI、Top Coder、Kaggle等比賽獲獎?wù)邇?yōu)先;
2.在具有扎實(shí)的計算機(jī)視覺、機(jī)器學(xué)習(xí)基礎(chǔ),熟悉CV、AIGC、NLP、RL等技術(shù)領(lǐng)域,在CVPR、ECCV、ICCV、NeurIPS、ACL、NACCL等頂級會議上發(fā)表論文者優(yōu)先
3.?在大模型相關(guān)崗位有工作經(jīng)驗,且涉及智能座艙、車載交互等領(lǐng)域者優(yōu)先。