職位描述
基礎研發(fā)平臺是美團的核心技術平臺,立足于“零售+科技”的戰(zhàn)略定位,通過打造人工智能、大數(shù)據(jù)、云計算、安全等核心技術能力,以及研發(fā)效能平臺、企業(yè)應用平臺等公共服務,為業(yè)務提供穩(wěn)定安全、擴展易用、技術領先的平臺技術和產品服務。
在這里,我們會參與到最前沿的技術研發(fā)和探索;能夠接觸超規(guī)模集群、海量數(shù)據(jù),挑戰(zhàn)高復雜業(yè)務場景,有機會與業(yè)界一流的工程師一起并肩前行。
在這里,我們有超強的技術氛圍,持續(xù)向社區(qū)貢獻業(yè)界實踐,加速行業(yè)技術發(fā)展;我們有完善的互聯(lián)網(wǎng)學習生態(tài)圈,重視底層邏輯和方法論,助力職業(yè)生涯的非線性成長。
真誠地邀請你,和我們一起驅動技術發(fā)展,創(chuàng)造行業(yè)價值。
崗位職責
主要負責多模態(tài)大模型(不限于視覺/語音專家模型與全模態(tài)融合模型)的模型能力分析,并且對訓練數(shù)據(jù)、策略和模型能力之間的關系進行研究分析,產出可行的模型評測方案和訓練策略,具體工作內容包括但不限于:
1. 追蹤多模態(tài)大模型方向的前沿進展,積極學習新的模型結構、前沿模型認知,并進行深入分析。
2. 積極探索業(yè)界前沿的生成與理解多模大模型進展,深入理解模型結構與訓練過程,設定合理的模型訓練效果分析方法和評測方案。
3. 結合評測結果,對模型的訓練數(shù)據(jù)、策略和結構等進行深入分析,指導評測方案迭代以及訓練策略優(yōu)化。
4. 與各相關部門保持良好溝通,深度參與多模態(tài)模型的訓練過程,共同推動多模態(tài)大模型持續(xù)優(yōu)化。
崗位基本需求
1. 碩士及以上學歷,計算機、數(shù)學、統(tǒng)計學或相關專業(yè)。
2. 熟悉Java/Python/C++等編程語言,良好的編碼習慣和一定的工程能力 。
3. 具有視覺/語音算法的基礎知識,熟練掌握多模態(tài)大模型相關算法和模型。
4. 良好的溝通能力、團隊合作精神以及較強的問題解決能力。
5. 對每一行代碼負責,對業(yè)務方負責,具備工匠精神。
具備以下者優(yōu)先
1. 在計算機領域頂會(如CVPR、ECCV,ICCV,ACL,NeurIPS,AAAI等)上以一作發(fā)表過論文者優(yōu)先。
2. 有視覺/語音等模態(tài)相關工作或算法研究經驗者優(yōu)先;
3. 對多模理解生成統(tǒng)一大模型有深入了解者優(yōu)先;
崗位亮點
1. 緊跟人工智能行業(yè)進展,接觸到前沿技術和行業(yè)趨勢,磨練出對人工智能的獨到見解;
2. 參與大模型的訓練與評測的全流程,了解從理論到工程實踐的全面技能;
3. 與一流的人工智能團隊合作,快速成長,提升自身能力;
4. 有機會參與公司的創(chuàng)新項目,跨足不同領域,拓寬人工智能技術的應用范圍;