崗位職責:
1、負責復雜工業(yè)場景下多模態(tài)大模型的應用開發(fā)與優(yōu)化,包括但不限于模型預訓練、跨模態(tài)時空對齊、指令微調、模型評估、推理加速等;
2、緊跟多模態(tài)大模型發(fā)展方向,探索視覺-語言等多模態(tài)大模型在工業(yè)領域中的意圖理解與內容生成,推動多模態(tài)大模型的研發(fā)落地工作;
3、負責大模型所需的大規(guī)模多模態(tài)數(shù)據(jù)集的獲取,清洗和標準化構建,保障多模態(tài)數(shù)據(jù)質量和有效性;
4、負責視覺類模型的深度開發(fā),結合多模態(tài)數(shù)據(jù)融合與大模型技術,解決工業(yè)場景及設備類的少樣本缺陷識別;
5、負責前沿計算機視覺、多模態(tài)數(shù)據(jù)融合、模型量化加速等相關技術調研和學習,并在實際項目中落地應用。
任職要求:
1、985碩士及以上學歷,計算機科學、人工智能、模式識別,應用數(shù)學、電子工程、自動化等相關專業(yè);
2、熟悉Python、C++語言,能夠高效完成算法編程;熟悉Linux開發(fā)環(huán)境,獨立完成項目開發(fā)與部署;熟練使用 PyTorch、TensorFlow 訓練框架;熟悉模型訓練各類問題解決與調優(yōu)策略;
3、在計算機視覺與多媒體領域有較為深入研究,包括但不限于:圖像/視頻分類和識別、圖像分割、目標檢測、OCR、圖神經(jīng)網(wǎng)絡、多模態(tài)、無監(jiān)督和自監(jiān)督學習等;
4、精通Transform、Bert、ViT等深度學習理論及框架,有Clip圖像文本聯(lián)合學習、GroundingDINO檢測等多模態(tài)項目經(jīng)驗;
5、有良好的英文閱讀能力和實踐能力,追蹤前沿的發(fā)展動態(tài),能夠直接閱讀頂會/頂刊文獻/技術報告并復現(xiàn)其中的相關算法;
6、對多模態(tài)大模型的訓練范式等有深入理解和實踐,有多機多卡大模型訓練與微調、從0到1構建垂域多模態(tài)大模型等經(jīng)驗者優(yōu)先。
加分項: 參加過Kaggle等算法類比賽、在頂級學術期刊(如CVPR、ICCV、ECCV等)發(fā)表論文。
硬性要求
1. 心理素質良好,能夠承受一定強度的工作壓力與加班;
2. 具備良好的溝通能力,邏輯思維清晰,可以獨立承擔研發(fā)項目與工程項目;