崗位職責:
1、負責設計、開發(fā)、優(yōu)化和部署基于 YOLO 系列模型的核心算法及應用。
2、實現復雜場景下的物體動態(tài)識別功能,重點聚焦于動物運動活躍度分析、表情識別等高級視覺任務。
任職要求:
1、精通計算機視覺基礎理論,包括但不限于:圖像處理、特征提取、目標檢測、目標跟蹤(MOT)、行為識別、姿態(tài)估計、表情識別等。
2、深入理解深度學習原理,特別是卷積神經網絡(CNN)、Transformer 等主流架構。
3、熟練掌握 YOLO (v3, v4, v5, v7, v8, v9 等) 系列模型的架構、原理、訓練技巧及優(yōu)化方法。
4、擁有使用 YOLO 模型進行**目標檢測與跟蹤**的實際項目經驗,能夠獨立完成從數據準備、模型訓練、調優(yōu)到部署的全流程。
5、精通基于視頻流的多目標跟蹤 (MOT)技術(如 DeepSORT, ByteTrack, BoT-SORT 等),并能將其與 YOLO 檢測器有效結合,實現物體(特別是動物)的持續(xù)、穩(wěn)定跟蹤。
6、具備從跟蹤軌跡中提取和分析運動特征(速度、加速度、運動方向、活動范圍、運動模式)的能力,定義和量化“活躍度”指標。
7、熟悉面部檢測與關鍵點定位技術(如 MediaPipe, Dlib, 或基于 CNN 的方法),并具備將表情識別模型(FER, AffectNet 等數據集常用模型)或算法集成到 YOLO 流程中,或利用 YOLO 檢測動物面部后再進行表情分析的經驗。對動物面部結構和表情特征有了解者優(yōu)先。
8、掌握 YOLO 模型在不同平臺(服務器、邊緣設備如 Jetson, Raspberry Pi)上的**部署和優(yōu)化**技巧(TensorRT, ONNX, OpenVINO, NCNN, TFLite 等)。
9、具備處理大規(guī)模圖像/視頻數據集的經驗,包括數據采集、清洗、標注(熟悉常用標注工具)、增強(特別是針對動態(tài)場景和動物數據)和管理。
10、精通模型訓練技巧:超參數調優(yōu)、損失函數設計、防止過擬合(正則化、Dropout)、學習率策略等。
11、掌握模型壓縮、量化、剪枝等模型優(yōu)化技術,以提升在資源受限設備上的性能。
12、精通 Python 編程語言。
13、熟練掌握深度學習框架:PyTorch(必需),熟悉 TensorFlow/Keras 者加分。
14、熟練使用 OpenCV 等計算機視覺庫。
15、熟悉 Linux 開發(fā)環(huán)境。
16、具備良好的代碼規(guī)范、版本控制(Git)和工程化能力。