崗位職責(zé):
1、負責(zé)公司音頻模型的訓(xùn)練與優(yōu)化,對音頻數(shù)據(jù)進行特征提取、標(biāo)注預(yù)處理,并進行數(shù)據(jù)增強與數(shù)據(jù)集構(gòu)建;
2、基于 PyTorch / TensorFlow 等深度學(xué)習(xí)框架,進行音頻時頻域建模、空間重建等神經(jīng)網(wǎng)絡(luò)算法開發(fā);
3、參與模型壓縮(如INT8量化)、推理加速及異構(gòu)部署(GPU/NPU)適配;
4、跟進模型在車載、PC、移動端等不同場景的部署需求,配合工程團隊進行模型聯(lián)調(diào)測試;
5、跟蹤行業(yè)前沿研究(音頻分離、空間定位、HRTF重建等),轉(zhuǎn)化為可落地能力。
任職要求:
1、碩士及以上學(xué)歷,信號處理、人工智能、聲學(xué)、計算機等相關(guān)專業(yè);
2、具備 2 年以上音頻/語音方向深度學(xué)習(xí)模型訓(xùn)練經(jīng)驗;
3、熟悉深度學(xué)習(xí)常見網(wǎng)絡(luò)結(jié)構(gòu)(如UNet、ResNet、Transformer),有音頻建模(如源分離、聲源定位、空間音頻)經(jīng)驗優(yōu)先;
4、熟練使用 Python、PyTorch/TensorFlow、librosa、ffmpeg 等工具;
5、了解音樂結(jié)構(gòu)、聲學(xué)特征,具備實際音頻處理項目經(jīng)驗者優(yōu)先;
6、具備獨立完成音頻模型開發(fā)與部署的能力,包括數(shù)據(jù)處理、模型設(shè)計、訓(xùn)練優(yōu)化及推理落地。
7、有良好的溝通協(xié)作能力與工程化思維,熱愛音頻與創(chuàng)新技術(shù);
加分項:
1、有環(huán)繞聲、空間音頻、虛擬現(xiàn)實音頻等模型或產(chǎn)品經(jīng)驗;
2、有比賽、開源項目或論文成果優(yōu)先;
3、熟悉 Onnx、Triton、CUDA、TensorRT 等推理優(yōu)化工具優(yōu)先。