崗位職責:
1、深入了解主流圖像和視頻模型,緊密結合C端用戶需求以及公司現有基礎設施,制定合理的模型部署方案;
2、搭建并維護適配圖像和視頻生成AI模型部署的服務器環(huán)境,實現模型在C端應用中的快速部署與靈活遷移,大幅提升資源利用率,有效降低部署成本;
3、深度分析模型性能表現,對模型實施針對性優(yōu)化與調優(yōu),顯著提高模型推理速度,優(yōu)化資源利用效率,熟悉各種并行策略,熟悉各種高效注意力機制、多GPU推理調度策略,優(yōu)化顯存碎片管理與計算資源利用率;
4、密切關注圖像和視頻生成AI模型部署領域的前沿技術發(fā)展趨勢,積極開展新技術、新方法的研究與探索,為公司C端應用的模型部署工作引入創(chuàng)新思路與解決方案,提升產品競爭力。
崗位要求:
1、統(tǒng)招本科及以上學歷,計算機相關專業(yè)優(yōu)先,具備實際項目AI模型部署成功經驗;
2、熟練掌握TensorFlow/Pytorch等至少一種深度學習框架,熟悉C++或Python編程語言;
3、熟悉各種并行策略,熟悉各種高效注意力機制、多GPU推理調度策略;
4、自驅力強,有較高的技術追求,較好的團隊協(xié)作意識。