崗位職責:
1.設計通用型AI軟件架構,支持多模態(tài)模型(CV/NLP/語音)在嵌入式GPU(如RTX 4090)與集群云環(huán)境中的無縫遷移。
2.GPU服務器部署與優(yōu)化,搭建基于RTX 4090的AI服務器集群,配置NVLink/PCIe拓撲結構,實現(xiàn)多卡并行計算(如數(shù)據(jù)并行、模型并行)。
3.Linux系統(tǒng)集成與運維,定制Linux內(nèi)核驅動(如Nvidia DKMS),解決RTX 4090與舊版內(nèi)核(如Ubuntu 18.04)的兼容性問題。
4.AI模型加速與落地,使用TensorRT量化模型(FP32→INT8),在RTX 4090上實現(xiàn)推理速度3倍提升,同時保持98%+精度。
任職要求:
1.計算機科學、電子工程或相關領域碩士及以上學位,3年以上AI軟件架構開發(fā)經(jīng)驗。
2.主導過至少1個基于GPU的AI項目(如自動駕駛感知系統(tǒng)、大語言模型推理服務)