崗位職責(zé):
1. 負(fù)責(zé)大模型、計(jì)算機(jī)視覺(jué)等算法工程化部署;?
2. 優(yōu)化模型的部署性能,降低推理延遲、提升硬件資源利用率;
3. 跟蹤NeurIPS/ICML/CVPR/ICLR等頂會(huì)頂刊;
4. 編寫(xiě)部署手冊(cè)、優(yōu)化報(bào)告等文檔。
崗位要求:
(一)基本要求
1.碩士及以上學(xué)歷;博士在大模型/計(jì)算機(jī)視覺(jué)/生成式AI領(lǐng)域有專項(xiàng)研究成果者優(yōu)先;
2.年齡:碩士≤35 周歲并有2年以上AI算法工程經(jīng)驗(yàn),博士≤40周歲;有核心算法部署經(jīng)驗(yàn)或頭部AI企業(yè)資深經(jīng)歷者可放寬;
3.邊緣端模型輕量化、大模型分布式推理、AIGC工業(yè)化應(yīng)用經(jīng)驗(yàn)者優(yōu)先。
(二)核心能力要求
1. 精通AI 模型原理與架構(gòu),熟悉TensorRT/ONNX Runtime/vLLM等部署工具鏈,掌握多硬件平臺(tái)部署特性,了解Docker容器化技術(shù);
2. 熟悉模型量化、剪枝、算子優(yōu)化技術(shù),熟練使用Nsight/Perf等工具;
3. 扎實(shí)AI算法基礎(chǔ),能快速分析頂會(huì)論文創(chuàng)新點(diǎn),分析復(fù)現(xiàn)算法;
4. 精通Python+AI框架,掌握Pandas/NumPy/OpenCV數(shù)據(jù)處理工具,了解C/C++。