崗位職責:
1、負責基于大模型(語言、圖像、多模態(tài))、機器學習、深度學習技術構建,優(yōu)化場景化AI Agent應用效果,確保其最佳性能、穩(wěn)定性及可擴展性;
2、負責將AI應用功能開發(fā)并集成到現(xiàn)有工作流系統(tǒng)中,使能現(xiàn)有業(yè)務變革。
3、跟蹤研究AI技術前沿進展,提升團隊在AI Agent、大模型推理加速等方面的技術積累。
專業(yè)知識:
1.自然語言處理/機器學習/模式識別/人工智能/計算機等相關專業(yè);
2. 深入理解主流大模型架構及核心原理,熟悉其應用場景,具備豐富的模型應用開發(fā)與調(diào)優(yōu)經(jīng)驗;
3. 有高質(zhì)量論文發(fā)表者優(yōu)先(如ACL、EMNLP、NeurIPS、ICML、ICLR等);
業(yè)務要求:
1. 擁有 2 年以上自然語言處理(NLP)、智能問答、文本生成、人機對話等相關領域開發(fā)經(jīng)驗;
2. 具有較強的工程實現(xiàn)能力,熟練掌握C/C++,Python等至少一種語言,熟悉LangChain、LangGraph等大模型應用開發(fā)框架;
3.熟悉分布式訓練框架(DeepSpeed、Megatron),熟悉大模型訓練微調(diào)中模型并行、數(shù)據(jù)并行、Pipeline等訓練微調(diào)技術。
4. 具備強烈的進取心、自驅(qū)力及團隊合作精神,熱衷于追求技術創(chuàng)新。