工作時(shí)間:早10晚9,
工作地址: 徐匯區(qū) 上海交通大學(xué)國(guó)家大學(xué)科技園
職位描述
一. 崗位職責(zé)
1. 基于大模型,構(gòu)建智能體架構(gòu),實(shí)現(xiàn)復(fù)雜問(wèn)題的 理解–規(guī)劃–工具調(diào)用–執(zhí)行–感知–反思(必要條件) 全流程能力;
2. 前沿技術(shù)探索,設(shè)計(jì) 算法迭代飛輪(必要條件),優(yōu)化基礎(chǔ)模型,有效提升模型性能指標(biāo)與穩(wěn)定性;
3. 規(guī)劃與實(shí)施 多智能體系統(tǒng)(必要條件),并在實(shí)際場(chǎng)景中落地;
4. 負(fù)責(zé)大模型在具體產(chǎn)品中的預(yù)訓(xùn)練、微調(diào)、封裝與模型部署服務(wù)化全鏈路;
5. 與產(chǎn)品、工程團(tuán)隊(duì)協(xié)作,針對(duì)業(yè)務(wù)進(jìn)行模型適配、性能優(yōu)化與迭代升級(jí)。
二. 任職要求
● 人工智能、計(jì)算機(jī)科學(xué)、自動(dòng)化、數(shù)學(xué)等相關(guān)專(zhuān)業(yè)優(yōu)先;
● 扎實(shí)的數(shù)據(jù)結(jié)構(gòu)和算法功底,精通 Python/C++ 中至少一種,有 PyTorch、
TensorFlow 等深度學(xué)習(xí)框架使用經(jīng)驗(yàn),并熟悉 分布式訓(xùn)練;
● 有大型預(yù)訓(xùn)練模型開(kāi)發(fā)經(jīng)驗(yàn),包括高效訓(xùn)練、微調(diào)、模型壓縮、推理優(yōu)化/部署等;
● 在頂級(jí)學(xué)術(shù)會(huì)議(如 NeurIPS、ICLR、CVPR、ACL 等)發(fā)表一作論文,或在多模態(tài)、CV、NLP、強(qiáng)化學(xué)習(xí)等競(jìng)賽中取得優(yōu)異成績(jī)者優(yōu)先;
● 責(zé)任心強(qiáng)、積極主動(dòng),良好的溝通與團(tuán)隊(duì)協(xié)作能力,能夠快速推進(jìn)項(xiàng)目進(jìn)展