一、崗位職責(zé):
1、負(fù)責(zé)多模態(tài)大模型的研發(fā)與優(yōu)化工作,包括但不限于跨模態(tài)信息對齊方法探索、預(yù)訓(xùn)練、指令微調(diào)、RLHF等技術(shù)的研究與應(yīng)用;
2、負(fù)責(zé)大規(guī)模多模態(tài)數(shù)據(jù)的獲取、清洗及質(zhì)量控制,保障數(shù)據(jù)質(zhì)量和有效性;
3、跟進(jìn)業(yè)界前沿,參與多模態(tài)大模型的設(shè)計、預(yù)訓(xùn)練、微調(diào)、評測全流程優(yōu)化工作,構(gòu)建業(yè)界的多模態(tài)大模型;
4、解決項目過程中的難題,推動多模態(tài)大模型商業(yè)化落地,提升系統(tǒng)效果和用戶滿意度。
二、任職要求:
1、碩士及以上,計算機科學(xué)、機器學(xué)習(xí)、人工智能、統(tǒng)計等相關(guān)專業(yè)優(yōu)先;
2、在計算機視覺、多模態(tài)理解方面有扎實的研究基礎(chǔ),熟悉主流的多模態(tài)大模型,如Flamingo, InstructBLIP, LLaVA, Qwen-VL等,有相關(guān)實操經(jīng)驗者優(yōu)先;
3、熟練掌握Python/C++等編程語言,熟悉機器學(xué)習(xí)基本理論和常用算法,具有較好的數(shù)據(jù)結(jié)構(gòu)和算法分析能力;
4、熟悉Linux操作系統(tǒng),熟練使用Pytorch、TensorFlow等深度學(xué)習(xí)框架,了解分布式訓(xùn)練框架如Deepspeed、Megatron-LM等,具備優(yōu)秀的工程開發(fā)能力;
5、具有較強的算法開發(fā)能力,能夠根據(jù)業(yè)務(wù)需求進(jìn)行算法設(shè)計、實現(xiàn)和優(yōu)化;
6、具備良好的溝通與協(xié)調(diào)能力,有團(tuán)隊合作精神,善于學(xué)習(xí)和思考,能夠適應(yīng)快速變化的工作環(huán)境;
7、賽事獲獎、頂會論文發(fā)表或開源項目貢獻(xiàn)者優(yōu)先。