1.負(fù)責(zé)公司 AI 相關(guān)業(yè)務(wù)的數(shù)據(jù)處理與模型開發(fā)工作,包括數(shù)據(jù)清洗、特征工程及模型訓(xùn)練,確保數(shù)據(jù)質(zhì)量與模型效果。
2. 對(duì)現(xiàn)有模型進(jìn)行微調(diào)與優(yōu)化,結(jié)合業(yè)務(wù)場(chǎng)景選擇合適的預(yù)訓(xùn)練模型,提升模型在實(shí)際任務(wù)中的表現(xiàn)。
3. 基于 Transformer、BERT 等主流架構(gòu)開發(fā)文本分類、信息抽取、語(yǔ)義匹配等 NLP 相關(guān)功能模塊。
4. 使用 FastAPI 或 Django 開發(fā)模型服務(wù)接口,將模型能力封裝為穩(wěn)定可用的后端服務(wù),支持業(yè)務(wù)系統(tǒng)對(duì)接。
5. 開發(fā)并維護(hù)模型訓(xùn)練、評(píng)估及部署流程,保障模型上線后的穩(wěn)定性與可維護(hù)性。
6. 持續(xù)跟蹤 NLP 及大模型領(lǐng)域前沿技術(shù),結(jié)合業(yè)務(wù)需求進(jìn)行技術(shù)預(yù)研與落地。
7. 撰寫相關(guān)技術(shù)文檔,確保代碼和系統(tǒng)具有良好的可讀性與可維護(hù)性。
具體要求:
1.熟練掌握 Python,具備扎實(shí)的編程基礎(chǔ),熟悉常用數(shù)據(jù)處理庫(kù)(NumPy、Pandas)及機(jī)器學(xué)習(xí)框架(Scikit-learn、PyTorch),有良好的代碼規(guī)范意識(shí);2. 熟悉 FastAPI 或 Django 框架,能夠獨(dú)立開發(fā)和維護(hù)后端服務(wù)接口,具備 RESTful API 設(shè)計(jì)與開發(fā)經(jīng)驗(yàn);
3. 具備模型微調(diào)實(shí)戰(zhàn)經(jīng)驗(yàn),能夠獨(dú)立完成預(yù)訓(xùn)練模型的下游任務(wù)微調(diào),熟悉 HuggingFace Transformers 工具鏈的使用;
4. 了解 Transformer 架構(gòu)原理,熟悉 BERT 及其變體(RoBERTa、DistilBERT 等)者優(yōu)先;
5. 熟悉 LoRA、P-Tuning 等參數(shù)高效微調(diào)(PEFT)方法者優(yōu)先;
6. 具備基本的模型評(píng)估與調(diào)優(yōu)能力,能夠根據(jù)指標(biāo)分析模型問題并給出優(yōu)化方案;
7. 熟悉 Git、MySQL、Redis 等常用工具及中間件的基本使用;
8. 具備良好的學(xué)習(xí)能力與團(tuán)隊(duì)協(xié)作精神,能快速適應(yīng)業(yè)務(wù)需求變化。