LLM 數(shù)據(jù)工程與微調研發(fā)實習生

150-210元/天

上海徐匯區(qū)
本科
實習
招1人
6個月
5天/周

職位描述

可轉正實習證明PYTHON/PANDASHF TRANSFORMERS計算機LLM計算機軟件云計算/大數(shù)據(jù)人工智能

一、核心職責
1. 訓練數(shù)據(jù)處理與生成：針對 LLM 訓練需求，清洗并規(guī)范化多源數(shù)據(jù)（文本 / 表格 / 日志），完成數(shù)據(jù)脫敏、去重、去噪，輸出符合訓練標準的語料；結合交通 / 政務 / 停車等業(yè)務場景，設計提示詞模板與采樣策略（含 system prompt、shot 數(shù)量、temperature/top-p 參數(shù)），批量生成高質量問答對與指令數(shù)據(jù)，并搭建 “生成 - 過濾 - 審校” 閉環(huán)機制，保障數(shù)據(jù)質量。
2. 微調數(shù)據(jù)流水線構建：負責 LLM 微調數(shù)據(jù)全流程搭建，涵蓋數(shù)據(jù)切分、格式適配（Alpaca/ShareGPT 規(guī)范）、多輪質檢與版本化管理，確保數(shù)據(jù)鏈路可追溯。
3. LLM 微調執(zhí)行與協(xié)助：執(zhí)行并協(xié)助團隊完成 LLM 參數(shù)高效微調任務（LoRA/QLoRA/PEFT），實時監(jiān)控訓練關鍵指標（loss、grad norm、VRAM 占用、TPS 等），輸出可復現(xiàn)的訓練腳本，配合團隊優(yōu)化微調效果。
4. 模型評測與驗收：開展 LLM 離線基準評測（Exact-Match、F1、ROUGE、BERTScore、長度懲罰等指標），針對交通 / 政務 / 停車等領域數(shù)據(jù)集進行專項測試，對比基線模型與 A/B 測試結果，輸出評測報告。
5. 文檔與知識沉淀：梳理并沉淀崗位核心知識資產，包括 LLM 訓練數(shù)據(jù)標準、提示詞庫、模型評測報告、模型迭代變更記錄（changelog），支撐團隊技術復用。
二、任職要求
1. 學歷與實習時長：計算機、數(shù)據(jù)科學、人工智能等相關專業(yè)在讀（本科及以上）；每周可到崗≥3 天，連續(xù)實習≥3 個月，能穩(wěn)定參與項目迭代。
2. 基礎技術能力：熟練掌握 Python 編程（必備）；具備正則表達式應用、SQL 結構化查詢能力；扎實掌握 Linux 操作系統(tǒng)基礎與 Git 版本控制（如分支管理、提交規(guī)范、沖突解決）。
3. 模型認知基礎：熟悉 Transformer 模型核心原理（如 Tokenization、上下文窗口機制），理解 SFT（監(jiān)督微調）、指令微調及模型對齊的核心邏輯，能清晰區(qū)分不同微調方式的適用場景。
4. 工作能力要求：具備快速試錯與迭代意識，能基于數(shù)據(jù)驗證提示詞優(yōu)化效果，以 “產出高質量結果” 為導向，主動推進任務落地。
三、加分項
1. 微調與工具經驗：了解 LoRA/QLoRA 等參數(shù)高效微調技術，或使用過 DeepSpeed/Accelerate（訓練加速）、vLLM/TGI（推理部署）工具；有 HuggingFace Transformers、LlamaFactory 實操經驗者優(yōu)先。
2. 評測能力儲備：使用過 lm-eval-harness、OpenAI Evals 等 LLM 專業(yè)評測框架，或有自建領域評測集（如交通 / 政務場景）、設計評測指標的經驗。
3. 數(shù)據(jù)與開源經驗：參與過數(shù)據(jù)標注、眾包質檢、合成數(shù)據(jù)治理項目；曾向開源社區(qū)（如 HuggingFace、LlamaFactory）提交過 PR 并被合并者優(yōu)先。
四、技術棧（含應用場景）
類別核心技術及應用說明
數(shù)據(jù)處理 Python/Pandas（數(shù)據(jù)清洗、分析與格式轉換）、SQL（結構化數(shù)據(jù)查詢與提?。?br>模型訓練 HF Transformers/PEFT/TRL（LLM 基礎訓練框架）、LoRA/QLoRA（參數(shù)高效微調）、DeepSpeed/Accelerate（訓練加速）、BitsAndBytes（低精度訓練）
服務與評測 vLLM/TGI（LLM 推理部署）、FastAPI（簡單服務搭建）、lm-eval-harness（評測框架）、Weights & Biases/Grafana（指標監(jiān)控與可視化）
協(xié)作與工具 Jupyter（數(shù)據(jù)探索與腳本調試）、VS Code（代碼開發(fā)）、Git（版本控制與團隊協(xié)作）

工作地點

上海徐匯區(qū)阿里巴巴徐匯濱江園區(qū)X區(qū)-3棟4樓

完善一份簡歷
1736萬+企業(yè)在線搜索，780萬+海量職位精準推薦

相似職位

提示（Prompt）工程師2-3.5萬
上海 - 浦東
中船動力(集團)有限公司
NLP/CV/語音/深度學習/算法崗1.8-3.5萬·16薪
上海 - 浦東
外企德科數(shù)字技術有限公司
AI開發(fā)工程師（大語言模型方向）2.5-3.5萬
上海 - 靜安
天津恩恩科技
NLP / RAG 工程師1.5-2.5萬
上海 - 長寧
康龍化成(成都)臨床研究服務有限公司
AI知識圖譜實習工程師200-300元/天
上海 - 長寧
北京德和順天科技有限公司
知識圖譜專家1-1.5萬
上海 - 奉賢
上海耕強安防技術有限公司

查看更多相似職位

職位發(fā)布者

章天一/HR

立即溝通

中城交(上海)科技有限公司

作為隧道股份孵化的上海首家國資背景垂類大模型企業(yè)，中城交（上海）科技有限公司（簡稱“中城交”）聚焦交通與城市治理大模型領域，依托深厚的行業(yè)積淀、領先的技術優(yōu)勢與海量數(shù)據(jù)資產，為城市智能化升級提供全鏈條解決方案。公司以“數(shù)據(jù)驅動決策，AI重塑城市”為使命，致力于成為全國領先的城市治理大模型構建者。

公司主頁

關于我們: 公司介紹; 聯(lián)系我們; 誠聘英才

產品與服務: 人才招聘; 企業(yè)招聘

使用與幫助: 賬號注銷; 意見反饋; 發(fā)票制度; 防騙指南; 法律協(xié)議; 資質公示

智聯(lián)招聘更懂你的價值

智聯(lián)app小程序官方微信企業(yè)版APP

京ICP備12025925號?京ICP證010207號

京公網(wǎng)安備 11010502059392號?人力資源許可證:1101051996081號

網(wǎng)上有害信息舉報專區(qū)?違法不良信息舉報電話:400-885-9898 關愛未成年舉報熱線:400-885-9898-3

朝陽區(qū)人力資源與社會保障局監(jiān)督電話?

網(wǎng)絡110報警服務電子營業(yè)執(zhí)照