国产中文无码av每日更新在线观看, 亚洲天堂中文字幕一区二区三区免费, 国产口爆吞精在线观视频-黄色国产, 92福利-国内精品久久久久久99,亚洲成AV人A片不卡无码,浪潮AV无码专区,老熟女败火白浆,中文字幕日产av,色情日本免费看大片

更新于 1月6日

LLM 數(shù)據(jù)工程與微調研發(fā)實習生

150-210元/天
  • 上海徐匯區(qū)
  • 本科
  • 實習
  • 招1人
  • 6個月
  • 5天/周

職位描述

可轉正實習證明PYTHON/PANDASHF TRANSFORMERS計算機LLM計算機軟件云計算/大數(shù)據(jù)人工智能
一、核心職責
1. 訓練數(shù)據(jù)處理與生成:針對 LLM 訓練需求,清洗并規(guī)范化多源數(shù)據(jù)(文本 / 表格 / 日志),完成數(shù)據(jù)脫敏、去重、去噪,輸出符合訓練標準的語料;結合交通 / 政務 / 停車等業(yè)務場景,設計提示詞模板與采樣策略(含 system prompt、shot 數(shù)量、temperature/top-p 參數(shù)),批量生成高質量問答對與指令數(shù)據(jù),并搭建 “生成 - 過濾 - 審校” 閉環(huán)機制,保障數(shù)據(jù)質量。
2. 微調數(shù)據(jù)流水線構建:負責 LLM 微調數(shù)據(jù)全流程搭建,涵蓋數(shù)據(jù)切分、格式適配(Alpaca/ShareGPT 規(guī)范)、多輪質檢與版本化管理,確保數(shù)據(jù)鏈路可追溯。
3. LLM 微調執(zhí)行與協(xié)助:執(zhí)行并協(xié)助團隊完成 LLM 參數(shù)高效微調任務(LoRA/QLoRA/PEFT),實時監(jiān)控訓練關鍵指標(loss、grad norm、VRAM 占用、TPS 等),輸出可復現(xiàn)的訓練腳本,配合團隊優(yōu)化微調效果。
4. 模型評測與驗收:開展 LLM 離線基準評測(Exact-Match、F1、ROUGE、BERTScore、長度懲罰等指標),針對交通 / 政務 / 停車等領域數(shù)據(jù)集進行專項測試,對比基線模型與 A/B 測試結果,輸出評測報告。
5. 文檔與知識沉淀:梳理并沉淀崗位核心知識資產,包括 LLM 訓練數(shù)據(jù)標準、提示詞庫、模型評測報告、模型迭代變更記錄(changelog),支撐團隊技術復用。
二、任職要求
1. 學歷與實習時長:計算機、數(shù)據(jù)科學、人工智能等相關專業(yè)在讀(本科及以上);每周可到崗≥3 天,連續(xù)實習≥3 個月,能穩(wěn)定參與項目迭代。
2. 基礎技術能力:熟練掌握 Python 編程(必備);具備正則表達式應用、SQL 結構化查詢能力;扎實掌握 Linux 操作系統(tǒng)基礎與 Git 版本控制(如分支管理、提交規(guī)范、沖突解決)。
3. 模型認知基礎:熟悉 Transformer 模型核心原理(如 Tokenization、上下文窗口機制),理解 SFT(監(jiān)督微調)、指令微調及模型對齊的核心邏輯,能清晰區(qū)分不同微調方式的適用場景。
4. 工作能力要求:具備快速試錯與迭代意識,能基于數(shù)據(jù)驗證提示詞優(yōu)化效果,以 “產出高質量結果” 為導向,主動推進任務落地。
三、加分項
1. 微調與工具經驗:了解 LoRA/QLoRA 等參數(shù)高效微調技術,或使用過 DeepSpeed/Accelerate(訓練加速)、vLLM/TGI(推理部署)工具;有 HuggingFace Transformers、LlamaFactory 實操經驗者優(yōu)先。
2. 評測能力儲備:使用過 lm-eval-harness、OpenAI Evals 等 LLM 專業(yè)評測框架,或有自建領域評測集(如交通 / 政務場景)、設計評測指標的經驗。
3. 數(shù)據(jù)與開源經驗:參與過數(shù)據(jù)標注、眾包質檢、合成數(shù)據(jù)治理項目;曾向開源社區(qū)(如 HuggingFace、LlamaFactory)提交過 PR 并被合并者優(yōu)先。
四、技術棧(含應用場景)
類別 核心技術及應用說明
數(shù)據(jù)處理 Python/Pandas(數(shù)據(jù)清洗、分析與格式轉換)、SQL(結構化數(shù)據(jù)查詢與提?。?br>模型訓練 HF Transformers/PEFT/TRL(LLM 基礎訓練框架)、LoRA/QLoRA(參數(shù)高效微調)、DeepSpeed/Accelerate(訓練加速)、BitsAndBytes(低精度訓練)
服務與評測 vLLM/TGI(LLM 推理部署)、FastAPI(簡單服務搭建)、lm-eval-harness(評測框架)、Weights & Biases/Grafana(指標監(jiān)控與可視化)
協(xié)作與工具 Jupyter(數(shù)據(jù)探索與腳本調試)、VS Code(代碼開發(fā))、Git(版本控制與團隊協(xié)作)

工作地點

上海徐匯區(qū)阿里巴巴徐匯濱江園區(qū)X區(qū)-3棟4樓

職位發(fā)布者

章天一/HR

立即溝通
公司Logo中城交(上海)科技有限公司
作為隧道股份孵化的上海首家國資背景垂類大模型企業(yè),中城交(上海)科技有限公司(簡稱“中城交”)聚焦交通與城市治理大模型領域,依托深厚的行業(yè)積淀、領先的技術優(yōu)勢與海量數(shù)據(jù)資產,為城市智能化升級提供全鏈條解決方案。公司以“數(shù)據(jù)驅動決策,AI重塑城市”為使命,致力于成為全國領先的城市治理大模型構建者。
公司主頁