国产中文无码av每日更新在线观看, 亚洲天堂中文字幕一区二区三区免费, 国产口爆吞精在线观视频-黄色国产, 92福利-国内精品久久久久久99,亚洲成AV人A片不卡无码,浪潮AV无码专区,老熟女败火白浆,中文字幕日产av,色情日本免费看大片

更新于 4月22日

數據工程師(深度學習/大模型方向)

1.5-2.5萬
  • 上海浦東新區(qū)
  • 3-5年
  • 本科
  • 全職
  • 招2人

雇員點評標簽

  • 工作環(huán)境好
  • 同事很nice
  • 團隊執(zhí)行強
  • 人際關系好
  • 氛圍活躍
  • 交通便利
  • 實力大公司
  • 五險一金

職位描述

人工智能云計算/大數據
崗位職責
1. 數據基礎設施構建
1.1 設計并搭建面向深度學習和大模型訓練的高效數據管道(Data Pipeline),支持TB/PB級多模態(tài)數據(文本、圖像、語音等)的采集、清洗、存儲與分布式處理。
1.2 優(yōu)化數據預處理流程(ETL/ELT),提升數據吞吐量與處理效率,滿足大模型訓練對海量數據的實時性需求。
2. 數據質量管理
2.1 開發(fā)數據質量監(jiān)控工具,識別并修復數據噪聲、缺失、偏差等問題,確保訓練數據的可靠性。
2.2 建立數據版本控制機制,跟蹤數據變更歷史,支持模型訓練的可復現性。
3. 分布式數據處理
3.1 基于Spark、Flink、Ray等框架構建分布式數據處理系統(tǒng),加速數據并行與模型訓練效率。
3.2 與算法團隊協(xié)作,優(yōu)化數據分片、采樣策略,適配分布式訓練框架。
4. 數據合規(guī)與安全
4.1 設計數據脫敏、匿名化方案,確保敏感數據(如用戶隱私數據)符合GDPR等法規(guī)要求。
4.2 構建數據權限管理體系,實現細粒度訪問控制。
任職要求
1. 精通Python,熟悉SQL及至少一種大數據框架(Spark/Flink)。
2. 熟練使用Airflow、Kafka、Dagster等工具構建數據工作流。
3. 熟悉數據湖(Delta Lake/Iceberg)、向量數據庫(Milvus/Pinecone)等新型存儲技術。
4. 理解深度學習數據需求:掌握TFDS、HuggingFace Datasets等工具,熟悉數據并行/流水線并行邏輯。
經驗背景
1. 3年以上數據工程經驗,至少1年支持過大規(guī)模模型(LLM/CV大模型)數據體系建設。
2. 有完整的數據治理項目經驗,熟悉數據血緣追蹤、元數據管理(如Apache Atlas)。

工作地點

上海浦東新區(qū)科技領袖之都43號樓

職位發(fā)布者

周蓓麗/人事經理

昨日活躍
立即溝通
公司Logo浪潮集團公司標簽
浪潮集團是中國領先的云計算、大數據服務商,擁有三家上市公司。主要業(yè)務涉及計算裝備、軟件、云計算服務、新一代通信、大數據及若干應用場景。作為中國最早的IT品牌之一,浪潮致力于成為世界一流的新一代信息技術龍頭企業(yè)經濟社會數字化轉型的優(yōu)秀服務商,新型基礎設施建設的骨干企業(yè)。
公司主頁