崗位職責(zé):
1.設(shè)計(jì)并實(shí)施大數(shù)據(jù)處理和分析策略,確保數(shù)據(jù)質(zhì)量和精準(zhǔn)度。
2.與團(tuán)隊(duì)合作,優(yōu)化數(shù)據(jù)處理流程,提高數(shù)據(jù)效率。
3.參與大數(shù)據(jù)項(xiàng)目的規(guī)劃和執(zhí)行,協(xié)助解決技術(shù)難題。
4.與架構(gòu)師對齊長期目標(biāo),作為技術(shù)中堅(jiān),負(fù)責(zé)設(shè)計(jì)分布式數(shù)據(jù)倉庫(如Hive/Iceberg)和數(shù)據(jù)湖架構(gòu),規(guī)劃數(shù)據(jù)流向(采集→存儲→計(jì)算→服務(wù))
5.主導(dǎo)數(shù)據(jù)清洗、轉(zhuǎn)換、加載流程,使用Spark/ Flink構(gòu)建高效作業(yè),優(yōu)化資源分配
6.監(jiān)控?cái)?shù)據(jù)處理活動,確保遵守相關(guān)法律法規(guī)和標(biāo)準(zhǔn)。
任職要求:
1.具備扎實(shí)的大數(shù)據(jù)處理和分析能力,熟悉數(shù)據(jù)處理工具和語言。
2.具有良好的問題解決能力,能夠獨(dú)立處理和解決技術(shù)問題。
3.技術(shù)棧
①精通Java編程語言
②大數(shù)據(jù)工具鏈:Spark/Hadoop/Kafka/Hive,熟悉數(shù)據(jù)湖(Delta/Iceberg)
4.開發(fā)能力
①設(shè)計(jì)ETL流程(如Kafka→Spark→Hive)
②SQL優(yōu)化(復(fù)雜查詢調(diào)優(yōu),Hive/Presto)
③Spark作業(yè)優(yōu)化(數(shù)據(jù)傾斜處理、資源分配)
5.數(shù)據(jù)經(jīng)驗(yàn)
①大規(guī)模數(shù)據(jù)處理:參與TB-PB級項(xiàng)目(如日志清洗、用戶行為分析)
②數(shù)據(jù)質(zhì)量保障:設(shè)計(jì)校驗(yàn)規(guī)則、處理臟數(shù)據(jù)
③主導(dǎo)過千萬級DAU用戶數(shù)據(jù)處理