1. 扎實的 Java 語言基礎,熟悉多線程、IO、網絡編程等核心API,具備良好的編程習慣、調試能力和單元測試意識。
2. 具備 Apache Flink 的實戰(zhàn)經驗:必須有使用 Flink DataStream API 開發(fā)流式應用的項目經驗(個人/課程/實習項目均可)。理解其核心概念:時間語義(Event Time/Processing Time)、狀態(tài)(StateBackend)、窗口(Window)、檢查點(Checkpoint)和容錯機制。
3. 了解 Apache Kafka:具備一定的實際操作經驗。理解其核心概念:Topic/Partition、Producer/Consumer/Consumer Group、Offset、副本機制。
4. 熟悉Flink與Kafka集成消費時的各種配置和調優(yōu)點。
5. 熟練掌握 Apache Doris:理解其核心數據模型(聚合模型、唯一模型、重復模型)的適用場景并能進行合理設計。具有數據導入的實戰(zhàn)經驗:熟練使用Stream Load、Routine Load(尤其是來自Kafka)等方式將數據高效入庫。
6. 能夠編寫復雜SQL(如多層嵌套、窗口函數、多表JOIN)進行數據查詢和分析。理解其查詢優(yōu)化原理,對索引、分區(qū)、分桶等機制有實踐經驗。
加分項:
1.有使用其他大數據組件(如 Pulsar、ClickHouse、Hudi)的經驗
2.有使用調度工具(如 DolphinScheduler, Apache Airflow)的經驗。
其他:
1. 大三、大四、研二、研三都可,實習時間至少4個月以上,每月 可接受1-2天時間請假,但不接受長時間(5天以上)請假;
2. 實習要求實習至少3個月,每周5天