工作內(nèi)容:
1. 數(shù)據(jù)資產(chǎn)管理與治理:
負責(zé)或參與構(gòu)建設(shè)備運行數(shù)據(jù)的全生命周期管理體系,設(shè)計并維護數(shù)據(jù)的存儲、清洗與標準化流程,制定數(shù)據(jù)質(zhì)量監(jiān)控規(guī)則,確保數(shù)據(jù)服務(wù)的及時性、有效性和易用性。
2. 數(shù)據(jù)平臺開發(fā)與優(yōu)化:
負責(zé)或參與分布式數(shù)據(jù)平臺及數(shù)倉的建設(shè),對數(shù)據(jù)管理平臺迭代開發(fā)提出建議。利用平臺數(shù)據(jù)開發(fā)模塊或線下IDE工具,編寫自定義數(shù)據(jù)聚合篩選、指標計算等算法腳本。
3. 數(shù)據(jù)探索與價值挖掘:
開發(fā)數(shù)據(jù)預(yù)處理腳本與特征工程工具,為算法團隊提供高質(zhì)量數(shù)據(jù)集。負責(zé)或參與利用存量數(shù)據(jù)構(gòu)建基礎(chǔ)分析模型,如進行設(shè)備健康度計算、參數(shù)預(yù)警、關(guān)聯(lián)分析等模型開發(fā)與研究。
崗位要求:
1. 教育背景:
本科及以上學(xué)歷,數(shù)據(jù)科學(xué)、計算機、自動化、熱能動力等相關(guān)專業(yè)。
2. 專業(yè)技能:
精通常用單機數(shù)據(jù)庫維護方法,包括MySQL、Redis、MongoDB等。
熟悉CDH大數(shù)據(jù)平臺架構(gòu),掌握HBase、OpenTSDB等分布式數(shù)據(jù)庫運維方法。
熟悉數(shù)據(jù)清洗、特征篩選、特征衍生等數(shù)據(jù)分析過程。
精通PYTHON或JAVA編程,熟悉Sklearn,PyTorch,TensorFlow等常見人工智能框架。
了解工業(yè)數(shù)據(jù)特性(如高頻采樣、非結(jié)構(gòu)化日志),具備數(shù)據(jù)清洗與異常檢測實戰(zhàn)經(jīng)驗。
3. 行業(yè)經(jīng)驗
3年以上數(shù)據(jù)工程相關(guān)經(jīng)驗,有工業(yè)設(shè)備、物聯(lián)網(wǎng)或能源行業(yè)數(shù)據(jù)治理經(jīng)驗者優(yōu)先,有工業(yè)場景的機器學(xué)習(xí)算法、深度學(xué)習(xí)算法開發(fā)項目經(jīng)驗者優(yōu)先。
4. 綜合素質(zhì):
具備數(shù)據(jù)敏感度與業(yè)務(wù)洞察力,能快速理解設(shè)備運維場景的數(shù)據(jù)需求,并善于用數(shù)據(jù)驅(qū)動問題解決。
具有良好的團隊合作精神和溝通能力,能夠與不同專業(yè)的人員協(xié)作完成項目任務(wù)。
具備較強的責(zé)任心和敬業(yè)精神,能夠在壓力下高效完成工作任務(wù)。