国产中文无码av每日更新在线观看, 亚洲天堂中文字幕一区二区三区免费, 国产口爆吞精在线观视频-黄色国产, 92福利-国内精品久久久久久99,亚洲成AV人A片不卡无码,浪潮AV无码专区,老熟女败火白浆,中文字幕日产av,色情日本免费看大片

更新于 9月5日

高級爬蟲工程師

1.2-1.3萬·13薪
  • 西安未央?yún)^(qū)
  • 3-5年
  • 本科
  • 全職
  • 招1人

職位描述

數(shù)據(jù)清洗反爬蟲Python數(shù)據(jù)采集AI
負責各類互聯(lián)網(wǎng)平臺的數(shù)據(jù)采集,建立穩(wěn)定高效的爬蟲流程。
負責任務(wù)的定時執(zhí)行、采集速度控制、失敗重試,保證采集過程穩(wěn)定可靠。
對采集到的原始數(shù)據(jù)進行清洗、結(jié)構(gòu)化、去重與質(zhì)量校驗。
設(shè)計并維護數(shù)據(jù)庫/存儲模型,實現(xiàn)數(shù)據(jù)的入庫與快照管理。
搭建日志、監(jiān)控與報警體系,持續(xù)優(yōu)化采集與處理流程。
熟悉 HTTP/HTTPS 協(xié)議,能夠分析請求頭、參數(shù)和分頁規(guī)則。
熟悉使用抓包工具(Fiddler、mitmproxy、Charles),能夠完成接口抓取與復現(xiàn)。
熟悉 JSON、Protobuf 等數(shù)據(jù)格式,具備接口解析和數(shù)據(jù)處理能力。
熟悉 PostgreSQL / MySQL,掌握常見的數(shù)據(jù)去重、快照和更新方法,了解 Redis 在緩存和限流中的應(yīng)用。
具備數(shù)據(jù)清洗與質(zhì)量控制經(jīng)驗,能夠保證采集數(shù)據(jù)的準確性。
了解定時任務(wù)和調(diào)度工具(如APScheduler、Airflow),有日志和監(jiān)控經(jīng)驗(Prometheus、Grafana、ELK)。
熟練掌握 Python 或 Node.js/TypeScript,具備并發(fā)采集經(jīng)驗。
有app端數(shù)據(jù)爬取者經(jīng)驗優(yōu)先

工作地點

未央?yún)^(qū)西安工業(yè)設(shè)計產(chǎn)業(yè)園-凱瑞E座

職位發(fā)布者

李先生/研發(fā)

今日活躍
立即溝通