崗位職責(zé):
1. 根據(jù)業(yè)務(wù)需求,研究爬蟲(chóng)策略和防屏蔽規(guī)則,設(shè)計(jì)和開(kāi)發(fā)分布式爬蟲(chóng),支持高并發(fā)多平臺(tái)抓??;
2. 負(fù)責(zé)網(wǎng)頁(yè)信息抽取、簡(jiǎn)單清洗、數(shù)據(jù)入庫(kù)等開(kāi)發(fā);
3. 提升爬蟲(chóng)穩(wěn)定性及可擴(kuò)展性,充分利用資源,優(yōu)化爬蟲(chóng)效率和質(zhì)量。
任職資格:
1. 計(jì)算機(jī)軟件及相關(guān)專(zhuān)業(yè)本科畢業(yè);
2. 1年以上爬蟲(chóng)項(xiàng)目開(kāi)發(fā)經(jīng)驗(yàn),優(yōu)秀畢業(yè)生亦可;
3.了解或處理過(guò)手機(jī)端抓包、源碼分析等;
4.了解或處理過(guò)webpack、jsvmp等
5. 熟悉爬蟲(chóng)原理及常見(jiàn)的反爬蟲(chóng)技術(shù),如cookie、js加密、base64等;
6. 熟練運(yùn)用python及多進(jìn)程、多線程開(kāi)發(fā);
7. 熟練使用scrapy、requests、selenium、pyppeteer等爬蟲(chóng)包;
8. 熟悉html,正則、xpath等提取技術(shù);
9. 熟悉Mysql、Redis等數(shù)據(jù)庫(kù)及相關(guān)操作;
10. 熟悉Linux基礎(chǔ)命令;
11. 有Django/Flask等web框架開(kāi)發(fā)經(jīng)驗(yàn)者優(yōu)先。