【職位描述】
1. 負責(zé)開發(fā)和維護爬蟲系統(tǒng),實現(xiàn)對特定網(wǎng)站數(shù)據(jù)的抓取和解析。
2. 參與爬蟲系統(tǒng)的設(shè)計和優(yōu)化,帶領(lǐng)數(shù)據(jù)團隊攻克數(shù)據(jù)采集與應(yīng)用難題。
3. 負責(zé)處理爬蟲系統(tǒng)中出現(xiàn)的異常情況,保證數(shù)據(jù)的準確性和完整性。
4. 配合團隊成員進行數(shù)據(jù)分析和挖掘,為業(yè)務(wù)決策提供支持。
5. 參與數(shù)據(jù)采集、統(tǒng)計分析、監(jiān)控等相關(guān)系統(tǒng)架構(gòu)設(shè)計和研發(fā)
【任職要求】
1. 本科以上學(xué)歷,計算機相關(guān)專業(yè),熟悉操作系統(tǒng)(多線程、多進程)、計算機網(wǎng)絡(luò)編程、數(shù)據(jù)結(jié)構(gòu)與算法等基礎(chǔ)知識。
2. 熟悉Python編程語言,具有良好的編程能力和代碼規(guī)范,3年以上Linux環(huán)境下開發(fā)經(jīng)驗,熟練使用常用Linux命令。
3. 了解常見的網(wǎng)絡(luò)爬蟲框架,如Scrapy、BeautifulSoup等,并具有相關(guān)開發(fā)經(jīng)驗。
4. 3年以上大規(guī)模網(wǎng)頁爬蟲開發(fā)經(jīng)驗,深入了解瀏覽器原理、前端JS反爬、AJAX、非逆向、分布式系統(tǒng)設(shè)計開發(fā)落地等工作,能解決前端動態(tài)JS混淆問題。并且有優(yōu)秀結(jié)果\數(shù)據(jù)者優(yōu)先!
5. 具有團隊合作精神,溝通能力強,能夠有效與團隊成員協(xié)作完成項目任務(wù)。
6. 對數(shù)據(jù)挖掘和機器學(xué)習(xí)有一定了解者優(yōu)先考慮。
【公司介紹】
探跡成立于2016年,總部設(shè)立在廣州,全國布局2大研發(fā)中心(廣州和杭州,研發(fā)人員300多人)+4個分公司(北京/上海/深圳/杭州)+30多個辦事處(珠三角/長三角/京津冀等)。整體員工規(guī)模超1500人(計劃擴張至兩三千人)。2018年-2021年 連續(xù)4年完成不同階段融資,目前已完成C輪融資;2021-2024年 連續(xù)4年獲得 胡潤百富“全球獨角獸”稱號;目前市場估值超10億美金。
結(jié)合多模態(tài)大模型、檢索增強生成(RAG)、NLP(自然語言處理技術(shù))、機器學(xué)習(xí)算法等人工智能技術(shù),探跡構(gòu)建了1.8億家企業(yè)的全量知識圖譜,融合基于垂類行業(yè)知識延展的自研大模型,打造了全球領(lǐng)先的AI+大數(shù)據(jù) 的智能銷售SaaS軟件(拓客系統(tǒng))。為企業(yè)提供從線索挖掘、商機觸達、客戶管理到成單分析的全流程智能銷售服務(wù),幫助企業(yè)高效獲取精準銷售線索,降低獲客成本,從而全面提升銷售效率和業(yè)績。累計為超過40000家合作企業(yè)實現(xiàn)銷售數(shù)字化轉(zhuǎn)型,其中包括阿里巴巴、字節(jié)跳動、美孚石油漢高樂泰、中電光谷等行業(yè)巨頭。