国产中文无码av每日更新在线观看, 亚洲天堂中文字幕一区二区三区免费, 国产口爆吞精在线观视频-黄色国产, 92福利-国内精品久久久久久99,亚洲成AV人A片不卡无码,浪潮AV无码专区,老熟女败火白浆,中文字幕日产av,色情日本免费看大片

更新于 12月17日

產(chǎn)品數(shù)據(jù)工程師

1.6-1.9萬
  • 長沙開福區(qū)
  • 5-10年
  • 本科
  • 全職
  • 招1人

雇員點(diǎn)評標(biāo)簽

  • 工作環(huán)境好
  • 同事很nice
  • 人際關(guān)系好
  • 團(tuán)隊(duì)執(zhí)行強(qiáng)
  • 氛圍活躍
  • 免費(fèi)班車
  • 管理人性化
  • 準(zhǔn)時(shí)發(fā)工資

職位描述

爬蟲WEB CRAWLINGScrapy計(jì)算機(jī)軟件
崗位描述:
1. 核心數(shù)據(jù)采集與供給(占比約50%)
? 需求分析與方案設(shè)計(jì): 深度對接算法團(tuán)隊(duì),理解其對于數(shù)據(jù)規(guī)模、類型、格式和質(zhì)量的深層需求,主導(dǎo)設(shè)計(jì)技術(shù)可行、成本可控的數(shù)據(jù)采集整體方案。
? 多源數(shù)據(jù)采集實(shí)施:
○ 公開數(shù)據(jù)源: 熟練運(yùn)用爬蟲技術(shù)(Web Crawling/Scraping)從公開網(wǎng)絡(luò)、API等渠道高效、合規(guī)地獲取數(shù)據(jù)。
○ 內(nèi)部系統(tǒng)數(shù)據(jù): 設(shè)計(jì)并實(shí)現(xiàn)從公司內(nèi)部業(yè)務(wù)系統(tǒng)、日志、傳感器等數(shù)據(jù)源的數(shù)據(jù)同步方案。
○ 定制化采集: 針對特定業(yè)務(wù)場景(如圖像、視頻、音頻等),設(shè)計(jì)并推動(dòng)實(shí)施軟/硬件結(jié)合的定制化數(shù)據(jù)采集流程。
? 合規(guī)與質(zhì)量管理: 確保所有數(shù)據(jù)采集活動(dòng)遵守相關(guān)法律法規(guī)(如個(gè)人信息保護(hù)法)和網(wǎng)站協(xié)議,并建立采集數(shù)據(jù)的質(zhì)量評估標(biāo)準(zhǔn)。
2. 數(shù)據(jù)流水線開發(fā)與處理
? 基于采集的原始數(shù)據(jù),構(gòu)建高效、穩(wěn)定的數(shù)據(jù)清洗、標(biāo)注、增強(qiáng)和特征工程流水線,為模型訓(xùn)練準(zhǔn)備好“即食”數(shù)據(jù)。
? 管理和優(yōu)化數(shù)據(jù)ETL/ELT過程,確保數(shù)據(jù)從采集到服務(wù)的低延遲和高可靠性。
3. 數(shù)據(jù)資產(chǎn)與外包管理
? 對采集和處理的各類數(shù)據(jù)進(jìn)行資產(chǎn)化管理和歸檔,建立數(shù)據(jù)目錄和血緣,實(shí)現(xiàn)數(shù)據(jù)的全生命周期管理。
? 作為技術(shù)負(fù)責(zé)人,管理與數(shù)據(jù)標(biāo)注外包團(tuán)隊(duì)的合作,制定精準(zhǔn)的標(biāo)注規(guī)范,并嚴(yán)格驗(yàn)收其數(shù)據(jù)產(chǎn)出質(zhì)量。
任職要求:
? 經(jīng)驗(yàn): 5年以上數(shù)據(jù)工程經(jīng)驗(yàn),其中必須有豐富的專項(xiàng)數(shù)據(jù)采集經(jīng)驗(yàn),有支撐機(jī)器學(xué)習(xí)/深度學(xué)習(xí)項(xiàng)目的完整數(shù)據(jù)采集案例者優(yōu)先。
? 核心技術(shù)能力:
○ 數(shù)據(jù)采集專家: 必須精通Python爬蟲生態(tài)(如Scrapy、Requests、Selenium等),具備處理反爬機(jī)制、大規(guī)模分布式爬取、數(shù)據(jù)解析與去重的實(shí)戰(zhàn)能力。
○ 編程與數(shù)據(jù)加工: 熟練掌握 Python(Pandas, NumPy) 和 SQL,能夠?qū)Σ杉降姆墙Y(jié)構(gòu)化和結(jié)構(gòu)化數(shù)據(jù)進(jìn)行高效處理。
○ 流水線與基礎(chǔ)設(shè)施: 有使用 Airflow 等工具調(diào)度和監(jiān)控?cái)?shù)據(jù)采集任務(wù)的經(jīng)驗(yàn)。熟悉 Kafka 等消息隊(duì)列,了解數(shù)據(jù)采集過程中的實(shí)時(shí)流處理。
○ 數(shù)據(jù)存儲: 熟悉不同類型數(shù)據(jù)(如文件、圖片、JSON)的存儲方案。

工作地點(diǎn)

長沙開福區(qū)馬欄山視頻文創(chuàng)產(chǎn)業(yè)園

職位發(fā)布者

江先生/招聘顧問

當(dāng)前在線
立即溝通
公司Logo軟通動(dòng)力信息技術(shù)(集團(tuán))股份有限公司
軟通動(dòng)力信息技術(shù)(集團(tuán))股份有限公司(以下簡稱“軟通動(dòng)力”)是中國領(lǐng)先的全棧智能化產(chǎn)品與服務(wù)提供商,2005年成立于北京,始終堅(jiān)持創(chuàng)新,致力于成為一家具有全球影響力的科技企業(yè)。公司提供軟件與數(shù)字技術(shù)服務(wù)、計(jì)算產(chǎn)品與智能電子、數(shù)字能源與智算服務(wù)以及國際化服務(wù),員工90000人。目前,公司在10余個(gè)重要行業(yè)服務(wù)超過2600家國內(nèi)外客戶,其中超過230家客戶為世界500強(qiáng)或中國500強(qiáng)企業(yè)。公司位列2024年中國 IT服務(wù)市場第一,入選2025年財(cái)富中國 500強(qiáng)企業(yè),位列429。軟通動(dòng)力擁有軟通咨詢、軟通金科、軟通國際、軟通工業(yè)互聯(lián)、軟通華方、機(jī)械革命、恒悅等業(yè)務(wù)子品牌,北京、江蘇兩大智能制造基地,布局北美、日韓、亞太、中東四大區(qū)域市場,在全球60余個(gè)城市構(gòu)建完善的全球業(yè)務(wù)網(wǎng)絡(luò)。公司錨定AI前沿,以人工智能工程能力為基礎(chǔ),科學(xué)智能(AI for Science)為引領(lǐng),布局智能制造、ICT軟硬基礎(chǔ)能力和具身智能等領(lǐng)域,打造新產(chǎn)業(yè)鏈閉環(huán),為客戶提供場景智能(AIAgent)、終端智能(AI Terminal)、計(jì)算智能(AIInfra)的全棧智能服務(wù)。軟通動(dòng)力設(shè)立30個(gè)能力中心,擁有1個(gè)國家級工程實(shí)驗(yàn)室,6個(gè)省市政府認(rèn)定的工程、技術(shù)實(shí)驗(yàn)室及研發(fā)中心,1個(gè)博士后科研工作站,依托全球軟硬生態(tài)協(xié)同創(chuàng)新體系,不斷探索前沿技術(shù)應(yīng)用潛力。公司旗下教育品牌軟通教育,擁有一家全日制本科學(xué)院——鄭州西亞斯學(xué)院數(shù)字技術(shù)產(chǎn)業(yè)學(xué)院;全國合作院校700多所,設(shè)有70多個(gè)校企聯(lián)合人才培養(yǎng)基地,通過校企合作、協(xié)同育人,為社會培養(yǎng)高素質(zhì)應(yīng)用型人才。軟通動(dòng)力先后榮獲“2024新經(jīng)濟(jì)企業(yè)500強(qiáng)”、“2024年中國軟件和信息技術(shù)服務(wù)競爭力百強(qiáng)企業(yè)”、“中國軟件產(chǎn)業(yè)40年貢獻(xiàn)企業(yè)”、“2024年信創(chuàng)領(lǐng)軍企業(yè)”、“省級科技進(jìn)步獎(jiǎng)”,入選滬深300、中證A500、創(chuàng)業(yè)板50等核心指數(shù),深交所信息披露最高“A”級評價(jià),連續(xù)三年獲得Wind ESG評級AA級等權(quán)威認(rèn)可;擁有專利380+項(xiàng)、全球軟件工程領(lǐng)域最高級別CMMI V2.0成熟度5級評估認(rèn)證、信息系統(tǒng)建設(shè)和服務(wù)能力最高等級——杰出級(CS5)、信息技術(shù)服務(wù)標(biāo)準(zhǔn)(ITSS)運(yùn)維能力成熟度一級認(rèn)證等專業(yè)資質(zhì),支撐公司更優(yōu)質(zhì)的服務(wù)體系。
公司主頁