国产中文无码av每日更新在线观看, 亚洲天堂中文字幕一区二区三区免费, 国产口爆吞精在线观视频-黄色国产, 92福利-国内精品久久久久久99,亚洲成AV人A片不卡无码,浪潮AV无码专区,老熟女败火白浆,中文字幕日产av,色情日本免费看大片

更新于 10月13日

數(shù)據(jù)工程師

面議
  • 北京東城區(qū)
  • 3-5年
  • 碩士
  • 全職
  • 招1人

職位描述

數(shù)據(jù)架構(gòu)
【崗位職責(zé)】
1.期刊XML數(shù)據(jù)標(biāo)準(zhǔn)制定與實施(核心重點)
a. 負(fù)責(zé)分析不同標(biāo)準(zhǔn)的期刊XML數(shù)據(jù)(如JATS、BITS、CrossRef等),制定符合我司業(yè)務(wù)需求的內(nèi)部統(tǒng)一數(shù)據(jù)標(biāo)準(zhǔn)和規(guī)范。
b. 設(shè)計并開發(fā)強(qiáng)大的XML解析、驗證、清洗和轉(zhuǎn)換(ETL/ELT)流程,確保數(shù)據(jù)能準(zhǔn)確映射到目標(biāo)模型。
c. 建立數(shù)據(jù)質(zhì)量監(jiān)控規(guī)則和校驗體系,對入庫的期刊XML數(shù)據(jù)進(jìn)行自動化質(zhì)量檢查和報告,確保數(shù)據(jù)的完整性、準(zhǔn)確性和一致性。
d. 解決XML數(shù)據(jù)處理中遇到的復(fù)雜技術(shù)問題,如處理大型XML文件、解析復(fù)雜嵌套結(jié)構(gòu)、字符編碼問題等。
2.數(shù)據(jù)管道與平臺開發(fā)(通用數(shù)據(jù)工程師職責(zé))
a. 設(shè)計、構(gòu)建和維護(hù)穩(wěn)定、可擴(kuò)展的數(shù)據(jù)管道,負(fù)責(zé)期刊數(shù)據(jù)從采集、處理到存儲的全鏈路。
b. 管理和優(yōu)化數(shù)據(jù)倉庫/數(shù)據(jù)湖中相關(guān)數(shù)據(jù)模型,確保其能滿足下游業(yè)務(wù)(如檢索、推薦、分析)的需求。
c. 與數(shù)據(jù)科學(xué)家和分析師協(xié)作,為其提供高質(zhì)量、易用的數(shù)據(jù)集合。
3. 標(biāo)準(zhǔn)維護(hù)與協(xié)作
a. 持續(xù)跟蹤學(xué)術(shù)出版行業(yè)的數(shù)據(jù)標(biāo)準(zhǔn)演進(jìn),并據(jù)此優(yōu)化內(nèi)部標(biāo)準(zhǔn)和處理流程。
b. 與內(nèi)容獲取、產(chǎn)品經(jīng)理和研發(fā)團(tuán)隊緊密協(xié)作,理解業(yè)務(wù)需求,并將其轉(zhuǎn)化為技術(shù)方案。
c. 編寫清晰的技術(shù)文檔,包括數(shù)據(jù)標(biāo)準(zhǔn)說明書、數(shù)據(jù)處理流程說明和系統(tǒng)設(shè)計文檔。
【任職要求】
1. 工作經(jīng)驗
a. 學(xué)歷要求:碩士以上學(xué)歷(211,985,雙一流院校優(yōu)先),計算機(jī)及相關(guān)專業(yè)優(yōu)先
b. 3年以上數(shù)據(jù)工程師或相關(guān)領(lǐng)域工作經(jīng)驗。
c. 必須具備扎實的XML/JSON等結(jié)構(gòu)化數(shù)據(jù)處理經(jīng)驗,熟悉XPath, XSLT, XML Schema (XSD) 等相關(guān)技術(shù)。
d. 擁有構(gòu)建和維護(hù)ETL/ELT數(shù)據(jù)管道的實戰(zhàn)經(jīng)驗。
2.技術(shù)技能:
a. 編程語言: 精通 Python 或 Java/Scala,并具備使用其處理XML/JSON數(shù)據(jù)的能力(如使用lxml, ElementTree, BeautifulSoup等庫)。
b. 數(shù)據(jù)存儲: 熟悉至少一種關(guān)系型數(shù)據(jù)庫(如PostgreSQL, MySQL)和一種NoSQL數(shù)據(jù)庫(如MongoDB)。
c. 大數(shù)據(jù)技術(shù): 熟悉至少一種大數(shù)據(jù)處理框架,如 Spark(優(yōu)先考慮)、Flink,或熟練使用SQL進(jìn)行復(fù)雜數(shù)據(jù)處理。
3.軟技能:
a. 對數(shù)據(jù)質(zhì)量有極高的要求,做事嚴(yán)謹(jǐn)、細(xì)致,有強(qiáng)烈的責(zé)任心。
b. 具備優(yōu)秀的邏輯分析和問題解決能力,能獨立解決復(fù)雜的數(shù)據(jù)問題。
c. 具備良好的溝通能力和文檔撰寫能力。
4.優(yōu)先考慮條件(加分項)
a. 有學(xué)術(shù)出版、數(shù)字圖書館、知識服務(wù)等相關(guān)行業(yè)背景,熟悉 JATS 等期刊標(biāo)記標(biāo)準(zhǔn)。
b. 有使用或解析 Elsevier, Springer Nature, Wiley 等大型出版社XML數(shù)據(jù)的經(jīng)驗。
c. 有數(shù)據(jù)治理、數(shù)據(jù)質(zhì)量管理或元數(shù)據(jù)管理相關(guān)項目經(jīng)驗。

工作地點

北京東城區(qū)科學(xué)出版社

職位發(fā)布者

孫超/HR

今日活躍
立即溝通
公司Logo中國科技出版?zhèn)髅焦煞萦邢薰?/a>
科學(xué)出版社由中國科學(xué)院編譯局與1930年創(chuàng)建的龍門聯(lián)合書局于1954年8月合并成立;2007年4月轉(zhuǎn)制改企為科學(xué)出版社有限責(zé)任公司;2011年完成股份制改造,整體變更設(shè)立為中國科技出版?zhèn)髅焦煞萦邢薰荆ㄒ韵潞喎Q“公司”)。2017年1月18日,公司在上海證券交易所主板掛牌上市(股票簡稱:中國科傳,股票代碼:601858),成為中央出版集團(tuán)上市第一股。60多年來,科學(xué)出版社依托中國科學(xué)院,秉承多年來形成的“高層次、高水平、高質(zhì)量”和“嚴(yán)肅、嚴(yán)密、嚴(yán)格”的優(yōu)良傳統(tǒng)與作風(fēng),堅持為科技創(chuàng)新服務(wù)、為科學(xué)傳播服務(wù)、為廣大作者和讀者服務(wù)的宗旨,面向世界科技前沿,面向國家重大需求,面向國民經(jīng)濟(jì)主戰(zhàn)場,充分挖掘國內(nèi)外優(yōu)良出版資源,重視重大出版工程建設(shè),形成了以科學(xué)(S)、技術(shù)(T)、醫(yī)學(xué)(M)、教育(E)、人文社科(H)為主要出版領(lǐng)域的業(yè)務(wù)架構(gòu)。目前科學(xué)出版社每年出版新書4000多種,期刊300多種,擁有《中國科學(xué)》雜志社有限責(zé)任公司、北京龍騰八方文化有限責(zé)任公司、北京中科進(jìn)出口有限責(zé)任公司等23個下屬分、子公司;在成都、武漢、南京、西安、石家莊、沈陽、廣州、蘇州,以及美國、日本、法國均設(shè)立了分支機(jī)構(gòu),建立了完善的全球出版、發(fā)行網(wǎng)絡(luò),是國內(nèi)最大的綜合性科技出版機(jī)構(gòu)。公司始終堅持“專業(yè)化、精品化、系列化”的出版理念,高度重視重大重點出版工程建設(shè),入選國家出版基金項目42項;入選國家科學(xué)技術(shù)學(xué)術(shù)著作出版基金項目占總數(shù)的一半以上;入選“十二五”國家圖書重點出版規(guī)劃項目90個、“十三五”國家重點圖書出版規(guī)劃項目70個;入選“三個一百”原創(chuàng)出版工程15種;等等。公司入選各類出版基金和國家級規(guī)劃項目的數(shù)量均在全國出版社中位列前茅。公司還擁有一個高水平、高質(zhì)量、多品種的期刊方陣,2019年,公司年出版期刊347種,其中英文期刊131種,被SCI(《科學(xué)引文索引(Science Citation Index)》)收錄53種、被EI(《工程索引(Engineering Index)》)收錄50種,有14種位于國際同類期刊Q1區(qū)。其中,《中國科學(xué)》、《科學(xué)通報》系列(簡稱“兩刊”)中英文17種期刊,是在中國科學(xué)院學(xué)部平臺上運作和管理的高水平學(xué)術(shù)期刊,是我國自然科學(xué)期刊中的知名品牌,曾獲得第一、二、三屆國家期刊獎,第二、三、四屆中國出版政府獎期刊獎等榮譽。高端綜述性學(xué)術(shù)期刊《國家科學(xué)評論》(National Science Review)最新影響因子(2022)達(dá)17.275,在全球多學(xué)科綜合類期刊中排名第三。公司積極響應(yīng)中央文化“走出去”戰(zhàn)略部署,與20多個國家和地區(qū)的200多家出版公司建立了長期的良好合作關(guān)系,并在設(shè)立美國、日本全資子公司的基礎(chǔ)上,于2019年完成了對法國EDP Sciences 100%股權(quán)的收購,完善了全球業(yè)務(wù)布局。近年來,每年輸出圖書版權(quán)均位居科技出版社之首,先后榮獲全國版權(quán)輸出先進(jìn)單位、2008中國版權(quán)最具影響力企業(yè)、2015年全國版權(quán)示范單位等稱號,并且連續(xù)多年被商務(wù)部、宣傳部、財政部、文化部、廣電總局等五部委聯(lián)合評為“國家文化出口重點企業(yè)”。在出版業(yè)數(shù)字化轉(zhuǎn)型的浪潮中,公司大膽創(chuàng)新,明確了從傳統(tǒng)出版向知識服務(wù)轉(zhuǎn)型發(fā)展的戰(zhàn)略路徑,確立了專業(yè)學(xué)科知識庫、醫(yī)療健康大數(shù)據(jù)、數(shù)字教育云服務(wù)等業(yè)務(wù)創(chuàng)新轉(zhuǎn)型的方向,并先后推出了“科學(xué)文庫”、“CourseGate教育云平臺”、“SCIPMED中科醫(yī)學(xué)資源庫”、“SciEngine中國科技期刊國際傳播平臺”等多款知識服務(wù)產(chǎn)品。其中,“SciEngine平臺”入選“全國報刊媒體融合創(chuàng)新30佳”榜單,“科學(xué)文庫”榮獲“第二屆中國出版政府獎音像電子網(wǎng)絡(luò)獎”。 2015年,國家新聞出版廣電總局還授予公司“專業(yè)數(shù)字內(nèi)容資源知識服務(wù)模式試點單位”稱號。
公司主頁