国产中文无码av每日更新在线观看, 亚洲天堂中文字幕一区二区三区免费, 国产口爆吞精在线观视频-黄色国产, 92福利-国内精品久久久久久99,亚洲成AV人A片不卡无码,浪潮AV无码专区,老熟女败火白浆,中文字幕日产av,色情日本免费看大片

更新于 12月16日

數(shù)據(jù)工程師(LLM數(shù)據(jù)標(biāo)注與平臺搭建方向)

5000-8000元
  • 重慶九龍坡區(qū)
  • 5-10年
  • 本科
  • 全職
  • 招1人

職位描述

圖像標(biāo)注語音標(biāo)注音頻標(biāo)注視頻標(biāo)注文本標(biāo)注云計算/大數(shù)據(jù)人工智能計算機軟件工業(yè)自動化專業(yè)技術(shù)服務(wù)工程技術(shù)與設(shè)計服務(wù)
一、崗位職責(zé)
? 負(fù)責(zé)LLM相關(guān)數(shù)據(jù)的格式標(biāo)注工作,制定標(biāo)注規(guī)范與質(zhì)量校驗標(biāo)準(zhǔn),保障標(biāo)注數(shù)據(jù)的準(zhǔn)確性、一致性,支撐大模型訓(xùn)練、微調(diào)及優(yōu)化場景的數(shù)據(jù)需求。
? 基于Java技術(shù)棧搭建及迭代數(shù)據(jù)平臺,涵蓋數(shù)據(jù)采集、清洗、存儲、標(biāo)注流轉(zhuǎn)、檢索等核心模塊,實現(xiàn)數(shù)據(jù)處理全流程的自動化與高效化。
? 參與數(shù)據(jù)平臺的架構(gòu)設(shè)計與技術(shù)選型,解決平臺運行中的高可用、高性能問題,保障海量LLM標(biāo)注數(shù)據(jù)的穩(wěn)定處理與安全存儲。
? 協(xié)同算法團(tuán)隊梳理數(shù)據(jù)需求,優(yōu)化標(biāo)注流程與數(shù)據(jù)處理鏈路,提升數(shù)據(jù)交付效率,助力大模型在相關(guān)業(yè)務(wù)場景的落地應(yīng)用。
? 負(fù)責(zé)數(shù)據(jù)平臺相關(guān)文檔的編寫與維護(hù),包括技術(shù)設(shè)計文檔、操作手冊、標(biāo)注規(guī)范文檔等,保障團(tuán)隊協(xié)作順暢。
二、核心技術(shù)能力
1. LLM數(shù)據(jù)標(biāo)注能力
精通LLM相關(guān)數(shù)據(jù)的格式標(biāo)注規(guī)則,熟悉常見LLM數(shù)據(jù)類型(如對話生成、文本分類、信息抽取、prompt工程、知識庫問答等)的標(biāo)注方法;熟練使用LabelStudio等主流數(shù)據(jù)標(biāo)注工具,具備標(biāo)注工具配置、流程自定義及批量標(biāo)注處理的實戰(zhàn)經(jīng)驗;具備標(biāo)注規(guī)范制定、標(biāo)注質(zhì)量把控、標(biāo)注問題排查的實戰(zhàn)能力,能有效提升標(biāo)注團(tuán)隊的工作效率與數(shù)據(jù)質(zhì)量。
2. Java開發(fā)能力
具備5年以上Java開發(fā)實戰(zhàn)經(jīng)驗,精通Java開發(fā)語言,熟悉JDK8及以上版本特性;深入理解面向?qū)ο缶幊趟枷耄鷮嵳莆占峡蚣堋⒍嗑€程并發(fā)、IO流等基礎(chǔ)技術(shù),能熟練運用Spring、Spring Boot、MyBatis等主流開發(fā)框架進(jìn)行項目開發(fā)、迭代及問題優(yōu)化;具備Java項目性能調(diào)優(yōu)、故障排查的豐富經(jīng)驗。
3. 數(shù)據(jù)平臺搭建能力
具備完整的數(shù)據(jù)平臺搭建實戰(zhàn)經(jīng)驗,熟悉數(shù)據(jù)平臺的核心架構(gòu)(數(shù)據(jù)采集層、處理層、存儲層、應(yīng)用層);能獨立完成數(shù)據(jù)采集腳本開發(fā)、數(shù)據(jù)清洗規(guī)則實現(xiàn)、標(biāo)注流程模塊搭建、數(shù)據(jù)存儲方案設(shè)計(如MySQL、Redis、Hadoop等);熟練掌握RAG(檢索增強生成)技術(shù)原理與落地實踐,能將RAG技術(shù)融入數(shù)據(jù)平臺,實現(xiàn)標(biāo)注數(shù)據(jù)的高效檢索、知識庫構(gòu)建及與大模型的協(xié)同應(yīng)用。
4. 數(shù)據(jù)處理與工具應(yīng)用
熟悉常見的數(shù)據(jù)處理工具與技術(shù),能應(yīng)對海量數(shù)據(jù)的清洗、轉(zhuǎn)換、格式標(biāo)準(zhǔn)化等需求;了解數(shù)據(jù)可視化工具的使用,可實現(xiàn)標(biāo)注數(shù)據(jù)質(zhì)量、平臺運行狀態(tài)等關(guān)鍵指標(biāo)的可視化展示;了解Python語言及相關(guān)數(shù)據(jù)處理庫(如Pandas、Numpy)者優(yōu)先。
三、任職資格
? 5年以上相關(guān)工作經(jīng)驗,其中包含5年以上Java開發(fā)經(jīng)驗及1年以上LLM數(shù)據(jù)格式標(biāo)注實戰(zhàn)經(jīng)驗,熟練使用LabelStudio等數(shù)據(jù)標(biāo)注工具、具備RAG技術(shù)落地經(jīng)驗及完整數(shù)據(jù)平臺搭建項目經(jīng)歷者優(yōu)先。
? 本科及以上學(xué)歷(能力突出者可放寬),計算機科學(xué)與技術(shù)、數(shù)據(jù)科學(xué)、軟件工程等相關(guān)專業(yè)優(yōu)先;深入理解LLM數(shù)據(jù)標(biāo)注的核心價值,清楚標(biāo)注數(shù)據(jù)對大模型性能的影響。
? 具備良好的問題排查能力,能快速定位并解決數(shù)據(jù)標(biāo)注過程中的格式問題、平臺運行中的技術(shù)故障。
? 關(guān)注數(shù)據(jù)領(lǐng)域與大模型相關(guān)技術(shù)趨勢,具備較強的學(xué)習(xí)能力與創(chuàng)新意識,能積極探索數(shù)據(jù)標(biāo)注與數(shù)據(jù)平臺優(yōu)化的新方法、新技術(shù)。
? 具備良好的溝通表達(dá)能力與跨團(tuán)隊協(xié)作精神,能高效配合算法、產(chǎn)品等團(tuán)隊完成工作;具備嚴(yán)謹(jǐn)?shù)倪壿嬎季S與文檔編寫能力。
四、優(yōu)先條件
? 有大模型訓(xùn)練/微調(diào)相關(guān)數(shù)據(jù)標(biāo)注項目經(jīng)驗,熟悉特定行業(yè)(如智能制造、金融、醫(yī)療等)LLM數(shù)據(jù)標(biāo)注場景者優(yōu)先。
? 熟悉分布式數(shù)據(jù)存儲與計算技術(shù)(如Hadoop、Spark、Flink等),具備大數(shù)據(jù)平臺搭建與優(yōu)化經(jīng)驗者優(yōu)先。
? 了解LangChain、Spring AI等大模型應(yīng)用開發(fā)框架,或有數(shù)據(jù)標(biāo)注工具二次開發(fā)經(jīng)驗者優(yōu)先。
? 具備數(shù)據(jù)安全、數(shù)據(jù)脫敏相關(guān)實踐經(jīng)驗,熟悉數(shù)據(jù)合規(guī)相關(guān)要求者優(yōu)先。

工作地點

九龍坡區(qū)重慶理工大學(xué)國家大學(xué)科技園

職位發(fā)布者

李轉(zhuǎn)紅/人事經(jīng)理

昨日活躍
立即溝通