国产中文无码av每日更新在线观看, 亚洲天堂中文字幕一区二区三区免费, 国产口爆吞精在线观视频-黄色国产, 92福利-国内精品久久久久久99,亚洲成AV人A片不卡无码,浪潮AV无码专区,老熟女败火白浆,中文字幕日产av,色情日本免费看大片

更新于 7月3日

大模型強(qiáng)化學(xué)習(xí)算法專(zhuān)家

5-8萬(wàn)
  • 北京朝陽(yáng)區(qū)
  • 5-10年
  • 碩士
  • 全職
  • 招1人

職位描述

強(qiáng)化學(xué)習(xí)?大模型算法
崗位職責(zé)
1. 研發(fā)和優(yōu)化大模型強(qiáng)化學(xué)習(xí)核心算法(RLHF、RFT、ReFT、DPO、KTO、IPO、RRHF等),專(zhuān)注于專(zhuān)業(yè)研報(bào)撰寫(xiě)和思維鏈優(yōu)化方向
2. 構(gòu)建端到端強(qiáng)化學(xué)習(xí)訓(xùn)練管道,包括高效獎(jiǎng)勵(lì)模型設(shè)計(jì)、策略?xún)?yōu)化算法研發(fā)和智能數(shù)據(jù)收集系統(tǒng)開(kāi)發(fā)
3. 深度探索思維鏈(Chain-of-Thought)強(qiáng)化學(xué)習(xí)范式,提升模型在邏輯推理、分析論證和專(zhuān)業(yè)內(nèi)容生成上的能力
4. 研發(fā)專(zhuān)業(yè)研報(bào)領(lǐng)域的對(duì)齊技術(shù),提高模型輸出的專(zhuān)業(yè)性、準(zhǔn)確性和可靠性
5. 設(shè)計(jì)并實(shí)現(xiàn)多輪推理優(yōu)化算法,提升模型在復(fù)雜分析和長(zhǎng)文檔撰寫(xiě)中的連貫性和深度
6. 跟蹤大模型強(qiáng)化學(xué)習(xí)前沿技術(shù),撰寫(xiě)高質(zhì)量技術(shù)分析報(bào)告,為團(tuán)隊(duì)提供深度技術(shù)指導(dǎo)
任職要求
1. 計(jì)算機(jī)科學(xué)、機(jī)器學(xué)習(xí)或人工智能相關(guān)專(zhuān)業(yè)碩士及以上學(xué)歷
2. 具備豐富的RLHF對(duì)齊策略實(shí)踐經(jīng)驗(yàn),能獨(dú)立設(shè)計(jì)和優(yōu)化人類(lèi)偏好建模系統(tǒng)
3. 熟悉并實(shí)踐過(guò)最新的強(qiáng)化學(xué)習(xí)算法,如Constitutional AI、思維鏈增強(qiáng)型RL訓(xùn)練和無(wú)強(qiáng)化學(xué)習(xí)的偏好優(yōu)化方法
4. 對(duì)專(zhuān)業(yè)研報(bào)結(jié)構(gòu)化生成和思維鏈(Chain-of-Thought)技術(shù)有深入研究
5. 參與過(guò)大規(guī)模開(kāi)放領(lǐng)域大模型訓(xùn)練項(xiàng)目(如ChatGPT、Gemini、Claude類(lèi)RL訓(xùn)練方法論實(shí)踐)
6. 對(duì)強(qiáng)化學(xué)習(xí)理論體系有深入理解,并能熟練應(yīng)用于大模型訓(xùn)練和優(yōu)化
7. 扎實(shí)的數(shù)學(xué)基礎(chǔ)(統(tǒng)計(jì)學(xué)、優(yōu)化理論、信息論等),能獨(dú)立解讀頂會(huì)論文(NeurIPS/ICLR/ICML)并高效實(shí)現(xiàn)
加分項(xiàng)
1. 有經(jīng)濟(jì)、科技、工業(yè)等專(zhuān)業(yè)領(lǐng)域研究報(bào)告撰寫(xiě)或分析經(jīng)驗(yàn)
2. 熟悉ReAct、Tree-of-Thought等思維鏈增強(qiáng)技術(shù)的算法實(shí)現(xiàn)
3. 在文檔結(jié)構(gòu)化生成、專(zhuān)業(yè)知識(shí)對(duì)齊或邏輯推理能力優(yōu)化方面有研究成果
4. 對(duì)專(zhuān)業(yè)研報(bào)質(zhì)量評(píng)估體系有研究,能構(gòu)建有效的評(píng)估指標(biāo)和獎(jiǎng)勵(lì)函數(shù)
5. 熟悉大型語(yǔ)言模型在專(zhuān)業(yè)內(nèi)容生成中的常見(jiàn)挑戰(zhàn)和解決方案
6. 發(fā)表過(guò)相關(guān)領(lǐng)域高質(zhì)量研究論文
7. 開(kāi)源項(xiàng)目貢獻(xiàn)經(jīng)驗(yàn)
8. 良好的跨團(tuán)隊(duì)協(xié)作能力和技術(shù)溝通能力

工作地點(diǎn)

北京朝陽(yáng)區(qū)榮聯(lián)科技大廈6

職位發(fā)布者

劉女士/HR

剛剛活躍
立即溝通
公司Logo萬(wàn)聯(lián)易達(dá)物流科技有限公司
萬(wàn)聯(lián)易達(dá)集團(tuán)深入融入社會(huì)產(chǎn)業(yè)鏈各業(yè)務(wù)場(chǎng)景,基于AI和通用技術(shù),構(gòu)建以人工智能研究應(yīng)用平臺(tái)、大宗商品交易平臺(tái)、整車(chē)物流服務(wù)平臺(tái)、數(shù)智金融平臺(tái)為核心的智能化產(chǎn)業(yè)生態(tài)系統(tǒng),為各類(lèi)產(chǎn)業(yè)生態(tài)伙伴提供智能、高效、安全的數(shù)智化解決方案,讓產(chǎn)業(yè)生態(tài)更智能,推動(dòng)社會(huì)產(chǎn)業(yè)運(yùn)行效率提升。人工智能研究應(yīng)用平臺(tái)萬(wàn)聯(lián)易達(dá)人工智能研究應(yīng)用平臺(tái)連接各業(yè)務(wù)平臺(tái)和產(chǎn)業(yè)生態(tài)合作伙伴,通過(guò)具體的業(yè)務(wù)場(chǎng)景驅(qū)動(dòng),研究開(kāi)發(fā)上千個(gè)人工智能垂類(lèi)大模型智能體,賦能各業(yè)務(wù)場(chǎng)景,支撐產(chǎn)業(yè)生態(tài)智能、高效、安全運(yùn)行。商品交易平臺(tái)聚合黑色金屬、有色金屬、能源化工品和農(nóng)副產(chǎn)品的上游、中游及部分下游產(chǎn)品的展銷(xiāo)和招采,以人工智能技術(shù)輔助買(mǎi)賣(mài)雙方形成最優(yōu)購(gòu)銷(xiāo)方案,大幅降低交易成本。整車(chē)物流服務(wù)平臺(tái)5A級(jí)網(wǎng)絡(luò)貨運(yùn)平臺(tái)。以“智慧場(chǎng)站”為紐帶,利用人工智能和大數(shù)據(jù)技術(shù),形成端到端全鏈路、線(xiàn)上線(xiàn)下共融合的數(shù)智化整車(chē)貨運(yùn)解決方案,同時(shí)提供整車(chē)貨運(yùn)交易撮合服務(wù)和承運(yùn)交付服務(wù)?!爸腔蹐?chǎng)站”基于AIoT、大數(shù)據(jù)等先進(jìn)技術(shù)和各類(lèi)資源,串聯(lián)包括訂單管理、場(chǎng)區(qū)內(nèi)裝卸貨、在途運(yùn)輸在內(nèi)的物流管理智能化平臺(tái),有效實(shí)現(xiàn)人、車(chē)、貨、場(chǎng)之間的智聯(lián)互通,為監(jiān)管部門(mén)、企業(yè)構(gòu)建智能化管理和調(diào)度體系攻克服務(wù)最后障礙,打通最后一環(huán)。數(shù)智金融平臺(tái)連通大宗商品交易和整車(chē)物流服務(wù)業(yè)務(wù)場(chǎng)景,提供信貸融資、保險(xiǎn)、車(chē)輛融資租賃、期貨風(fēng)險(xiǎn)管理和投資服務(wù),利用人工智能技術(shù)極大提高業(yè)務(wù)效率和識(shí)別風(fēng)控能力。
公司主頁(yè)