核心目標(biāo): 研發(fā)前沿算法,為醫(yī)療文本(尤其病歷)的深度理解與智能應(yīng)用提供核心模型能力。 崗位職責(zé): 1、核心算法研發(fā)與優(yōu)化:負(fù)責(zé)電子病歷相關(guān)的NLP算法研發(fā),包括醫(yī)學(xué)實(shí)體識別、關(guān)系抽取、文本分類(質(zhì)控規(guī)則判定)、語義相似度計(jì)算等,持續(xù)提升模型在醫(yī)療專業(yè)場景下的準(zhǔn)確率與魯棒性。 2、大模型與知識增強(qiáng)技術(shù): l對通用大語言模型進(jìn)行領(lǐng)域適配(Domain Adaptation)與高效微調(diào)(如LoRA, QLoRA),使其掌握醫(yī)療專業(yè)知識與病歷書寫規(guī)范。 l 深入研究與優(yōu)化檢索增強(qiáng)生成技術(shù),負(fù)責(zé)RAG系統(tǒng)中核心算法組件的研發(fā),包括但不限于:嵌入模型訓(xùn)練與優(yōu)化,以提升醫(yī)學(xué)概念的表征能力;檢索排序算法優(yōu)化,以提升病歷段落檢索的精準(zhǔn)度;探索重排序、HyDE等技術(shù)在提升答案質(zhì)量上的應(yīng)用。 3、知識體系建設(shè):結(jié)合規(guī)則與深度學(xué)習(xí)算法,從海量病歷與非結(jié)構(gòu)化文獻(xiàn)中抽取知識,構(gòu)建與迭代醫(yī)療知識圖譜,并研究基于圖譜的推理與問答技術(shù)。 4、全鏈路效果提升:從數(shù)據(jù)構(gòu)造、模型訓(xùn)練、評估到上線,對算法效果全流程負(fù)責(zé)。設(shè)計(jì)科學(xué)的實(shí)驗(yàn),分析模型誤差,提出并實(shí)施有效的改進(jìn)方案。 5、技術(shù)前瞻與賦能:跟蹤NLP與醫(yī)療AI前沿技術(shù),進(jìn)行原型驗(yàn)證,撰寫技術(shù)專利與論文,并為團(tuán)隊(duì)進(jìn)行技術(shù)分享。 任職要求: 1、學(xué)歷專業(yè):計(jì)算機(jī)科學(xué)、人工智能、生物醫(yī)學(xué)信息學(xué)等相關(guān)專業(yè),碩士及以上學(xué)歷優(yōu)先。 2、技術(shù)基礎(chǔ): l 扎實(shí)的機(jī)器學(xué)習(xí)/深度學(xué)習(xí)基礎(chǔ),精通NLP核心任務(wù)及Transformer系列模型原理。 l 熟練掌握Python及PyTorch/TensorFlow框架,有使用Hugging Face生態(tài)進(jìn)行模型訓(xùn)練與微調(diào)的豐富經(jīng)驗(yàn)。 l 深入理解RAG技術(shù)架構(gòu)及其核心算法組件(檢索器、嵌入模型、重排器),有實(shí)際項(xiàng)目優(yōu)化經(jīng)驗(yàn)者優(yōu)先。 l 熟悉常用的數(shù)據(jù)挖掘和機(jī)器學(xué)習(xí)庫。 3、經(jīng)驗(yàn)與能力: l 具備醫(yī)療NLP項(xiàng)目經(jīng)驗(yàn)者優(yōu)先,熟悉電子病歷數(shù)據(jù)結(jié)構(gòu)、醫(yī)學(xué)術(shù)語體系及臨床邏輯。 l 出色的邏輯思維和問題拆解能力,能從復(fù)雜的業(yè)務(wù)問題中抽象出核心算法挑戰(zhàn)。 l 良好的團(tuán)隊(duì)協(xié)作和溝通能力,能清晰闡述算法方案與價值。 4、重大加分項(xiàng): l 在知識圖譜構(gòu)建、信息檢索、大模型微調(diào)等任一方向有深入研究或項(xiàng)目成果。 l熟悉多模態(tài)模型或強(qiáng)化學(xué)習(xí)在NLP中的應(yīng)用。