國企直簽合同。
1、具備扎實的編程技能,并且對解決復雜問題充滿熱情。專注于大規(guī)模語言模型(LLM)或其他大模型(如多模態(tài)模型)的訓練、優(yōu)化與應用開發(fā)。該職位將負責構建、訓練、調(diào)優(yōu)和部署先進的大模型,以推動單位在相關領域的技術創(chuàng)新和業(yè)務落地。
2、主要職責:
(1)大模型訓練與調(diào)優(yōu):設計、實施并優(yōu)化大模型的訓練流程,包括數(shù)據(jù)準備、模型架構選擇、超參數(shù)調(diào)整、分布式訓練策略制定與執(zhí)行。
(2)模型開發(fā)與實現(xiàn):參與或主導大模型(如Transformer架構模型)的研發(fā)、復現(xiàn)、改進和適配工作。
(3)性能優(yōu)化:解決大模型訓練中的性能瓶頸(計算、通信、內(nèi)存),進行顯存優(yōu)化、計算效率提升和通信優(yōu)化。
(4)技術棧應用:熟練運用主流的大模型訓練框架和工具(如PyTorch, TensorFlow, DeepSpeed, Megatron-LM, FSDP, Hugging Face Transformers等)。
(5)數(shù)據(jù)處理:設計和管理用于大模型訓練的海量、高質(zhì)量數(shù)據(jù)集,包括數(shù)據(jù)清洗、預處理、增強和安全管理。
(6)模型部署與應用探索:探索訓練后模型的部署方案(如推理優(yōu)化)及其在具體業(yè)務場景(如智能問答、內(nèi)容生成、代碼輔助、知識管理、AIGC等)中的應用潛力。
(7)技術跟蹤與分享**:跟蹤大模型領域的前沿技術動態(tài),并在團隊內(nèi)進行技術分享。
3、要求:計算機科學或相關領域的本科及以上學歷。
精通Python編程語言,具有3年以上實際項目開發(fā)經(jīng)驗。
熟悉常用的Python包和框架,如Pandas, NumPy, Flask/Django等。
具備良好的SQL知識,能夠編寫復雜的查詢語句。
理解數(shù)據(jù)結(jié)構、算法知識及面向?qū)ο笤O計原則。
熟悉Linux環(huán)境,熟悉lnux常見命令。有使用版本控制工具(如Git)的經(jīng)驗。優(yōu)秀的溝通能力和團隊協(xié)作精神。
4、加分項:
(1)在自然語言處理(NLP)、語音識別處理方面有項目經(jīng)驗。
(2)參與過大模型(如Transformer架構)的開發(fā)或應用。
(3)對開源社區(qū)有所貢獻,擁有個人GitHub項目者優(yōu)先考慮。