一、工作核心內(nèi)容:
1、承擔(dān)大模型最新技術(shù)調(diào)研、模型二次訓(xùn)練、推理效果調(diào)優(yōu)、輔助工具開(kāi)發(fā)等工作。
2、承擔(dān)大模型相關(guān)產(chǎn)品架構(gòu)和技術(shù)設(shè)計(jì)工作。
3、與產(chǎn)品、設(shè)計(jì)和項(xiàng)目管理等團(tuán)隊(duì)緊密合作,確保大模型技術(shù)能夠在現(xiàn)有場(chǎng)景落地,并達(dá)到預(yù)期效果。
4、項(xiàng)目技術(shù)相關(guān)事項(xiàng)推進(jìn)和管控。
二、工作主要職責(zé):
1、負(fù)責(zé)大模型二次訓(xùn)練、推理效果調(diào)優(yōu)開(kāi)發(fā)等工作
2、負(fù)責(zé)大模型應(yīng)用場(chǎng)景打造,應(yīng)用系統(tǒng)開(kāi)發(fā)
3、負(fù)責(zé)設(shè)計(jì)和規(guī)劃系統(tǒng)平臺(tái)架構(gòu)
4、主導(dǎo)技術(shù)方案和系統(tǒng)設(shè)計(jì),把握復(fù)雜系統(tǒng)的設(shè)計(jì),有能力解決性能、網(wǎng)絡(luò)、分布式等引起的一系列技術(shù)問(wèn)題
5、項(xiàng)目技術(shù)相關(guān)事項(xiàng)推進(jìn)和管控
二、技能要求:
1、扎實(shí)的Java編程基礎(chǔ),熟悉Java EE相關(guān)技術(shù),5年以上的各種開(kāi)源的框架如Spring Boot/Cloud、微服務(wù)/分布式系統(tǒng)開(kāi)發(fā)經(jīng)驗(yàn)。
2、具有大模型使用和調(diào)優(yōu)經(jīng)驗(yàn)者優(yōu)先,大模型包含但不限于chatGPT/GPT-3,LLama、chatGLM、通義千問(wèn),問(wèn)道,文心一言,星火等,具有開(kāi)源大模型如alpaca-lora/vicuna搭建或者使用者更佳。
4、具有自然語(yǔ)言處理、機(jī)器學(xué)習(xí)或深度學(xué)習(xí)相關(guān)工作經(jīng)驗(yàn)者更佳。
5、使用過(guò)至少一種公有云平臺(tái)如阿里云,AWS,華為云等。
6、熟悉Cloud Native核心要素、熟悉/了解容器編排技術(shù)如Docker、Docker Swarm、Kubernetes。