崗位職責(zé):
1. 基礎(chǔ)數(shù)據(jù)與測(cè)試集構(gòu)建
數(shù)據(jù)采集與標(biāo)注:負(fù)責(zé)測(cè)試集數(shù)據(jù)的采集、清洗、校對(duì)和分類(lèi)整理,為AI模型(如OCR、NLP模型)優(yōu)化提供數(shù)據(jù)支持。
2. 測(cè)試執(zhí)行與問(wèn)題記錄
功能與性能測(cè)試:依據(jù)測(cè)試計(jì)劃,對(duì)搭建的智能體、AI應(yīng)用、機(jī)器人執(zhí)行功能測(cè)試(交互響應(yīng)、任務(wù)準(zhǔn)確性)、性能測(cè)試(響應(yīng)時(shí)間、吞吐量)及穩(wěn)定性測(cè)試。
3. 效果評(píng)價(jià):評(píng)測(cè)AI產(chǎn)品的質(zhì)量(如機(jī)器人穩(wěn)定性、任務(wù)成功率、識(shí)別準(zhǔn)確率等任務(wù)),做好質(zhì)量評(píng)測(cè)。
任職要求:
1.教育背景:本科或碩士在讀,計(jì)算機(jī)科學(xué)、人工智能、軟件工程、數(shù)學(xué)、電子信息等相關(guān)專(zhuān)業(yè)優(yōu)先。
2.編程能力:
熟悉至少一種編程語(yǔ)言(Python為主,或Java/JavaScript),能夠閱讀和理解代碼邏輯。
3.有基礎(chǔ)的腳本編寫(xiě)能力,能夠處理數(shù)據(jù)或搭建簡(jiǎn)單測(cè)試腳本。
4.AI基礎(chǔ)知識(shí):
對(duì)機(jī)器人、人工智能、機(jī)器學(xué)習(xí)、深度學(xué)習(xí)有濃厚興趣,了解大模型、NLP/CV等基本概念。
5.了解主流大模型評(píng)測(cè)基準(zhǔn)(如MMLU、MT-Bench、TruthfulQA等)者優(yōu)先。
6.工具使用:了解Postman/JMeter等接口測(cè)試工具,或Selenium/Pytest等自動(dòng)化測(cè)試框架者優(yōu)先。