国产中文无码av每日更新在线观看, 亚洲天堂中文字幕一区二区三区免费, 国产口爆吞精在线观视频-黄色国产, 92福利-国内精品久久久久久99,亚洲成AV人A片不卡无码,浪潮AV无码专区,老熟女败火白浆,中文字幕日产av,色情日本免费看大片

更新于 8月13日

算力運(yùn)營(yíng)

5000-9000元
  • 濟(jì)南歷城區(qū)
  • 1-3年
  • 大專(zhuān)
  • 全職
  • 招1人

職位描述

計(jì)算機(jī)軟件互聯(lián)網(wǎng)云計(jì)算/大數(shù)據(jù)
一、崗位職責(zé)
1. 資源管理
- 負(fù)責(zé)算力資源的規(guī)劃、分配與調(diào)度,根據(jù)業(yè)務(wù)需求,合理分配CPU、GPU、內(nèi)存等計(jì)算資源,保障各類(lèi)AI應(yīng)用、數(shù)據(jù)處理等任務(wù)高效運(yùn)行,提高資源利用率。
- 監(jiān)控算力資源的使用情況,實(shí)時(shí)掌握資源的負(fù)載、性能指標(biāo),對(duì)資源使用進(jìn)行統(tǒng)計(jì)分析,及時(shí)發(fā)現(xiàn)并解決資源瓶頸問(wèn)題,制定資源擴(kuò)容或優(yōu)化方案。
2. 運(yùn)營(yíng)監(jiān)控與維護(hù)
- 搭建和維護(hù)算力運(yùn)營(yíng)監(jiān)控體系,利用專(zhuān)業(yè)工具實(shí)時(shí)監(jiān)測(cè)算力系統(tǒng)的硬件、軟件運(yùn)行狀態(tài),及時(shí)發(fā)現(xiàn)并預(yù)警設(shè)備故障、性能異常等問(wèn)題。
- 針對(duì)算力系統(tǒng)出現(xiàn)的故障,迅速組織技術(shù)力量進(jìn)行排查與修復(fù),保障算力服務(wù)的穩(wěn)定性和連續(xù)性,記錄故障處理過(guò)程和結(jié)果,形成知識(shí)庫(kù),為后續(xù)運(yùn)維提供參考。
3. 業(yè)務(wù)對(duì)接與優(yōu)化
- 與內(nèi)部研發(fā)團(tuán)隊(duì)、業(yè)務(wù)部門(mén)保持密切溝通,了解其算力需求,提供專(zhuān)業(yè)的算力解決方案和技術(shù)支持,協(xié)助業(yè)務(wù)部門(mén)優(yōu)化算法、模型以更好適配算力資源。
- 根據(jù)業(yè)務(wù)發(fā)展趨勢(shì),預(yù)測(cè)算力需求變化,提前制定算力資源的升級(jí)、擴(kuò)展計(jì)劃,確保算力服務(wù)能夠持續(xù)滿足業(yè)務(wù)增長(zhǎng)的需要。
4. 成本控制
- 負(fù)責(zé)算力運(yùn)營(yíng)成本的核算與控制,分析算力資源使用成本,制定成本優(yōu)化策略,通過(guò)資源整合、效率提升等手段,降低單位算力成本。
- 對(duì)算力采購(gòu)、運(yùn)維等費(fèi)用進(jìn)行預(yù)算管理,監(jiān)控費(fèi)用支出,確保在預(yù)算范圍內(nèi)完成各項(xiàng)運(yùn)營(yíng)工作,提高算力運(yùn)營(yíng)的經(jīng)濟(jì)效益。
5. 數(shù)據(jù)管理與安全
- 負(fù)責(zé)算力平臺(tái)產(chǎn)生的數(shù)據(jù)管理工作,包括數(shù)據(jù)的存儲(chǔ)、備份、恢復(fù)策略制定與實(shí)施,保障數(shù)據(jù)的完整性和可用性。
- 建立健全算力系統(tǒng)的安全防護(hù)體系,防范網(wǎng)絡(luò)攻擊、數(shù)據(jù)泄露等安全風(fēng)險(xiǎn),確保算力資源和數(shù)據(jù)的安全。
二、任職要求
1. 學(xué)歷與專(zhuān)業(yè)
- 本科及以上學(xué)歷,計(jì)算機(jī)科學(xué)與技術(shù)、軟件工程、電子信息工程、通信工程等相關(guān)專(zhuān)業(yè)。
2. 工作經(jīng)驗(yàn)
- 要求3 - 5年及以上IT運(yùn)營(yíng)、數(shù)據(jù)中心運(yùn)維、云計(jì)算或AI算力相關(guān)工作經(jīng)驗(yàn)。
3. 專(zhuān)業(yè)技能
- 技術(shù)基礎(chǔ):熟悉Linux系統(tǒng),熟練掌握Shell、Python等腳本語(yǔ)言。
- 算力知識(shí):熟悉算力基礎(chǔ)設(shè)施架構(gòu),包括通用計(jì)算、智能計(jì)算等;了解云計(jì)算技術(shù),如Kubernetes、OpenStack等;熟悉人工智能平臺(tái),如TensorFlow、PyTorch。
- 網(wǎng)絡(luò)知識(shí):精通TCP/IP等網(wǎng)絡(luò)協(xié)議,熟悉高性能網(wǎng)絡(luò)協(xié)議如IB、RoCE。
- 存儲(chǔ)知識(shí):熟悉分布式文件系統(tǒng),如CephFS、Lustre、NFS。
- 工具運(yùn)用:熟練使用數(shù)據(jù)監(jiān)測(cè)與分析工具,如Prometheus、Grafana等;熟悉服務(wù)器硬件架構(gòu)。
4. 素質(zhì)能力
- 具備較強(qiáng)的溝通協(xié)調(diào)能力和跨部門(mén)工作協(xié)作能力,能夠與不同團(tuán)隊(duì)進(jìn)行有效的溝通和合作。
- 責(zé)任心強(qiáng),具備良好的服務(wù)意識(shí)和7*24小時(shí)故障響應(yīng)能力。
- 具有較強(qiáng)的學(xué)習(xí)能力、問(wèn)題解決能力和抗壓能力,能夠快速掌握新知識(shí)和技能,解決工作中遇到的各種問(wèn)題。

工作地點(diǎn)

濟(jì)南歷城區(qū)泰山廣場(chǎng)-5棟

職位發(fā)布者

閆先生/人事

立即溝通