晨羽智云(杭州)科技有限公司為2025年新核準的國家高新科技企業(yè),以自主研發(fā)的分布式算力調度系統(tǒng)和多節(jié)點GPU集群為技術基礎,構建了強大且高效的AI算力平臺。為獨立開發(fā)者,初創(chuàng)團隊,中小企業(yè)提供了專業(yè)的算力支持。
1、公司運營著中國最大的“一站式AI應用商店”,打造了涵蓋內容生成、智能設計、自動化工作流等多領域的AI生態(tài)系統(tǒng)。通過無代碼、即開即用的便捷體驗,晨羽智云極大降低了AI應用的使用門檻,滿足了教育科研、數字文創(chuàng)、智能設計等前沿領域的多樣化需求。
2、晨羽智云積極參與和推動高校合作與產業(yè)共建,致力于讓人工智能核心能力在內容創(chuàng)作與智能生產中的廣泛落地,助力AI技術真正轉化為現實生產力。晨羽ai學院擁有1000+講師,累計培訓學員30萬+。
核心職責
1、高并發(fā)算力調度系統(tǒng)開發(fā):設計并實現高可用、高并發(fā)的分布式算力調度系統(tǒng)。利用Go的Goroutine和Channel機制,優(yōu)化任務隊列、負載均衡和資源分配算法,以應對客戶動態(tài)、突發(fā)性的AI推理算力需求。
2、算力服務API網關與中間件:負責AI算力服務API網關的設計、開發(fā)與性能優(yōu)化。保障API服務的穩(wěn)定、低延遲與高吞吐,支持未來向“客戶按需即時調用”的API租賃模式平滑過渡。
3、集群管理與自動化運維平臺:參與開發(fā)集群管理、監(jiān)控與自動化運維系統(tǒng)。通過Go實現高效的節(jié)點狀態(tài)同步、故障自愈、彈性擴縮容邏輯,提升上萬張算力卡集群的運維效率與資源利用率。
4、性能優(yōu)化與系統(tǒng)調優(yōu):深入系統(tǒng)底層,進行性能剖析與調優(yōu)。運用pprof等工具分析并優(yōu)化CPU調度、內存分配(GC)及同步機制,解決大規(guī)模并發(fā)下的性能瓶頸,確保算力服務的經濟性與競爭力。
5、技術方案設計與攻堅:參與核心模塊的技術選型、架構設計,撰寫高質量的設計與開發(fā)文檔。主導或協(xié)助解決在開發(fā)過程中遇到的關鍵技術難題。
任職要求
一、基礎能力:
1、計算機科學、軟件工程或相關專業(yè)本科及以上學歷,具備3年-5年Go語言后端服務開發(fā)經驗。
2、深刻理解Go語言的并發(fā)模型、內存管理、網絡編程及標準庫,有生產環(huán)境高性能、高并發(fā)服務開發(fā)經驗。
3、熟練掌握Linux開發(fā)環(huán)境,熟悉Docker容器化技術及Kubernetes生態(tài),具備云原生應用的開發(fā)和部署經驗。
4、良好的系統(tǒng)設計能力,熟悉分布式系統(tǒng)常用概念,了解RPC、消息隊列、緩存、數據庫等中間件原理與應用。
二、業(yè)務匹配技能(滿足以下至少一項):
1、云計算/算力平臺方向:有云計算IaaS/PaaS層、資源調度、虛擬化或高性能計算平臺相關開發(fā)經驗。對成本控制與資源利用率優(yōu)化有深刻理解。
2、AI工程化方向:對AI模型訓練與推理的工程化流程有了解,有使用Go進行相關工具鏈開發(fā)、模型服務(Model Serving)或對接TensorFlow/PyTorch等框架的經驗。熟悉GoMLX等Go生態(tài)機器學習框架者優(yōu)先。
3、大規(guī)模系統(tǒng)優(yōu)化方向:具備豐富的大型系統(tǒng)性能調優(yōu)經驗,精通Go運行時調度器(GPM模型)原理,能通過定制內存池、無鎖數據結構等手段解決實際性能問題。
加分項
1、有參與過開源項目或在技術社區(qū)有活躍貢獻。
2、對主流AI大模型技術棧(如Transformer架構)和推理優(yōu)化有基本了解。
3、有算力租賃、GPU集群管理或類似平臺的實際項目經驗。
4、熟悉網絡編程,對RDMA、InfiniBand等高速網絡技術有一定了解。