智譜(02513)發表ZCube網絡架構 優化AI大模型推理效能

智譜(02513)近日宣佈,與馭馴網絡及清華大學聯手,成功開發並在開源模型GLM-5.1線上生產中推出新一代網絡架構ZCube。該創新架構旨在解決目前大規模預填充(Prefill)及解碼(Decode)分離(簡稱PD分離)部署中日益嚴峻的結構性網絡擁塞問題。 智譜表示,此ZCube架構在應用於千卡級GLM-5.1線上推理集羣後,取得了顯著的效能提升與成本優化。在GPU型號、軟件棧及業務代碼全部保持不變的前提下,ZCube可使GPU平均推理吞吐量提升15%。同時,時延表現亦獲大幅改善,首次令牌生成時間(TTFT)的P99指標降低達40.6%。在資本支出方面,交換機與光模組的成本亦可減少33%。 公司進一步強調,ZCube架構在相同規模下,相較於傳統的Clos/ROFT架構,可將交換機和光模組的投資成本降低約三分之一。以一個萬卡智算集羣為例,應用ZCube架構預計可為網絡硬件投資節省約2.1億至6.4億元人民幣。市場普遍認為,這意味著透過更低的網絡成本,便能獲得更佳的負載均衡與性能表現,對於現今AI大模型對高效能運算及資源優化的需求而言,具備重要意義,有助於推動人工智能基礎設施的進一步發展,降低大規模AI應用的部署門檻。
TimeNews
05-21 13:38恆指高開後回吐升幅 科技股板塊受壓 滙豐渣打穩步上揚
05-21 13:38輝達料讓中國AI晶片市場予華為 瑞銀樂觀看港股破3萬點 習近平傳下週訪朝
05-21 13:36友邦香港推「退休收益基金」強積金 主打每月派息 料年化派息率4釐
05-21 13:36恆生中國企業(02828)錄逾2,000萬元大手成交
05-21 13:36華潤置地(01109)錄大手成交 涉資逾2751萬元
05-21 13:36申洲國際(02313)錄大手成交 涉資逾2000萬港元
05-21 13:36阿里巴巴-W(09988)盤中錄八宗大手成交 涉資逾2.85億港元
05-21 13:36騰訊控股 (00700) 午後錄得逾2,300萬元大手成交
05-21 13:36盈富基金(02800)午市錄12宗大手成交 涉資逾4億元
05-21 13:35傳美伊本月底有望重啟談判 以色列總理內塔尼亞胡仍存疑慮
05-21 13:35超市大戰︱傳怡和洽購百佳 長和:不評論傳聞 目前無相關計劃
05-21 13:35沙田玖瓏山高層三房單位轉手 業主持貨六年賬面蝕140萬元
05-21 13:11外資金融巨擘擴張亞洲版圖 城堡證券香港大舉增聘 摩根大通續擴大中港日團隊
05-21 13:09泡泡瑪特「星星人」聯乘麥當勞掀搶購熱潮 「答案機」預售價飆四倍成焦點
05-21 13:08瑞銀李鎮國:看好港股下半年表現 料年內突破三萬點關口
05-21 13:08日本央行小枝淳子倡適度加息 防範通脹超標與資源扭曲
05-21 13:08萬國數據首季業績後股價顯著受壓 分析師關注數據中心盈利前景
05-21 13:07港元定存戰況升温 新舊資金及新客户優惠百花齊放
05-21 13:07友邦調查揭港人退休儲備嚴重不足 平均缺口逾256萬 新基金迎持續投資趨勢
05-21 13:07八達通連環推出多項消費優惠 涵蓋餐飲交通及信用卡自動增值