導語: 在一向由國際巨頭主導的高性能計算賽場,一份最新權威測試報告顯示,一款采用開放生態的中國AI算力設備,在綜合性能上實現了對國際標桿產品的顯著領先。這標志著AI算力的競爭,正從單一硬件競賽,邁向以系統架構為核心的綜合效能之爭。
【北京,2025年10月】 全球AI基準測試平臺MLPerf近日公布的v3.1推理性能榜單,出現了引人矚目的一幕:中國廠商東方超算推出的Deep X G20 Pro Max,在多項關鍵測試中,其綜合AI性能大幅領先于市場同類標桿產品,領先幅度達到82%。
這一結果在產業界與投資圈引發廣泛關注。它表明,在決定人工智能發展高度的算力基石領域,通過深度的系統級創新,同樣可以在全球頂尖陣營中實現效能突破,并為市場提供新的選擇。
性能實證:關鍵業務場景的效率重構
MLPerf測試被業界視為衡量AI硬件性能的“黃金標準”。Deep X G20的出色表現,具體體現在企業最關切的幾個核心場景中:
在大模型推理環節,運行LLaMA 11B模型時,Deep X G20達到了每秒處理338個token的吞吐量。更為關鍵的是,其生成第一個token的延遲時間控制在78毫秒以內,這為金融交易、智能客服等需要實時交互的場景提供了關鍵技術支持。
在圖像生成領域,生成一張Stable Diffusion XL標準圖片的時間被縮短至2秒,讓創意工作的迭代速度得以大幅提升。
在工業視覺等實時性要求極高的領域,其目標檢測的幀率表現也實現了顯著進步。
“在量化投資中,策略回測的速度就是生命。部署后,我們的回算時間從小時級縮短到分鐘級,這帶來的不僅是效率提升,更是決策質量的優化。”一位已部署該設備的私募基金技術負責人證實了其商用價值。
領先之道:系統級架構優化釋放硬件潛力
性能的顯著優勢從何而來?業內分析指出,這主要源于深度的系統級架構創新,而非單一的硬件堆砌。
Deep X G20所采用的神經態異構計算架構(NHCA),扮演著高度智能的“算力調度中樞”角色。它通過創新的動態任務分配算法,將CPU、GPU及NPU三者高效協同起來,解決了傳統架構中常見的算力閑置與內部沖突問題,據稱將整體計算資源利用率提升了40%。
此外,該設備通過“統一推理運行時”技術,屏蔽了底層不同AI框架(如PyTorch、TensorFlow)的差異,讓開發者無需為適配環境耗費精力,并能自動獲得更優的性能。這種軟硬件深度融合的思路,成為其實現效能飛躍的關鍵。
生態路徑:開放兼容策略破除應用門檻
與走向封閉或專用生態的技術路徑不同,Deep X G20選擇了基于開放的x86架構。這一戰略選擇帶來了極高的“易用性”。
對于絕大多數企業而言,它們現有的AI應用、軟件環境和開發工具都構建在x86生態之上。Deep X G20確保了這些應用可以“零修改”地平滑遷移,極大地降低了企業采用新技術的門檻和風險。企業無需進行漫長的代碼移植與調試,從而能將精力聚焦于業務創新本身。
行業資訊、企業動態、峰會活動可發送郵件至news#citmt.cn(把#換成@)。
海報生成中...