ICC訊 7月28日消息,日前,2025世界人工智能大會(WAIC)在上海開幕,華為首次展出被稱為“算力核彈”的昇騰384超節點真機,即Atlas 900 A3 SuperPoD。
華為表示,昇騰384超節點被評選為本次WAIC 2025鎮館之寶。昇騰384超節點通過高速互聯總線,突破互聯瓶頸,讓超節點像一臺計算機一樣工作。
相比傳統集群,主要有以下3大優勢:
超大帶寬
超節點內任意兩個AI處理器之間通信帶寬,相較于傳統架構提升15倍,超節點內單跳時延降低10倍。
超低時延
昇騰超節點支持全局內存統一編址,具備更高效的內存語義通信能力。通過更低時延指令級內存語義通信,可滿足大模型訓練/推理中的小包通信需求,提升專家網絡小包數據傳輸及離散隨機訪存通信效率。
昇騰384超節點是業界唯一突破Decode時延15ms的方案,滿足實時深度思考下的用戶體驗需求。
超強性能
經過實際測試,在昇騰超節點集群上,LLaMA3等千億稠密模型訓練性能可達傳統集群的2.5倍以上。
在通信占比更高的Qwen、DeepSeek等多模態、MoE模型上,可以達到3倍以上的提升。
據了解,昇騰384超節點首創將384顆昇騰NPU和192顆鯤鵬CPU通過全新高速網絡MatrixLink全對等互聯,形成一臺超級“AI服務器”,其算力總規模達300Pflops,是英偉達NVL72的1.7倍。
網絡互聯總帶寬達269TB/s,比英偉達NVL72提升107%;內存總帶寬達1229TB/s,比英偉達NVL72提升113%;單卡推理吞吐量躍升到2300 Tokens/s。