科技飞速发展的当下,算力已然成为了推动人工智能进步的核心驱动力。就在近日,第七届世界人工智能大会(WAIC 2025)在上海世博中心盛大开启,华为在此次盛会上扔下了一颗“重磅炸弹”——首次展出昇腾384超节点真机,这一亮相,瞬间成为全场焦点,更是获评“WAIC镇馆之宝”,在AI领域掀起了惊涛骇浪。
这台被称为“算力核弹”的昇腾384超节点,从外观上看,由12个计算柜和4个总线柜构成,体型庞大,科技感十足,仿佛一座来自未来的智能堡垒 。而它的“内涵”更是不容小觑。内部首创将384颗昇腾910C NPU与192颗鲲鹏920 CPU通过全新高速网络MatrixLink实现全对等互联,构建成了一台超级“AI服务器” ,让每一个芯片单元都能高效协作,打破了传统计算架构的限制。
与当前行业内的佼佼者英伟达NVL72相比,昇腾384超节点的性能优势十分明显。它的算力总规模高达300Pflops ,是英伟达NVL72的1.7倍,这意味着在处理复杂的AI运算任务时,它能以更快的速度给出结果,大大缩短了运算时间。在网络互联方面,其总带宽达269TB/s ,比英伟达NVL72提升107%,数据传输速度更快,让信息交互更加流畅;内存总带宽达1229TB/s ,比英伟达NVL72提升113% ,在处理大规模数据和复杂模型时,能够更加得心应手,不会出现卡顿现象。就连单卡推理吞吐量也跃升到2300Tokens/s,展现出了强大的推理计算能力。
除了硬件性能上的优势,昇腾384超节点在架构上也实现了重大创新。它打破了传统以CPU为中心的冯诺依曼架构,也就是“主从架构”,创新性地提出了“全对等架构”。借助高速互联总线的关键突破,把总线从服务器内部扩展到整机柜,甚至跨机柜,将CPU、NPU、DPU、存储和内存等资源全部互联和池化,实现了真正的点对点互联 。这种创新架构去除了繁多的中转环节,让各个硬件资源之间的协作更加紧密、高效,大大提升了算力密度和互联带宽,让整个系统的运行效率得到了质的飞跃。
