券商观点|AI算力跟踪深度(三):从英伟达的视角看算力互连板块成长性-Scale Up网络的“Scaling Law”存在吗?
2025年8月20日,东吴证券发布了一篇AI算力行业的研究报告,报告指出,从英伟达的视角看算力互连板块成长性-Scale Up网络的“Scaling Law”存在吗?。
报告具体内容如下:
我们认为ScaleUp网络存在ScalingLaw,ScaleUp柜间第二层网络会逐渐出现,光+AEC连接多出与芯片1:9的配比需求,交换机多出与芯片4:1的配比需求,相较ScaleOut网络均倍增: 1.英伟达持续扩大ScaleUp规模:英伟达正通过两大路径持续扩大ScaleUp网络规模。2)提升单卡带宽:NVLink持续迭代,NVLink5.0单卡带宽达7200Gb/s;2)扩大超节点规模:ScaleUp超节点规模不断扩大,从H100NVL8到GH200再到GB200等,NVL72等机柜方案可以提高训推效率,但并不是ScaleUp的上限,NVL72等机柜后续会作为最小的节点(Node)存在,像积木一样在柜与柜之间进一步拼出更大的ScaleUp超节点,届时需要光连接等进行通信。
2.为什么需要ScaleUp网络:“内存墙”问题和AI计算范式演进推动ScaleUp网络升级。
“内存墙”:
单一大模型的参数量与单卡显存的差距(即模型内存墙)、单卡算力与单卡显存间的差距(即算力内存墙)均逐代放大,通过ScaleUp将显存池化。计算范式:为了提升计算效率,在进行数据并行、流水线并行的同时也采用张量并行与专家并行,后者对通信频次、容量的要求都跨越数量级。
3.为什么需要更大的ScaleUp网络:TCO、用户体验、模型能力拓展。随着单用户每秒消耗的Token数(TokensPerSecond,TPS)提高,包括NVL72在内的现有服务器单卡性能都会逐渐坍缩,在用户体验持续提升、模型能力拓展的趋势下,单用户TPS必然增长,采用更大规模的ScaleOut能提高单卡有效性能,TCO也更具经济性。我们认为ScaleUp规模与预期单用户TPS、单卡实际性能间存在ScalingLaw,前者会随后者非线性增长。
4.怎么组建更大的ScaleUp网络:网络结构层面,在柜间搭建第二层ScaleUp交换机;端口连接层面,光与AEC有望在第二层网络中并存,按照最新的NVLink与IB标准测算,1颗GPU需要9个额外的等效1.6T连接,为ScaleOut网络的3-4.5倍,每4颗GPU需要额外1台交换机,为ScaleOut网络的7.5-12倍。
投资建议:我们认为ScaleUp需求有望持续拓展,带来倍增的网络连接需求,光连接、AEC、交换机等环节都有望深度受益,相关标的——光互连:中际旭创(300308),新易盛(300502),天孚通信(300394),光库科技(300620),长芯博创(300548),仕佳光子,源杰科技,长光华芯,太辰光(300570);铜互连:中际旭创,兆龙互连(300913);交换机:锐捷网络(301165),盛科通信,AsteraLabs(美股,后同),博通,天弘科技,Arista风险提示:算力互连需求不及预期;客户处份额不及预期;产品研发落地不及预期;行业竞争加剧。
声明:本文引用第三方机构发布报告信息源,并不保证数据的实时性、准确性和完整性,数据仅供参考,据此交易,风险自担。
0人