上证报中国证券网讯(记者孙小程)近日,智谱(HK2513)联合驭驯网络与清华大学,在GLM-5.1线上生产集群中完成了新一代网络架构ZCube的规模化落地。在线上GLM-5.1coding场景中,在保持GPU算力、软件栈与应用不变的前提下,ZCube节省了33%交换机与光模块成本,同时,将GPU平均推理吞吐提升了15%,并将TTFT P99降低了40.6%。
据介绍,ZCube技术被ACM SIGCOMM2025评价为“显著改变整个行业对网络的认知方式”。此次在智谱(HK2513)的落地实践是ZCube架构首次在真实大规模推理集群中完成生产验证。
