2025年11月24日,中邮证券发布了一篇计算机行业的研究报告,报告指出,ai,国产算力再次突破。
报告具体内容如下:
华为发布AI容器技术Flex:ai,国产算力再次突破 直面算力利用效率低下难题,华为发布AI容器技术Flex:ai 11月21日下午,华为在上海举办“2025AI容器应用落地与发展论坛”,会上正式发布并开源了创新AI容器技术Flex:ai。目前,行业内算力资源的平均利用率仅为30%至40%,据华为介绍,华为Flex:ai是基于Kubernetes容器编排平台构建的XPU池化与调度软件,通过算力切分技术,将单张GPU/NPU算力卡切分为多份虚拟算力单元,切分粒度精准至10%。此技术实现了单卡同时承载多个AI工作负载,在无法充分利用整卡算力的AI工作负载场景下,算力资源平均利用率可提升30%。 AI时代需要AI容器技术,华为Flex.ai对标英伟达(NVDA)Run:ai具有独特优势
传统容器技术难以适配AI工作负载需求,AI容器作为轻量级虚拟化技术,可打包模型代码与运行环境实现跨平台迁移,解决环境配置不一致问题,且能按需挂载GPU/NPU算力、优化集群资源利用率。Gartner表示,目前AI负载大多都已容器化部署和运行,据预测,到2027年,75%以上的AI工作负载将采用容器技术进行部署和运行。
与英伟达(NVDA)今年年初收购的Run:ai公司的核心产品相比,华为Flex:ai在虚拟化、智能调度等方面具备独特优势。具体来看,在本地虚拟化技术中,Flex:ai支持把单个物理GPU/NPU算力卡切割为数个虚拟算力单元,并通过弹性灵活的资源隔离技术,可实现算力单元的按需切分。智能调度方面,Flex:ai智能资源和任务调度技术,可自动感知集群负载与资源状态,结合AI工作负载的优先级、算力需求等多维参数,对本地及远端的虚拟化GPU、NPU资源进行全局最优调度,满足不同AI工作负载对资源的需求。
以软件补硬件提升AI训推效率,国产AI生态发展再进阶
Flex:ai秉承开源与兼容异构算力的理念,进一步强化国产算力实力。Flex:ai将在发布后开源在魔擎社区中,与华为此前开源的Nexent智能体框架、AppEngine应用编排、DataMate数据工程、UCM推理记忆数据管理器等AI工具共同组成了完整的ModelEngine开源生态。另外,与英伟达(NVDA)旗下Run:ai只能绑定英伟达(NVDA)算力卡不同,Flex:ai通过软件创新,可实现对英伟达(NVDA)、昇腾及其他第三方算力资源的统一管理和高效利用,有效屏蔽不同算力硬件之间的差异,为AI训练推理提供更高效的资源支持。
建议关注
我们认为,华为推出的Flex:ai核心围绕“XPU池化+算力细粒度切分+全局智能调度”三大支柱,通过对GPU/NPU等异构智算资源的容器化管控、跨节点聚合与弹性分配,致力于大幅提升AI集群的算力利用效率、降低生态迁移门槛、加速模型训练与推理的落地进程;其秉持“开源兼容+跨生态适配”的核心定位,进一步强化了国产算力软件层的统一调度能力,构成了“以软件能力补齐硬件短板”的确定性突破。建议关注:
1)AI容器:博睿数据(688229)、浩瀚深度(688292)、普元信息(688118)、青云科技(688316)、实达集团(600734)、首都在线(300846)、中亦科技(301208)、南威软件(603636)、浪潮数字企业(HK0596);
2)国产算力:寒武纪(688256)、云天励飞(688343)、亿都(国际控股)、浪潮信息(000977)、曙光数创、超讯通信(603322)、瑞晟智能(688215)、华丰科技(688629)、神州数码(000034)、软通动力(301236)、烽火通信(600498)、广电运通(002152)、拓维信息(002261)、四川长虹(600839)、润建股份(002929)、数据港(603881)、润泽科技(300442)、光环新网(300383)、科华数据(002335)、奥飞数据(300738)、优刻得(688158)、立讯精密(002475)、安博通(688168)等。
风险提示:
技术发展不及预期、政策落地不及预期、行业竞争加剧等。
声明:本文引用第三方机构发布报告信息源,并不保证数据的实时性、准确性和完整性,数据仅供参考,据此交易,风险自担。
