近日在京举办的鲲鹏昇腾开发者大会2026期间,一场聚焦鲲鹏昇腾生态的开发者圆桌对话上,来自金融、高性能计算及AI大模型等领域的开发者团队,以一线实践者的视角,探讨中国自主算力生态从“可用”迈向“好用易用”的进阶路径。
“硬件是基石,生态是灵魂。”主持这场圆桌对话的中科院计算所副研究员石侃如此概括。在模型能力跃升不再单纯依赖堆叠算力、更多依靠算法与工程协同优化的今天,底层算力基础设施的开放程度与生态成熟度,正成为决定AI创新能否无缝落地的关键变量。
从“荒漠”到“绿洲”
华为计算生态开启“倍速”
“早期可以说是‘荒漠’,适配需要排期数月。”AIGCode联合创始人、CTO陈秋武回忆起最初接触昇腾生态时的场景,语气中带着亲历者特有的感慨。彼时,这家专注于AI代码生成和辅助编程的创业公司不得不选择自主算力平台,却在实践中意外打开了一片新天地(301277)。
变化来得比预期更快。陈秋武介绍,大约8个月后,CANN(昇腾异构计算架构)生态的算子覆盖率就已跃升至80%至90%。“8个月就把生态完成到这个程度,我觉得非常惊讶。”团队切身感受到昇腾硬件扎实、生态进步快、越用越顺手。
这种“华为速度”并非孤例。全面开源开放9个月以来,CANN已完成分层解耦,面向开发者开放运行时、算子编译等全层级接口,算子与通信库均支持独立升级,累计开源60余个源码仓。
自主算力生态成熟度的提升,直接转化为开发者可感知的效率跃迁。中国科学技术大学团队将软件迁移至鲲鹏平台,“编译一周左右即可完成,而迁移至其他平台通常需要一个月。”团队负责人、先进计算机系统结构实验室副研究员陈俊仕说。
清华大学团队亦有类似体验。“鲲鹏对于气象的软件库依赖非常友好,基本上把气象模型放到鲲鹏里面,只需要加载几个库,就可以跑基线版本了。”助理研究员王一鸣说。
数字是最直观的注脚。截至目前,鲲鹏开发者超415万,昇腾开发者超410万,openEuler(开源欧拉)系操作系统累计装机量超1600万套。华为计算坚持的“硬件开放、软件开源、使能伙伴、发展人才”生态策略,正在形成规模效应。
陈秋武坦言:“华为计算生态有时相比其他生态还要更舒适,因为支持非常到位。”这种“舒适度”体现在细节之中。陈秋武举例说,当他在做偏汇编层面的矩阵优化时,一旦形状不对齐,CUDA生态就无法兼容。而华为团队则能提供专门的专家对接,“很方便地能链接到,密切地和你合作解决这个问题”。
从“使用者”到“共建者”
硬核场景验证自主算力
生态的价值,终究要在真实场景中接受检验。当自主算力平台进入金融风控、地球系统模拟、大模型预训练等硬核领域,其表现如何?开发者的实践给出了答案。
在金融领域,某头部股份制银行(884250)已将AI引入智能风控核心流程,AI直接介入资金流转与风险决策。这一场景对算力平台的稳定性要求近乎苛刻——首Token响应需控制在500毫秒以内,日均处理量达260亿Token,系统可用性须达到99.999%。通过与昇腾团队联合优化,该行技术团队不仅达成了上述金融级刚性要求,更向vLLM-Ascend社区贡献34个特性,从“使用者”转变为“共建者”。“昇腾让我们看到中国的算力平台同样优秀,可以成为业务首选。”技术负责人郑俊说。
在科学计算领域,清华大学团队联合其他高校和科研院所,基于鲲鹏平台构建了高性能计算与AI深度协同的全球地球系统模式软件系统,将AI与传统数值模拟结合,完成一公里分辨率地球系统模拟,大气模拟效率达1.73模拟年/天。这一成果已成功投稿2026年戈登贝尔气候建模特奖。
“鲲鹏让我们不用在硬件适配上反复‘踩坑’。”王一鸣说。正是这种对底层工作的解放,让科研人员能够聚焦于算法突破与科学问题的本质。
中国科学技术大学则通过算法与硬件协同设计,将不规则计算转为规则稠密计算,充分发挥鲲鹏矩阵计算与高带宽内存能力,优化后求解器相比传统方法实现平均40多倍加速,部分场景接近200倍。
在AI大模型领域,AIGCode交出了一份亮眼的成绩单:在昇腾平台完成混合专家模型预训练,算力利用率达65%,在同等算力规模上这个数据大幅度领先行业。“相当于昇腾一张卡可以当两张卡用。”陈秋武说。这一突破的核心在于通信与计算协同调度,减少芯片闲置,同时优化鲲鹏CPU性能,让CPU也能分摊负载参与训练。
从“跟随”到“引领”
求解智能体时代新命题
当Agentic AI(智能体AI)时代加速到来,算力基础设施面临新的命题。智能体从被动响应迈向主动决策与协同执行,对底层硬件提出更高要求。面向预训练、推理Prefill与Decode等各类业务负载,昇腾950芯片凭借优异的互联能力,可构建出更高带宽、更低延时、更大覆盖范围的超节点。基于全新架构升级的鲲鹏超节点也实现了核心性能与算力体验的全面突破。
陈秋武特别提到UB(灵衢)超节点内存池的价值:“不像原来预训练的时候只有片上内存有限的存储,有了UB之后是TB级的,提供了非常多的可能性。”他测算,这种架构在Agent训练场景下的性能天花板,“可能是原来的100倍、200倍”。
然而,智能体带来的不确定性,也让部分场景保持审慎。郑俊指出,在金融交易等时延要求苛刻的场景,“如果引入了长程思考,显然是做不到的”。目前Agent场景更多集中在Vibe Coding(智能编程)等辅助编码领域,“极大降低了大家的开发门槛”。
陈俊仕则从科研角度观察到,Vibe Coding正在改变编程范式:“80%的代码用AI工具基本上就可以做得很好了,20%的核心优化再做一些修改,很快就可以做好。”但他也强调,智能体目前更像“学生和辅助者的角色”,对于气象模型等复杂地球建模,“还有一段路要走”。
生态的下一个制高点在哪里?陈秋武直言不讳:国内大模型团队多为海外架构的跟随者,关键还是要掌握技术的制高点,让更多的团队加入。
这一判断折射出自主算力生态的深层挑战:从“可用”到“好用易用”的跨越之后,如何培育原创性技术节点、掌握标准定义权,成为从“并跑”迈向“领跑”的关键一跃。
面对这一命题,华为计算正持续加码生态投入。昇腾设立2000万生态创新激励基金,扶持算子、加速库等领域创新探索;投放10000卡算力资源,保障开源社区开发者的算力需求。鲲鹏联合业界头部企业推出以能力为导向的全新“开发者认证”计划,推动与工信部、教育部及业界的认证互信,构建鲲鹏生态通用人才标准。
“识时务者为俊杰,自主算力是潮流。”陈俊仕的建议朴素而直接。郑俊则给出了更具操作性的路径:“先完成,后完美。先用起来之后,再慢慢优化。”
从“荒漠”到“绿洲”,从“使用者”到“共建者”,从“跟随”到“引领”……中国自主算力生态的进阶之路,正在无数开发者的实践中加速铺展。正如石侃在圆桌讨论结束时所言:“如果一个生态已经非常成熟,很多人都在使用,对于我们开发者来说,可能一开始能做的贡献就没有那么多了。”而在从非共识走向共识的当下,每一位入局的开发者,都有机会成为这片生态沃土的“原始股东”。
