原粒半导体:半导体行业进入Chiplet(芯粒)新阶段

2026-06-04 18:29:10
来源:IT之家
分享
AIME

问财摘要

1、随着AI Agent的兴起,计算架构的问题被重新暴露出来,瓶颈不再是“算不动”,而是“数据搬不动”。 2、越来越多AI芯片公司开始放弃过去“大单片芯片”的思路,转向Chiplet(芯粒)时代,把芯片拆成很多功能模块,通过高速互联网络,把这些模块重新组织成一个整体。 3、这种变化,恰恰非常适合AI Agent时代,未来AI芯片的核心,不只是计算单元,而是“交通系统”,即调度能力。
免责声明 内容由AI生成
文章提及标的
半导体--
云计算--
英伟达--
周期--

半导体(881121)产业的发展历史里,硬件架构从来不是凭空演化的。PC时代定义了CPU,移动互联网定义了SoC,而云计算(885362)与深度学习,则定义了GPU。几乎每一次计算范式的变化,背后都会对应一次底层硬件逻辑的重构。

今天,类似的事情可能又一次发生了。

过去几年,大模型的主战场始终在云端。行业比拼的是更大的训练集群、更强的GPU、更高的参数规模。所有人都默认,AI的终点应该是超级数据中心。

但进入2026年后,一个很有意思的现象开始出现。

越来越多开发者和企业,重新开始购买Mac Mini、小型工作站以及低功耗桌面主机。这些机器被安静地放在办公室或书桌角落,24小时不间断运行。它们不再只是给人使用,而是在后台长期供养AI Agent:写代码、做自动化流程、清洗数据、审核财税文档、调用各种工具链。

AI开始像一种长期在线的“数字员工”存在。而当AI从“偶尔调用”变成“持续驻留”,整个计算架构的问题就会被重新暴露出来。因为这时候真正的瓶颈,很多时候已经不再是“算不动”,而是“数据搬不动”。

过去GPU最擅长的事情,其实是集中式爆发计算。比如大模型训练,本质上是在短时间内调动海量算力,进行高度规则化的大规模矩阵运算。这种模式非常适合云数据中心,也极其适合英伟达(NVDA)过去十几年建立起来的GPU帝国。

但 Agent的工作负载完全不同。它不是一次性推理,而是长时间运行;它需要长期保存上下文;需要频繁调用工具;需要处理文本、图像、语音等多模态输入;甚至还需要持续响应外部环境变化。

这意味着,AI系统内部会产生大量的数据流动。数据在显存之间搬运,在缓存和主存之间搬运,在不同计算单元之间来回交换。真正消耗功耗和时间的,很多时候不是核心计算,而是这些“运输过程”。

行业里有一句越来越被频繁提起的话:未来AI最大的成本,不一定是计算,而是数据移动。尤其在边缘端、小型设备、本地Agent场景下,这个问题会被进一步放大。

因为没有数据中心级别的供电,没有超大规模散热,也没有无限堆叠的GPU集群。你必须在很小的体积里,同时解决功耗、带宽、散热、成本以及长期稳定运行的问题。

这也是为什么,越来越多AI芯片公司开始放弃过去“大单片芯片”的思路。传统芯片的发展逻辑其实很简单:想提升性能,就在一块硅片上塞进更多计算核心、更大缓存、更高带宽。

但这种模式正在越来越接近物理极限。芯片越大,良率越低;功耗越高,发热越严重;制造成本也会迅速膨胀。于是,半导体(881121)行业这几年开始进入一个非常关键的新阶段——Chiplet(芯粒)时代。

简单来说,就是不再强行制造“一整块超级芯片”,而是把芯片拆成很多功能模块。有人负责计算,有人负责存储,有人负责互联,有人负责AI加速。最后再通过高速互联网络,把这些模块重新组织成一个整体。

很多人把这种方式称为“硅基乐高”。它最大的意义,其实不只是降低成本,而是让芯片第一次真正具备了“可组合性”。算法变了,不需要整块芯片重做;需求变了,可以增加对应模块;不同场景,也可以灵活切换不同组合。

过去做芯片,更像是在盖一栋无法修改的定制大楼;现在越来越像是在搭积木。

而这种变化,恰恰非常适合AI Agent时代。因为Agent最大的问题,就是变化太快。模型结构在变,工作流在变,多模态系统在变,工具调用方式也在快速变化。传统芯片两三年的研发周期(883436),已经越来越难追上AI的演化速度。

于是,整个行业开始从“追算法”,转向“适应算法”。但很多人会误以为,Chiplet的核心只是“把芯片切小”。

其实真正困难的问题并不在这里。真正难的是:拆开之后,怎么还能像“一颗芯片”一样协同工作。因为多个芯粒之间会产生海量通信。数据怎么走?任务怎么分?显存怎么调度?上下文如何同步?如果这些问题处理不好,多芯粒系统甚至可能比传统单片芯片效率更低。

所以今天很多端侧AI公司真正竞争的重点,其实已经不只是算力,而是调度能力。换句话说,未来AI芯片的核心,不只是计算单元,而是“交通系统”。

因为AI Agent的运行,本质上越来越像一个实时城市交通网络。哪里堵了,任务如何绕路;哪些数据应该优先缓存;哪些任务应该动态分流。这些都会直接决定最终的性能与能耗表现。

很多时候,真正决定系统体验的,已经不是峰值算力,而是调度效率。这也是为什么,现在越来越多芯片公司开始强调互联网络、动态路由、拓扑调度以及软件工具链。

因为未来的AI,不再只是一次性跑分,而是长期稳定运行。而在这一轮端侧AI架构重构中,原粒半导体(881121)这样的公司开始受到行业关注,本质上也并不只是因为“国产AI芯片”这个标签。

更重要的是,它们试图从一开始,就按照Agent的运行逻辑重新定义硬件。包括Chiplet模块化架构、高带宽互联、动态任务调度、软硬件协同工具链以及多模态融合能力。

这些技术单独拆开看,其实都不算新鲜。真正困难的是,如何把它们组合成一个适合长期运行AI Agent的完整系统。因为未来真正重要的,已经不只是“能不能跑通大模型”。

而是能不能长期稳定运行,能不能低功耗持续驻留,能不能适应快速变化的Agent工作流,能不能真正进入现实产业环境。

这其实是两个完全不同的问题。今天很多AI Demo都很惊艳,但距离真正进入生产系统,还有很长一段路。

而端侧AI真正需要解决的,恰恰是那些最枯燥、最底层、最工程化的问题。很多时候,技术革命真正开始成熟的标志,并不是模型参数突破多少,而是基础设施开始发生变化。

从大型机到PC,人类用了几十年。而从云端AI到长期驻留的本地Agent,也许才刚刚开始。

而这一轮变化背后,本质上并不只是一次简单的芯片升级。

它更像是:AI正在重新发明“计算机”。

免责声明:风险提示:本文内容仅供参考,不代表同花顺观点。同花顺各类信息服务基于人工智能算法,如有出入请以证监会指定上市公司信息披露平台为准。如有投资者据此操作,风险自担,同花顺对此不承担任何责任。
homeBack返回首页
不良信息举报与个人信息保护咨询专线:10100571违法和不良信息涉企侵权举报涉算法推荐举报专区涉青少年不良信息举报专区

浙江同花顺互联信息技术有限公司版权所有

网站备案号:浙ICP备18032105号
证券投资咨询服务提供:浙江同花顺云软件有限公司 (中国证监会核发证书编号:ZX0050)
AIME
举报举报
反馈反馈