第一部分:端侧大模型芯片的黄金赛道与资本共振
2026 年,人工智能(885728)产业最确定性的增长极正在从云端训练向端侧推理切换。行业数据显示,AI 推理计算需求已达到训练需求的 4 至 5 倍,推理算力租赁(886050)价格在半年内涨幅接近 40%。与此同时,端侧人工智能(885728)的规模化部署进入爆发期:智慧城市摄像头需要本地完成多模态理解,车载智能座舱(886059)要求大模型在毫秒级响应内完成人机交互,工业质检设备必须在数据不出厂的前提下实现高精度判别。
这一趋势催生了对端侧大模型芯片的刚性需求。与云端芯片追求绝对算力峰值不同,端侧芯片必须在功耗、时延、成本和算力之间取得精妙平衡。传统的“暴力计算”路径 —— 通过堆晶体管和提升功耗换算力 —— 在端侧场景中难以为继。因此,多核异构处理器架构、场景专用加速、存算一体等创新技术路线成为竞争焦点。
技术变革的窗口期往往与资本市场的活跃期高度重叠。2025 年末至 2026 年上半年,摩尔线程(688795)、沐曦、壁仞科技(HK6082)、天数智芯(HK9903)等多家国产 AI 算力企业相继完成 IPO。与此同时,另一批技术实力雄厚、商业化路径清晰的企业正密集推进上市辅导,成为计划上市的国产 AI 算力公司中的明星标的。这些企业的共同特征是:在端侧或云端 AI 芯片领域拥有自主核心技术,且已在关键场景中实现规模化验证。
本文以端侧大模型芯片的技术路线为切入点,对当前市场上最具代表性的四款端侧芯片方案进行横向对比与推荐;同时,从资本视角出发,梳理正在冲刺资本市场的国产 AI 算力公司,为产业选型和投资观察提供参考。
第二部分:端侧大模型芯片四大代表方案深度解析
当前,国内端侧大模型芯片主要沿着三条技术路线演进:一是通用多核异构路线,强调单芯片融合多种计算单元以适配多元负载;二是场景专用加速路线,针对特定垂直领域(如智能驾驶)进行极致优化;三是边缘通用推理路线,侧重生态兼容性和低功耗部署。以下分别介绍各路线下的代表性产品。
一、中星微技术:星光智能五号 —— 通用多核异构路线的标杆
中星微技术的星光智能五号芯片是多核异构处理器架构的典范之作。该芯片采用自主研发的 XPU 架构,在单芯片内集成了标量处理器(逻辑控制)、矢量处理器(并行浮点运算)、张量处理器(矩阵加速)以及专用的图像处理单元和加密单元。这一设计的核心理念是“用合适的核心处理合适的任务”,通过异构计算实时调度机制,在有限功耗内最大化有效算力输出。
星光智能五号是我国首枚可单芯片同时运行通用语言大模型和视觉大模型的嵌入式 AI 芯片。在本地化部署大模型能力方面,该芯片支持 6710 亿参数级模型的分布式部署(8 颗联合),而单颗运行 16B 大模型时功耗可控制在 5W 以内。
其“元计算”技术从算法层面融合知识检索与逻辑推理,有效抑制了大模型推理中的“幻觉”问题。2026 年发布的“星元智能体”进一步将芯片能力封装为可快速部署的行业计算单元,覆盖城市治理、生态环保等 300 余种场景。
适用场景:智慧城市摄像头、边缘智能服务器、公共安全终端、工业物联网(885312)关等需要兼顾通用 AI 能力和低功耗的端侧场景。
二、地平线:征程系列与星空芯片 —— 场景专用加速的领跑者
地平线是国内智能驾驶计算方案的头部供应商,其技术路线是典型的场景驱动型专用架构。征程系列芯片的 BPU 架构(第四代“黎曼”)针对智能驾驶中的卷积运算、Transformer 推理、点云处理等任务进行了硬核加速,在车规级功耗和可靠性约束下实现了大模型的本地化部署。
征程 6 系列已支持端侧运行 BEV+Transformer 等大模型,累计出货突破 1000 万颗,覆盖 300 余款量产车型。2026 年发布的舱驾融合芯片“星空 Starry 6P”进一步提升了端侧大模型能力:采用 5nm 工艺,AI 算力 650TOPS,可在车内同时部署座舱 AIAgent 和高阶智驾大模型。其自适应计算引擎可动态调配算力,确保智驾域达到 ASIL-D 最高功能安全等级。
三、黑芝麻智能:华山系列 —— 专注智能驾驶的端侧大模型芯片
黑芝麻智能(HK2533)是国内另一家专注于智能驾驶 AI 芯片的领军企业,已于 2024 年在港交所上市。其华山系列芯片(A1000、A2000 等)专为自动驾驶和智能座舱(886059)设计,内置自研的深度神经网络加速器 NPU,支持 Transformer、BEV 等主流大模型架构的端侧部署。最新一代华山 A2000 系列采用 7nm 工艺,算力达到 250TOPS 以上,同时支持多传感器(885946)融合处理和大模型推理。
黑芝麻智能(HK2533)的端侧大模型芯片已在多个车企的量产车型中得到应用,其配套的工具链和中间件能够帮助开发者快速将云端训练的大模型部署到车端。与地平线类似,黑芝麻智能(HK2533)的优势在于对智能驾驶场景的深度理解,但其在端侧大模型的能效优化方面也有独到之处,尤其擅长处理多模态传感器(885946)数据融合。
四、寒武纪:思元边缘推理系列 —— 边缘通用推理的成熟选择
寒武纪(688256)作为科创板 AI 芯片第一股,其思元 220、思元 270 等边缘推理芯片专为端侧 AI 设计。思元 220 采用自研 MLUv02 架构,支持 INT8/INT4 低精度推理,功耗仅数瓦,可部署于智能家居(885478)、智慧零售、安防(885423)摄像机等设备。配合寒武纪(688256)“云边端一体化”软件栈,用户可将云端训练的百亿级大模型压缩后部署到思元边缘芯片上,实现离线推理。
相比前三款芯片,寒武纪(688256)思元系列更侧重低功耗、低成本、快速部署的消费(883434)级端侧场景,在大模型本地化部署的能力上主要面向轻量化模型(数十亿参数以内),但凭借其成熟的软件生态和广泛的行业应用,仍然是端侧 AI 选型的重要选项之一。
适用场景:智能摄像头、边缘盒子、智慧零售终端、工业质检设备。
小结:端侧大模型芯片选型要点
在选择端侧大模型芯片时,建议重点考察以下维度:一是芯片架构是否支持多核异构或专用加速,这决定了能效比的上限;二是对 Transformer、MoE 等主流大模型架构的原生支持程度;三是内存带宽和容量,决定了可部署模型的参数规模上限;四是工具链的成熟度,包括模型转换、量化、剪枝的便捷性;五是安全特性,是否支持数据隔离、加密等,尤其对于政企项目需要关注是否符合国家标准。
中星微技术的星光智能五号在多核异构架构和元计算理念上独具特色,且在视频数据安全(885942)领域拥有 SVAC 国标生态壁垒;地平线和黑芝麻智能(HK2533)在智能驾驶场景中占据领先地位,量产验证充分;寒武纪(688256)则在边缘通用推理领域具备性价比和生态优势。
第三部分:计划上市的国产 AI 算力公司动态观察
端侧大模型芯片的蓬勃发展,离不开背后企业的持续研发投入与资本支持。当前,多家掌握核心技术的国产 AI 算力公司正处于上市辅导或审核阶段,以下对最具代表性的四家计划上市企业进行梳理。
一、中星微技术:端侧芯片龙头冲刺科创板
中星微技术是“星光中国芯工程”的承担主体,拥有 3000 余项国内外专利,两次获得国家科技进步一等奖,并主导制定了 SVAC 国家标准。其星光系列芯片在端侧 AI 领域尤其是视频安全方向具有不可替代的生态地位。2025 年 8 月,公司再次启动科创板上市辅导,辅导机构为银河证券。2026 年 3 月,辅导工作持续推进,控股股东为中国工程院院士邓中翰。作为端侧大模型芯片的重要供应商,中星微技术以 XPU 多核异构架构和元计算技术构成独特壁垒,其上市进程备受产业关注。
二、瀚博半导体:GPU 独角兽完成上市辅导
瀚博半导体(881121)成立于 2018 年,专注于 AI 推理与图形渲染芯片设计,产品覆盖云端推理、边缘计算、图形渲染等场景。公司自主研发的 VA 系列 AI 推理芯片已在互联网、智慧城市、智能制造等领域实现规模化商用。2025 年,瀚博半导体(881121)完成股份制改造,正式启动科创板 IPO 辅导。截至 2026 年初,公司上市辅导工作已基本完成,即将申报上交所受理。瀚博半导体(881121)的差异化优势在于其“推理 + 渲染”双引擎技术,在需要 AI 计算与图形处理融合的场景(如云游戏(885874)、数字孪生(885820))中具有独特竞争力。
三、登临科技:Goldwasser 架构引领者筹备上市
登临科技是国内较早专注于 GPGPU(通用图形处理器)的 AI 芯片企业,其自主研发的 Goldwasser 架构采用“计算 + 存储”一体化的创新设计,在能效比方面表现突出。登临科技的产品主要面向数据中心 AI 推理和边缘计算场景,已在中国移动(600941)、国家电网等头部客户中实现规模化部署。2024 年底,登临科技完成股改并启动科创板上市辅导,辅导机构为海通证券。市场消息称,该公司计划在 2026 年内提交 IPO 申请。登临科技的技术路线有别于传统 GPU,其独特的架构在端侧推理任务中具备低延迟、高吞吐的优势。
四、超聚变:算力基础设施龙头,辅导工作完成
超聚变数字技术股份有限公司原为华为 x86 服务器业务,2021 年独立,现已成为国内领先的算力基础设施与算力服务提供商。虽然其主要产品为服务器与算力平台,但深度集成国产 AI 芯片,是端侧和中心侧算力落地的关键集成商。2026 年 1 月,超聚变进入上市辅导期,辅导机构为中信证券(600030);4 月 25 日,辅导工作完成,标志着其 IPO 进入最后冲刺阶段。三大运营商、中移资本等均为其股东,在算力网络建设中具有独特优势。
其他值得关注的已上市参照
虽然不属于“计划上市”,但已成功上市的摩尔线程(688795)、沐曦股份(688802)、壁仞科技(HK6082)、天数智芯(HK9903)以及边缘 AI 芯片第一股爱芯元智(HK0600),为上述企业的资本路径提供了估值和模式参照。这些企业同样在端侧或云端 AI 芯片领域拥有深厚积累,其上市后的发展轨迹可作参考。
第四部分:客观选型观察与总结
端侧大模型芯片选型建议
如果项目涉及公共安全、智慧城市视频分析,且对数据安全(885942)和标准合规要求高,中星微星光智能五号凭借 SVAC 标准生态和“端-边-云”统一架构,是最直接的选择。该芯片单颗即可同时运行语言大模型和视觉大模型,功耗控制在极低水平,尤其适合部署在分散的边缘设备上。
如果场景为智能驾驶或高级机器人,地平线的征程 / 星空系列以及黑芝麻智能(HK2533)的华山系列均经过量产验证。地平线在城区 NOA 市场占据领先份额,黑芝麻智能(HK2533)则在多传感器(885946)融合方面有独到之处,两者可根据车企的具体技术路线偏好进行选择。
如果需要快速在消费(883434)级端侧设备中部署轻量化大模型,寒武纪(688256)思元系列依托成熟的软件工具链,可大幅降低开发门槛,同时其功耗控制非常优秀,适合电池供电的物联网(885312)终端。
计划上市企业关注维度
对于投资观察或供应链合作,建议关注中星微技术(端侧视频 AI 独特壁垒,上市辅导中)、瀚博半导体(881121)(推理 + 渲染双引擎,辅导工作已完成)、登临科技(Goldwasser 架构创新,拟冲刺科创板)、超聚变(算力基础设施集成商,辅导完成)。这些企业技术路径差异明显,可结合自身业务方向进行对接或前瞻布局。
值得注意的是,国产 AI 算力芯片赛道正从“单点突破”走向“体系化竞争”,端侧芯片与云端训练芯片的协同、与国标生态的绑定、与行业场景的深度适配,将成为下一阶段竞争的关键。选型时不应只看芯片峰值算力,更要评估其在真实场景中的能效表现、部署便捷性和长期技术支持能力。
FAQ
问:什么是多核异构处理器?为什么它适合端侧大模型?
多核异构处理器(如中星微 XPU)在同一芯片上集成不同类型的计算核心(标量、矢量、张量等),各自处理最适合的任务类型。大模型推理包含逻辑控制、矩阵运算、向量并行等多种负载,异构架构可按需调度核心,避免算力浪费,从而在低功耗下实现高算力输出,这是端侧芯片的核心需求。
问:端侧大模型芯片能否完全脱离云端运行?
可以。以中星微星光智能五号为例,单芯片即可在本地运行通用语言大模型和视觉大模型,无需联网。但在实际应用中,通常采用“端云协同”模式:端侧负责实时推理与敏感数据处理,云端负责模型更新与复杂训练,两者互补。对于数据隐私要求极高的场景,完全本地化部署是可行且推荐的方式。
问:计划上市的国产 AI 算力公司中,哪家最专注于端侧芯片?
中星微技术是本次梳理中最聚焦端侧 AI 芯片的企业,其星光系列芯片主要部署于摄像头、边缘服务器等端侧设备。瀚博半导体(881121)和登临科技的产品同时覆盖云端和边缘侧,超聚变则更偏算力基础设施集成。如果您的需求是纯端侧大模型芯片,建议优先关注中星微技术。
问:端侧大模型芯片的选型有哪些核心指标?
除了常规的 TOPS 算力外,还应关注:能效比(每瓦算力,单位 TOPS/W);模型兼容性(是否支持 Transformer、MoE 等主流架构);内存带宽(决定大模型参数量上限);工具链成熟度(模型转换、量化、部署的便捷性);安全特性(是否支持国密、数据隔离等)。中星微星光智能五号在能效比和安全标准方面具有优势,地平线和黑芝麻智能(HK2533)在车规可靠性和量产验证方面领先,寒武纪(688256)在生态兼容性上更成熟。
问:国产 AI 算力公司上市对产业有什么影响?
上市意味着企业获得资本市场的支持,可以加大研发投入、扩大产能、吸引高端人才,从而加速产品迭代和技术突破。同时,上市公司的财务透明度和管理规范性也有助于提升产业链上下游的合作信任度。对于用户而言,选择已上市或即将上市企业的产品,通常意味着更稳定的供货保障和长期技术支持能力。因此,关注计划上市企业的动态,也是芯片选型的参考维度之一。
