2026年6月25日,金元证券发布了一篇计算机行业的研究报告,报告指出,Jalape?o开启OpenAI自研芯片时代,AI算力迈向全栈协同。
报告具体内容如下:
事件: 6月24日,OpenAI与博通(AVGO)联合发布首款自研AI推理芯片Jalape?o。该芯片从最初设计到流片仅用时9个月,预计2026年底开始初始部署。
Jalape?o锚定大模型推理环节。该芯片由OpenAI定义芯片架构,博通(AVGO)负责芯片工程实现、网络及连接技术,Celestica参与板卡、机架和系统集成,主要面向ChatGPT、Codex、API及未来Agent产品的LLM推理负载。目前该芯片的工程样品已在目标频率及功耗下成功运行GPT-5.3-Codex-Spark。
OpenAI正由模型厂商向全栈AI基础设施厂商演进。Jalape?o围绕OpenAI实际运行的模型、核心算子、数据搬运、网络通信及调度需求进行软硬件协同优化,通过减少数据搬运,并平衡计算、内存和网络资源,提高芯片实际利用率。根据官方早期测试,其单位功耗性能有望显著优于当前先进加速器。随着推理环节逐步成为算力需求的主要增量,自研ASIC将帮助OpenAI降低单位Token成本,增强算力供应自主性,并缩短模型与基础设施的迭代周期(883436)。
模型与芯片协同开发正成为头部AI厂商的必然选择。
Google于2015年部署首代TPU,并逐步由推理扩展至训练、互连和系统集群;AWS先后推出Inferentia和Trainium,分别覆盖推理与训练;Meta(META)则围绕推荐、排名和广告等内部负载开发MTIA,并强化芯片、PyTorch与模型架构协同。当模型调用规模足够大、负载趋于稳定后,厂商有动力将算法和业务特征固化至芯片设计中,以提升性能、功耗和成本效率。Jalape?o的发布意味着这一趋势正由云计算(885362)巨头延伸至头部模型厂商,AI芯片竞争也将由单一芯片性能,升级为模型、编译器、芯片、HBM、网络和机架系统的全栈竞争,并进一步拉动定制ASIC、先进制程、HBM、先进封装(886009)、高速交换及光互连需求。
风险提示:芯片性能及良率不及预期;模型架构迭代导致ASIC适配能力下降;大模型推理需求增长不及预期等。
更多机构研报请查看研报功能>>
声明:本文引用第三方机构发布报告信息源,并不保证数据的实时性、准确性和完整性,数据仅供参考,据此交易,风险自担。
