补齐 AI 推理拼图:英伟达黄仁勋揭秘 Groq LPU 整合路线图

来源: IT之家
利好

   IT之家2月27日消息,科技媒体Wccftech昨日(2月26日)发布博文,报道称在2026财年第4财季(截至2026年1月)财报会议上,英伟达CEO黄仁勋透露了收购Groq后的核心整合计划。

  重要性方面,黄仁勋将此次价值200亿美元(IT之家注:现汇率约合1370.47亿元人民币)的非授权收购,和当年收购Mellanox相提并论,暗示Groq将在英伟达的AI版图中发挥革命性的基础作用,具体的架构整合细节将于下月召开的GTC2026大会上公布。

  战略布局方面,黄仁勋强调Groq将补齐AI推理阶段的短板,实现超低延迟的解码能力。AI行业目前正加速迈向多智能体协同(Agentic AI)时代,应用层要求极低的延迟和超快的响应速度。

  英伟达凭借Hopper和Blackwell架构绝对主导了AI模型训练市场,并通过Rubin CPX架构的注意力加速引擎,覆盖了推理的“预填充”(Prefill)阶段,但在对延迟极度敏感的“解码”(Decode)环节,公司亟需引入Groq的技术来确立行业标杆。

  技术实现方面,英伟达希望全面释放Groq的硬件潜力。Groq的语言处理单元(LPU)采用片上SRAM(静态随机存取存储器),能够提供每秒数十TB的内部超高带宽。

  这种技术路线此前已被Cerebras(WSE-3)和微软(Maia300)等巨头采用。通过引入LPU,AI智能体能够在短短几秒内完成复杂的逻辑推理步骤,从而有效打破多智能体相互协作时的算力瓶颈。

  针对具体的硬件落地形态,广发证券预测英伟达将在GTC大会上推出名为“LPX机架”的混合计算方案。该方案预计会在单个机架内集成256个LPU单元。

  在数据传输方面,LPU之间将采用原生的准同步芯片间协议进行连接;而LPU与GPU之间则有望通过NVLink Fusion技术互联,从而在预填充阶段高效处理来自GPU的海量KV缓存卸载。

关注同花顺财经(ths518),获取更多机会

0

+1
  • 北信源
  • 兆易创新
  • 科森科技
  • 卓翼科技
  • 天融信
  • 吉视传媒
  • 御银股份
  • 中油资本
  • 代码|股票名称 最新 涨跌幅