从训练到推理 芯片战场新角逐

2025-01-14 18:20:12 来源: 21世纪经济报道

  21世纪经济报道记者倪雨晴 深圳报道

  2025年的CES刮起AI旋风。

  AI Agent的兴起、AI硬件的火热,都反映了AI应用正在加速爆发。随着应用走进千行百业,大模型和算力市场双双掀开新篇章。

  一方面,AI大模型更强化商用探索,从训练转向了推理,如果将训练看作是AI模型的研发建设阶段,那么推理便是模型商业化落地的核心阶段。不论是OpenAI o1、Gemini 2.0 Flash Thinking、还是DeepSeek R1-Lite-Preview,都在提升推理能力,进一步支撑应用开发。

  另一方面,随着AI推理来到了聚光灯下,成为行业焦点,AI算力的市场上,对推理基础设施的需求正在上升。

  巴克莱研报指出,目前,AI推理计算需求将快速提升,预计其将占通用人工智能总计算需求的70%以上,推理计算的需求甚至可以超过训练计算需求,达到后者的4.5倍。

  在AI推理的新时代,芯片厂商们正在开启新策略。从CES上的动作来看,英伟达可谓激进,直接在端侧推出超级计算机Project DIGITS,以“PC主机”的形态让个人用户可以运行模型推理,开发AI应用。

  可以说,Project DIGITS直接在终端计算上开辟了新战线。而云端的战场上,推理芯片的竞赛正在拉开大幕,英伟达、AMD酣战外,云厂商、初创企业都在寻找推理的生存路径。

  端侧AI崛起:英伟达的2C“芯”

  首先从端侧看,Project DIGITS搭载全新GB10超级芯片,成为全球最小的可运行200B参数模型的AI超级计算机。

  在生成式AI应用的爆发前夜,英伟达要将它的算力网进一步铺开,如今它已经将生成式AI铺到了开发者的桌面上。

  英伟达似乎在展示生成式AI时代,AI PC的未来模样。尽管DIGITS作为初代产品,主要面向的还是研发人员、科学家、开发者,但是它向我们展示了更强大的个人算力使用场景,为端侧AI的发展提供了新的可能。

  这种设计,不仅为开发者提供了更加便捷、高效的工具,也进一步降低了AI算力应用的门槛。英伟达试图通过这一战略,将生成式AI从云端拉向终端,从高成本的少数派应用,转向更具普及性的AI。

  当然,英伟达并非唯一玩家,在CES上,AMD、高通、英特尔等厂商同样在端侧AI领域积极布局。

  以AMD为例,其推出的锐龙AI Max系列移动处理器,凭借集成的新一代神经处理单元(NPU),在Windows笔记本市场表现不俗。而基于“Zen 5”架构的锐龙AI 300系列,则进一步增强了多任务处理能力和续航时间,从轻薄笔记本到日常办公电脑,AMD正试图在不同市场细分领域拓展份额。

  与此同时,英特尔也推出了一系列CPU,包括酷睿Ultra 200V系列、Ultra 200H系列、Ultra 200HX系列、Ultra 200U系列、Ultra 200S系列。这些细分的CPU,涵盖从高性能到入门级的不同应用场景。而高通则通过Snapdragon X入门级处理器,尝试将AI技术下沉至价格更加亲民的笔记本市场,使OEM能够在600美元左右的范围内销售Copilot+电脑。

  对比来看,同样是针对AI PC,不论是AMD、英特尔还是高通,更多的是继续在芯片层面更新,但是英伟达已经另辟蹊径,探索软硬件一体化的新AI PC赛道。

  或者说,“卖铲子”的英伟达始终有一颗2C的“芯”。纵观英伟达的历史,很早就希望做一家to C的公司,比如说之前做游戏主机。但现实确是相反,英伟达走上了算力提供方的角色道路,越来越像一家纯粹to B的公司。

  兜兜转转,在AI PC领域,英伟达再次回到C端市场,对产业链进行了整合。从Arm架构到GPU、CPU的整合,对于英伟达而言,是自身产品能力的外溢,现有的技术框架支撑英伟达开启新产品线。

  从另一个角度来说,现在很多人买一台电脑,主要就是买一张显卡,英伟达也是在横向扩展自己的产品线。面向未来的AI PC市场,我们可能不会为了惠普、戴尔这些品牌而产生高溢价的购买行为,相反,英伟达凭借在PC用户中的号召力,已经和这些巨头有绝对的一战之力。

  对比来看,英特尔或者别的算力公司也始终在尝试更多的业态和技术路线,但是在业内人士看来,要打败英伟达一定不是通过英伟达,而是要有下一个时代的技术方向和路径,不能再用上一代的车去开下一代的路。

  从目前来看,英伟达的战略路线非常清晰,不断的通过软件加硬件以及现在的to C成品产品来形成自己的端侧壁垒。英特尔、AMD等对手能否超车,也取决于他们是否能在下一代计算方向上占据先机。

  不论竞争态势如何,端侧AI的崛起,都标志着算力进入了新的阶段。从数据中心到个人桌面,从企业用户到普通消费者,AI的未来正在变得更加触手可及。

  AI推理时代:创新在“边缘”

  DIGITS是英伟达开启的终端侧创新产品线,而当前AI的增长仍主要在云端。尤其是,随着推理需求越来越旺盛,推理计算的竞争也更加激烈。AI训练市场上英伟达占据9成市场,但是AI推理市场在打开更多空间。

  在2024年10月,英伟达管理层在AI路演上就特别提到了推理带来的市场。高管表示,当前仍是AI周期的早期阶段,随着OpenAI o1模型的发布,新的AI叙事正在展开,开始转向解决更复杂的推理问题,这将提升对硬件组合的需求,而英伟达即将推出的机架产品是最佳解决方案。

  从英伟达的视角看,当前英伟达最新架构的Blackwell架构芯片已经全面投产,随着AI应用走向千行百业,英伟达提供更多的配置来满足算力需求。

  比如,在CES上,英伟达就展示了GB200 NVL72大芯片,样品由72个Blackwell GPU构成,主要是针对更大的算力需求、更低的能耗要求进行了升级。而GB200引入了先进的功能和第二代Transformer 引擎,可加速LLM推理工作负载,据悉新一代的GB300将对推理模型会有更好的支持。

  与此同时,推理市场上的竞争者着实不少。比如科技大厂AWS、谷歌、微软,各家的ASIC芯片、TPU芯片也在不断迭代之中;又比如Groq、SambaNova、Positron AI等初创企业,大家都想从推理中分一杯羹。

  英伟达在训练市场的绝对垄断地位,使得其他玩家很难直接切入这一领域,因此推理市场成为诸多初创公司和竞争者的关注焦点。此前,推理市场像是算力界的“边缘”市场,而现在,推理市场逐步成为了行业焦点,更多的创新在这里涌现。

  在这一市场中,差异化竞争正在形成。例如,一些企业专注于开发针对推理场景优化的专用芯片,以在特定工作负载下提升性能;另一些公司则尝试通过软硬件协同优化,为计算场景提供更经济高效的解决方案。

  而这也是一场残酷的算力角逐游戏,在算力市场上面新开发出新物种并非易事,因为新物种是在GPU的绝对统治力之下,在细分领域的中生存进化的结果。

  面对推理算力需求的增长,硬件市场更加细分了,竞争也更加激烈。虽然从各种预测看,推理市场未来的增势很大,但是眼下英伟达已经吃掉市面上的大部分算力的利润,推理部分的细分蛋糕,如何切割,依然是比较残酷的竞争。

  而有意思的是,当年英伟达所处的位置也是边缘市场。原来的GPU的生存之道是图形计算,但是计算机的图形计算的重要性并不是很高,它是诸多计算任务当中的一个分支,但是它慢慢变得更重要,从边缘进入关键的核心。

  现在,推理也在从边缘进入到中心舞台,毫无疑问,接下来AI场上将迎来更繁荣的推理芯片和应用生态。在未来的硬件架构中,可能有更多组合,有专门用来做通用计算CPU、有专门做训练的GPU、也有专门做推理的推理芯片。

  在异构计算中,英伟达必然是强大的算力基础,但对于企业而言要更换一套体系也是成本。而英伟达的竞争者们如何通过软硬件结合等创新,形成细分场景的突围路径,也值得关注。

关注同花顺财经(ths518),获取更多机会

0

+1
  • 汉威科技
  • 蓝思科技
  • 三花智控
  • 弘讯科技
  • 金奥博
  • 壹网壹创
  • 立方数科
  • 钧崴电子
  • 代码|股票名称 最新 涨跌幅