从训练到推理 芯片战场新角逐
21世纪经济报道记者倪雨晴 深圳报道
2025年的CES刮起AI旋风。
AI Agent的兴起、AI硬件的火热,都反映了AI应用正在加速爆发。随着应用走进千行百业,大模型和算力市场双双掀开新篇章。
一方面,AI大模型更强化商用探索,从训练转向了推理,如果将训练看作是AI模型的研发建设阶段,那么推理便是模型商业化落地的核心阶段。不论是OpenAI o1、Gemini 2.0 Flash Thinking、还是DeepSeek R1-Lite-Preview,都在提升推理能力,进一步支撑应用开发。
另一方面,随着AI推理来到了聚光灯下,成为行业焦点,AI算力的市场上,对推理基础设施的需求正在上升。
巴克莱研报指出,目前,AI推理计算需求将快速提升,预计其将占通用人工智能总计算需求的70%以上,推理计算的需求甚至可以超过训练计算需求,达到后者的4.5倍。
在AI推理的新时代,芯片厂商们正在开启新策略。从CES上的动作来看,英伟达可谓激进,直接在端侧推出超级计算机Project DIGITS,以“PC主机”的形态让个人用户可以运行模型推理,开发AI应用。
可以说,Project DIGITS直接在终端计算上开辟了新战线。而云端的战场上,推理芯片的竞赛正在拉开大幕,英伟达、AMD酣战外,云厂商、初创企业都在寻找推理的生存路径。
端侧AI崛起:英伟达的2C“芯”
首先从端侧看,Project DIGITS搭载全新GB10超级芯片,成为全球最小的可运行200B参数模型的AI超级计算机。
在生成式AI应用的爆发前夜,英伟达要将它的算力网进一步铺开,如今它已经将生成式AI铺到了开发者的桌面上。
英伟达似乎在展示生成式AI时代,AI PC的未来模样。尽管DIGITS作为初代产品,主要面向的还是研发人员、科学家、开发者,但是它向我们展示了更强大的个人算力使用场景,为端侧AI的发展提供了新的可能。
这种设计,不仅为开发者提供了更加便捷、高效的工具,也进一步降低了AI算力应用的门槛。英伟达试图通过这一战略,将生成式AI从云端拉向终端,从高成本的少数派应用,转向更具普及性的AI。
当然,英伟达并非唯一玩家,在CES上,AMD、高通、英特尔等厂商同样在端侧AI领域积极布局。
以AMD为例,其推出的锐龙AI Max系列移动处理器,凭借集成的新一代神经处理单元(NPU),在Windows笔记本市场表现不俗。而基于“Zen 5”架构的锐龙AI 300系列,则进一步增强了多任务处理能力和续航时间,从轻薄笔记本到日常办公电脑,AMD正试图在不同市场细分领域拓展份额。
与此同时,英特尔也推出了一系列CPU,包括酷睿Ultra 200V系列、Ultra 200H系列、Ultra 200HX系列、Ultra 200U系列、Ultra 200S系列。这些细分的CPU,涵盖从高性能到入门级的不同应用场景。而高通则通过Snapdragon X入门级处理器,尝试将AI技术下沉至价格更加亲民的笔记本市场,使OEM能够在600美元左右的范围内销售Copilot+电脑。
对比来看,同样是针对AI PC,不论是AMD、英特尔还是高通,更多的是继续在芯片层面更新,但是英伟达已经另辟蹊径,探索软硬件一体化的新AI PC赛道。
或者说,“卖铲子”的英伟达始终有一颗2C的“芯”。纵观英伟达的历史,很早就希望做一家to C的公司,比如说之前做游戏主机。但现实确是相反,英伟达走上了算力提供方的角色道路,越来越像一家纯粹to B的公司。
兜兜转转,在AI PC领域,英伟达再次回到C端市场,对产业链进行了整合。从Arm架构到GPU、CPU的整合,对于英伟达而言,是自身产品能力的外溢,现有的技术框架支撑英伟达开启新产品线。
从另一个角度来说,现在很多人买一台电脑,主要就是买一张显卡,英伟达也是在横向扩展自己的产品线。面向未来的AI PC市场,我们可能不会为了惠普、戴尔这些品牌而产生高溢价的购买行为,相反,英伟达凭借在PC用户中的号召力,已经和这些巨头有绝对的一战之力。
对比来看,英特尔或者别的算力公司也始终在尝试更多的业态和技术路线,但是在业内人士看来,要打败英伟达一定不是通过英伟达,而是要有下一个时代的技术方向和路径,不能再用上一代的车去开下一代的路。
从目前来看,英伟达的战略路线非常清晰,不断的通过软件加硬件以及现在的to C成品产品来形成自己的端侧壁垒。英特尔、AMD等对手能否超车,也取决于他们是否能在下一代计算方向上占据先机。
不论竞争态势如何,端侧AI的崛起,都标志着算力进入了新的阶段。从数据中心到个人桌面,从企业用户到普通消费者,AI的未来正在变得更加触手可及。
AI推理时代:创新在“边缘”
DIGITS是英伟达开启的终端侧创新产品线,而当前AI的增长仍主要在云端。尤其是,随着推理需求越来越旺盛,推理计算的竞争也更加激烈。AI训练市场上英伟达占据9成市场,但是AI推理市场在打开更多空间。
在2024年10月,英伟达管理层在AI路演上就特别提到了推理带来的市场。高管表示,当前仍是AI周期的早期阶段,随着OpenAI o1模型的发布,新的AI叙事正在展开,开始转向解决更复杂的推理问题,这将提升对硬件组合的需求,而英伟达即将推出的机架产品是最佳解决方案。
从英伟达的视角看,当前英伟达最新架构的Blackwell架构芯片已经全面投产,随着AI应用走向千行百业,英伟达提供更多的配置来满足算力需求。
比如,在CES上,英伟达就展示了GB200 NVL72大芯片,样品由72个Blackwell GPU构成,主要是针对更大的算力需求、更低的能耗要求进行了升级。而GB200引入了先进的功能和第二代Transformer 引擎,可加速LLM推理工作负载,据悉新一代的GB300将对推理模型会有更好的支持。
与此同时,推理市场上的竞争者着实不少。比如科技大厂AWS、谷歌、微软,各家的ASIC芯片、TPU芯片也在不断迭代之中;又比如Groq、SambaNova、Positron AI等初创企业,大家都想从推理中分一杯羹。
英伟达在训练市场的绝对垄断地位,使得其他玩家很难直接切入这一领域,因此推理市场成为诸多初创公司和竞争者的关注焦点。此前,推理市场像是算力界的“边缘”市场,而现在,推理市场逐步成为了行业焦点,更多的创新在这里涌现。
在这一市场中,差异化竞争正在形成。例如,一些企业专注于开发针对推理场景优化的专用芯片,以在特定工作负载下提升性能;另一些公司则尝试通过软硬件协同优化,为计算场景提供更经济高效的解决方案。
而这也是一场残酷的算力角逐游戏,在算力市场上面新开发出新物种并非易事,因为新物种是在GPU的绝对统治力之下,在细分领域的中生存进化的结果。
面对推理算力需求的增长,硬件市场更加细分了,竞争也更加激烈。虽然从各种预测看,推理市场未来的增势很大,但是眼下英伟达已经吃掉市面上的大部分算力的利润,推理部分的细分蛋糕,如何切割,依然是比较残酷的竞争。
而有意思的是,当年英伟达所处的位置也是边缘市场。原来的GPU的生存之道是图形计算,但是计算机的图形计算的重要性并不是很高,它是诸多计算任务当中的一个分支,但是它慢慢变得更重要,从边缘进入关键的核心。
现在,推理也在从边缘进入到中心舞台,毫无疑问,接下来AI场上将迎来更繁荣的推理芯片和应用生态。在未来的硬件架构中,可能有更多组合,有专门用来做通用计算CPU、有专门做训练的GPU、也有专门做推理的推理芯片。
在异构计算中,英伟达必然是强大的算力基础,但对于企业而言要更换一套体系也是成本。而英伟达的竞争者们如何通过软硬件结合等创新,形成细分场景的突围路径,也值得关注。
0人
- 每日推荐
- 股票频道
- 要闻频道
- 港股频道
- 证监会明确今年五方面重点工作
- 寒武纪:2024年预计净利润亏损3.96亿元到4.84亿元
- 华扬联众:公司及实控人被立案调查
- 跨境电商“AI”心飞扬 带动中国产业带高质量出海
- 逾百家公司披露业绩预告 近六成预喜
- 周三机构一致最看好的10金股
- 马化腾:腾讯不做低质量短剧!爱奇艺靠拢字节,短剧开年有新风向
- 四川A股174家上涨 倍益康领涨 融发核电华西能源涨停
- 2.4万亿与1476亿:2024年分红回购规模均创历史新高,开年13天马力全开