华为发布全新AI数据基础设施 破解AI行业化落地难题
3月17日,华为正式发布针对AI推理场景的全新AI数据基础设施,包含面向中心推理场景的AI数据平台,和面向分支边缘推理场景的FusionCube A1000AI超融合一体机,旨在推动AI推理体验升级,并显著降低推理部署门槛,加速AI商业正循环。
过去几年,AI历经多轮演进,已迈入了以推理为核心的全新阶段。当下,企业正面临两大变化:一是数据类型与规模持续扩展,从文本为主转向多模态格式混合,体量从TB级跃升至EB级;二是企业核心资产从“数据”转变为“知识”与“记忆”,被实时调用以支撑智能体自主决策。这些正全面重塑AI数据基础设施,成为AI行业化落地的关键。
为解决推理业务中知识质量不足、长序列推理体验差以及推理记忆缺失的三大瓶颈,华为发布AI数据平台,整合知识库、KV Cache加速和记忆库,并结合UCM技术实现调度与管理,破除企业AI的数据门槛,加速智能体应用落地。
据了解,企业数据在不断变化与更新,如果知识转化不及时,会导致模型的推理决策结果不精准。华为AI数据平台通过多模无损解析、Token级编码等方式,将文本、图片、视频等资源转化成海量细颗粒度的知识,结合多维度检索与重排序,实现超95%知识检索精度。
在长文本长序列、多用户多并发的推理过程中,大量的KV Cache数据存不下、系统响应迟缓,导致推理体验恶化。华为AI数据平台针对性提供了全局分层缓存能力,让记忆数据在On-chip memory、DRAM、外置SSD存储三层间按需流动,显著扩充KV Cache存储池,同时融合多种稀疏注意力算法,避免重复计算,大幅扩展上下文窗口,实现首Token时延降低90%。
此外,当前,大模型普遍缺乏持久的记忆,会遗忘多步骤的中间结果和长期沉淀的历史经验,无法真正实现自我进化。华为称,其AI数据平台可实现上下文状态保持、信息凝练,记得越多,推理就越精准,模型应用才能“越用越聪明”。
本次发布的AI数据平台支持一体化和独立式两大部署模式,其中独立式部署采用“数据引擎节点+OceanStor Dorado”架构,可在现有存储系统上新增数据引擎节点,保护历史投资,支撑业务平滑转型。
如今,大量的数据是在分支边缘场景产生的,针对传统分支边缘场景进行智能化改造过程中所面临的部署复杂、成本高昂、效率低下等问题,华为同步推出FusionCube A1000AI超融合一体机,通过集成化与智能化交付,助力AI快速部署与高效运行。
0人