封面新闻记者付文超
近年来,出行领域纷纷深挖自动驾驶积累的全链路AI数据能力,跨界布局具身智能赛道。6月22日,如祺出行(HK9680)旗下数据业务板块正式发布具身智能数据平台。这意味着,这家公司正式将其既有的AI数据服务能力延伸至高增长的具身智能数据处理场景。
今年以来,全国多地明确支持具身智能领域加快发展。6月9日,工信部与国资委联合启动“2026年度人形机器人(886069)与具身智能实景实训专项行动”,计划今年底推动人形机器人(886069)等重点产品在代表性场景中开启“作业模式”,带动形成“万台级规模落地能力”。市场预期,在系列积极政策支持下,具身智能将加快进入大规模预训练阶段,而数据作为现阶段制约具身智能发展的最重要瓶颈,相关服务需求也将出现爆发式增长。
当前,具身智能的竞争重心正从本体硬件转向可供训练用的高质量物理数据。公开数据显示,全球高质量真实物理交互数据总量仅约50万小时,而具身智能通用模型训练则需要千万小时起步的数据量级。国泰海通(HK2611)证券在近期研报中直言,“数据饥荒”已成为制约具身智能泛化能力突破的主要瓶颈。
据了解,具身智能训练所需的多模态数据涵盖视觉、力觉、关节轨迹和语言指令等,对时空、因果对齐精度要求极高。但目前传统数据服务商推出的数据工具链功能大多较为分散,采集、标注、质检、格式转换和训练对接时常分布在不同工具和流程中。如祺数据此次发布的具身智能数据平台,通过搭建面向Ego-centric数据的自动化处理流水线,覆盖数据导入、AI预处理、动作标注、多级质检到标准化格式导出全流程,核心目标是降低Ego-centric数据从采集到训练的边际成本,进而突破“最后一公里”困境。
这一过程打破了传统“数据工具链零散、标准不一”的局面,提升数据处理流程的标准化、自动化和可追溯水平,降低从原始视频到训练就绪数据之间的工程门槛,实现高质量数据开箱即用,显著优化模型训练团队的数据使用效率。
“具身智能与自动驾驶本质上都是物理AI,两个领域的数据服务能力在底层逻辑上相通,存在可迁移经验。”一位业内人士分析称,出行平台的全链路AI数据能力已在自动驾驶领域获得验证,这成为其向具身智能扩展的基础。
