券商观点|人形机器人系列十七：自动驾驶端到端技术对人形大模型的启示

2025-02-10 07:14:32 来源：同花顺iNews

　　 2025年2月9日，广发证券发布了一篇通用设备行业的研究报告，报告指出，自动驾驶端到端技术对人形大模型的启示。

　　报告具体内容如下：

　　核心观点：再回首，人形机器人大模型进展几何？回望2024年，以特斯拉为代表的多家业界厂商均放出了搭载大模型的人形机器人展示，整体智能化水平、运控能力大幅提升，部分产品已经可以实现特定场景下的实训。在大模型路线选择上，VLM和VLA两大路线的争议仍存，两条路线均有学业界进展。我们认为目前VLM+基础模型在短期落地的可能性更大，而通用性水平更强的VLA模型或在未来成为主要模型架构。参考自动驾驶领域，端到端技术为机器人带来了通用性曙光。参考端到端大模型在自动驾驶领域的成功，端到端技术有望成为人形机器人突破通用性限制的核心技术。尽管对比在自动驾驶领域的成功基因，端到端技术迁移于人形机器人会面临一些难点，但我们认为，长期来看端到端技术在人形机器人领域会遵循“基础模型→VLA”的路径发展，首先赋能灵巧手等特定基础模型，再逐步渗透到各个底层运控模型，直至帮助人形机器人实现全身VLA一体化端到端大模型，满足通用化要求。

对比自动驾驶，人形机器人领域实现端到端大模型的成功迁移依旧存在几大难点：（1）机器人端到端大模型结构更复杂，面临模型准确率和实时性的矛盾难点；（2）高质量训练数据是探索端到端的大山；（3）对本地化部署的算力需求更高；（4）黑盒训练带来模型纠偏和监管压力。

训练端数据的获取或成为潜在瓶颈。海量的优质训练数据是具身智能涌现的基础。根据特斯拉24Q4业绩会，马斯克预估人形机器人在用途和复杂度上可能是自动驾驶汽车的1000倍，其训练数据的需求可能至少在自动驾驶的10倍以上。我们认为短期人工示教的真实数据价值更高，能够促使人形机器人在特定场景落地；中长期结合实际场景反馈的数据和仿真模拟技术的成熟，海量虚拟数据的积累能够促使VLA一体化模型的训练成为可能，最终帮助人形机器人实现应用场景全覆盖。

投资建议。动作捕捉设备是获取机器人真实训练数据的关键设备，机器人对于数据需求量大，场景多，动捕的需求空间大，是边际变化较大的新增板块。根据凌云光全资子公司元客视界公众号，元客视界动作捕捉设备合作宇树科技，通过FZMotion光学运动捕捉系统将人体骨骼数据直接映射到宇树H1机器人构型并驱动本体，高精度采集机器人本体的姿态和运动轨迹真值，优化任务策略和控制算法。动作捕捉设备板块建议关注凌云光、奥飞娱乐（002292）。

风险提示。人形机器人产品落地不及预期；国产厂商早期未必能进入特斯拉供应链；核心技术的迭代风险。

　　声明：本文引用第三方机构发布报告信息源，并不保证数据的实时性、准确性和完整性，数据仅供参考，据此交易，风险自担。

关注同花顺财经（ths518），获取更多机会

0人

24小时播报>>

我的自选股自选股新闻

代码\|股票名称	最新	涨跌幅

券商观点|人形机器人系列十七：自动驾驶端到端技术对人形大模型的启示

网站地图