从世界杯夺冠到中关村论坛舞台:加速进化人形机器人两年迭代
哨声响起,记分牌停在9:0,加速进化人形机器人T1捧起RoboCup德国公开赛成人组决赛冠军奖杯,程昊圆了这场始于清华火神队的冠军梦。
RoboCup有着“机器人世界杯”之称,清华火神队由赵明国创立,参赛多年,成员来自他的机器人实验室。清华自动化系出身的程昊曾是第三任队长,学生时期带领团队斩获人形组TeenSize季军的经历,既是他机器人梦想的起点,也成为萦绕心头的遗憾。
毕业后的职业轨迹看似偏离初心:程昊创办了“朝夕日历”,经历字节跳动收购后出任飞书产品副总裁。但2023年ChatGPT3.0的技术突破让他敏锐捕捉到关键拐点,大模型的涌现能力与机器人运动控制的结合,正在重构具身智能的底层逻辑。程昊意识到,大模型给人形机器人创造的机会与此前历史上的任何时刻都不一样。“通用AI已经出现,而且会发展成多模态,对物理世界有感知和影响,需要新的硬件载体。”
这一嗅觉让程昊于2023年8月创办了加速进化,并召集许多火神队前队员担任研发人员,并邀请自己的老师赵明国担任首席科学家加入。大约一年后,加速进化第一个人形机器人产品T1“出世”,印证了他的前瞻判断。
T1一“出生”几乎立刻“回”到程昊熟悉的足球赛场上。这位生于北京、长于北京的创业青年,决心要从踢球场景做起,逐步实现人形机器人的智能泛化。
“机器人的强化学习和小朋友学走路类似,从会爬到站起来走路,从走得踉踉跄跄到走得稳当,再到上斜坡、台阶,甚至蹦跳。只是在虚拟世界中,数台机器人训练几小时相当于人类的10年。”程昊告诉贝壳财经记者。
“皮实”耐摔、“灵活”起身
T1二度“出征”机器人世界杯夺冠
3月,在RoboCup德国公开赛成人组决赛中,加速进化T1以蓝色方身份迎战东道主德国Sweaty。赛场上,一台位于前方的T1似乎“预判”了对手的封锁路线,绕开比自己高出一个头的红色方,先一步碰到了球,并射门得分。这场对决比分最终锁定在9:0,清华火神队零封夺冠。
程昊刷新了自己的参赛纪录。2024年7月,约时隔14年后,他再次以清华火神队的名义重新回到RoboCup赛场。与学生时代相比,程昊不再只是机器人开发者,从实验室到竞技场,他完成了认知范式的关键跃迁。
2024年,T1还无法坚持“踢”完整场比赛。许多机器人因为关节发热而“瘸腿”、摔倒。在与其他机器人发生撞击时,甚至出现主控与关节间通信断开的情况,整台机器人因此断电、宕机。“坏了得马上换一台”,程昊为一场2V2比赛准备了10台机器人,最终还是败给了冠军美国队。
首战未问鼎,程昊并不气馁。“身高不够技术凑,统治球场不是梦!”赛后,这句话作为T1座右铭,写进加速进化微信公众号总结文章里。
“机器人的塑料胸壳、头壳遇到磕碰后会开裂。”这让程昊很头疼。优化材料,继续实验,不下几十次的试错,甚至用到了10-20公斤的球,从两米高空摔下,终于程昊在一片废墟中找到“皮实”耐摔的材料。程昊将它们配比融入电机、减速器齿轮、轴承、支架等部件中,T1拥有了新“皮肤”。
球场竞技难免摩擦碰撞不断,为了让主控在摔跤后的高震动状态下依然能稳定工作、不掉电,程昊优化了嵌入式硬件的设计,专门开发了震动和跌落测试装备。这套装备能够以每秒两次峰值力的频率进行撞击,持续20个小时。“每批次关节中,我们会抽取几个进行测试,如果它们能在20个小时撞击后不损坏,才算达到要求。”
机器人遭撞击后如何迅速起身?为此,程昊不断迭代起身算法。原先T1要花费10秒才能起身,现在能做到一秒起身,成功率也从50%逼近100%。
在一次实验中,6台T1彼此进行3V3比赛,连续“踢”20场球下来,关节大多没有出现损坏,也不需要“替补”救场。实验过后信心满满,T1再次“回归”RoboCup赛场,变得“皮实”耐摔,“灵活”起身,一举拿下冠军杯。
反观大多参赛者(机器人)还是经不起碰撞,为此,赛事还一度临时调整规则,从允许一定撞击改为禁止撞击。
首登中关村论坛舞台
原地起身、做俯卧撑技惊四座
T1于2024年8月正式揭开面纱。程昊表示在北京市政府的支持下,这款承载尖端技术的智能设备迅速晋升为一枚“城市科技名片”——频繁作为“门面”出席国际盛会大显身手,还将入驻水立方等标志性场馆,通过高规格机器人赛事实现技术迭代升级。
去年10月,T1开始量产出货,并在今年3月初完成了第一百台交付,标志着T1正式步入产业化快车道。
今年3月的中关村论坛,成为其技术实力的展示舞台。T1首次“参加”中关村论坛,加速进化一次调度十几台机器联袂登场,一部分登上开幕式舞台,表演俯卧撑、原地起身,另一部分站在主论坛门口迎宾,在分论坛上扮演主持人,或在展厅里踢足球,通过集群协同作业完美呈现人工智能的群体智慧。
从技术层面来看,T1在机器人“双腿”上采用了强化学习的运动控制算法。数万台机器人同时在仿真数据环境里训练,“走过”台阶、斜坡、光滑地面、粗糙路面等各类环境。程昊告诉贝壳财经记者,“机器人的强化学习和小朋友学走路类似,从会爬到站起来走路,从走得踉踉跄跄到走得稳当,再到上斜坡、台阶,甚至蹦跳。只是在虚拟世界中,数台机器人训练几小时相当于人类的10年。”
程昊介绍指出,机器人学习也有奖惩机制,“只不过模型比较复杂”。训练表现好的结果模型才有机会部署到真机上,通过一系列算法减小从仿真到真实环境的差距。“我们现在的运动控制算法不只是控制腿,而是希望控制全身关节一起动,例如做出大力射门的动作。这需要引入模仿学习算法,让机器人在仿真环境里模仿火柴人,再通过强化学习巩固。”
“从足球场景做起安全也相对经济”
具身智能大模型仍有不足但属行业“未来”
程昊爱踢球,他的机器人也踢球。
“机器人踢足球是一个高效实验的场景。”程昊认为,机器人踢足球需要视觉能力,除了识别自己的场地位置,还要识别球、球门等物品。同时也需要决策能力,判断自己是前锋、中场,还是后卫,“做的事情会不同”。并且,还要随着对方机器人的移动,不断调整决策、打新配合。机器人踢足球还强调运动控制,对行走、转弯、射门、起身等运动能力要求高。“就像足球运动员一样,素质比较综合。”
在程昊眼中,足球与生活场景对一些感知、决策底层算法的要求相通,例如物体识别、跟踪、定位,决策上的避障能力等。他认为,“从足球场景做起不用太担心安全问题,也相对经济。”
“通过机器人踢足球,以点带面推动我们不停研究新的运动控制、感知、决策算法。”虽然程昊认为目前的具身智能大模型还存在不足,但它属于行业未来的方向。
程昊在北京长大,清华本硕毕业,创业、入职大厂,都没离开过北京。“我觉得在北京创业更容易做成、做大,人力、场地成本可能贵些,团队需要做出更好的收入、融资。”2024年,加速进化拿到由中关村科学城与其他机构共同出资的Pre-A轮融资。北京基座模型企业数量、人才密度、场景支持,也让他对未来有所信心。
他比较相信马斯克说的人形机器人会达到百亿台,同时多种机型存在,“工厂、公司有,家庭也有”,但这可能需要10年、20年。程昊记得小时候小区第一台电脑价值一万元,“当时小区一套房也是一万元”。
但曾与楼房等价的电脑如今已不再高不可攀,写字楼里响起此起彼伏的键盘声,连楼下便利店都能用电脑结账,人形机器人未来或许也能像《克拉拉与太阳》所写,待在街边橱窗里,等待乔西将自己领回家。
0人