全球首个人形机器人格斗赛落幕:拳打脚踢你来我往 就是“大脑”还不好使
全球首个人形机器人格斗赛落幕:拳打脚踢你来我往 就是“大脑”还不好使
全球首个人形机器人格斗赛落幕:拳打脚踢你来我往 就是“大脑”还不好使《科创板日报》5月26日讯(记者 黄心怡)“左右勾拳、侧踢(tī)、膝(xī)踢、闪避(shǎnbì)、跌倒起身,被KO……”一场机器人之间的格斗比赛在昨晚开打。
在这场于杭州举行的《CMG世界机器(jīqì)人大赛·系列赛》机甲格斗(gédòu)擂台赛上,宇树科技以合作方身份参赛,上场的机器人均为宇树 G1人形机器人,而内嵌算法则由四个比赛团队自研,并进行现场的手柄操控(cāokòng)。经过几轮(jǐlún)比拼,黑队"AI策算师"最终夺得冠军。
“这次比赛(bǐsài)的格斗动作,采集(cǎijí)自外部专业人员,用来给AI模型提供学习参考。”宇树科技相关负责人向《科创板日报》介绍。
在此次(cǐcì)比赛过程中,机器人暴露了仍存在动态控制、感知不足(bùzú)等问题,也展现出较强的平衡控制、人机协同能力。
多名业内人士对《科创板日报》表示,从格斗过程来看,机器人底层算法已经较为出色,但缺少真正的(de)空间智能大模型作为机器人的大脑。为了更(gèng)好地在实际应用落地,后续(hòuxù)产业链或将涌现更多二次开发的机器人解决方案(jiějuéfāngàn)商,在公版机器人基础上开发专业的大脑。
▍拳脚相加!机器人遭(zāo)重击后5秒起身
《科创板日报》注意到(dào),在相互出拳、踢腿的格斗过程中,参赛机器人能通过步伐的调整来保持(bǎochí)自身的平衡。在被击中后,机器人也能迅速起身。“虽然格斗效果一般,摔倒爬起来的灵活性把我(wǒ)惊呆了,支撑力拉满。”有(yǒu)观众表示。
“机器人倒地(dǎodì)五秒内马上能起来,重心不稳的情况下能调整身形维持平衡,这两点让我印象较为深刻。” 快思慢想研究院院长、上海交通大学计算法学与AI伦理研究中心(zhōngxīn)联席主任田丰表示,“两足机器人的动态平衡(dòngtàipínghéng)性要比四足难得多。机器狗的重心只需要落在(zài)4个脚组成的矩形(jǔxíng)内就行,支撑的面积大。而两足人形(rénxíng)机器人的重心需要落在两足的连线内。”
据悉(jùxī),宇树(yǔshù)G1机器人在对抗中保持平衡,主要依赖于仿真环境的(de)AI强化学习和本体关节的感知。通过对大量平衡数据的学习和模拟训练,机器人不断优化自身的平衡控制策略,同时本体关节的高精度传感器能够实时感知身体各部位的姿态和受力情况(qíngkuàng),为平衡控制提供关键(guānjiàn)数据。
宇树科技相关负责人向《科创板日报》介绍,IMU(惯性测量单元)在机器人保持平衡中(zhōng)发挥着重要(zhòngyào)作用,在仿真训练中同样不可或缺。IMU可以实时监测机器人的姿态、加速度等(děng)信息。
值得一提的(de)是,此次参赛的宇树科技G1手臂进行(jìnxíng)了定制化设计,拥有7个自由度,比常规的5个自由度多出两个,目的是在格斗(gédòu)中进行更灵活的招式变化(biànhuà),如勾拳、摆拳、上勾拳等拳击动作中的手腕调整,增加攻击的角度和灵活性。
上述人员介绍,G1格斗模式的训练难度一是在于瞬间爆发力要求高(gāo),需要(xūyào)机器人具备强大的动力系统来提供足够的扭矩,以实现快速动作(dòngzuò)响应。二是(èrshì)对控制算法精准度和稳定性要求高,控制算法要实时处理大量(dàliàng)传感器数据,精确计算身体各部位的运动轨迹与发力时机,实现对多关节(guānjié)、重心、姿态毫秒级的精准控制,保证动作既有力又不失协调。三是机械(jīxiè)结构强度要求高,在进行该动作时,机器人的机械结构需要承受较大的冲击力,对关节、骨骼等(děng)结构的强度和稳定性提出了很高的要求。
▍人机协同为主,操作员(cāozuòyuán)手柄遥控机器人对战
G1机器人(jīqìrén)操控方式(fāngshì)包括AI语音操控、手柄操控、体感操控,各有优缺点。而(ér)本次比赛中主要采用现场人员进行手柄操作的方式。在比赛过程中,可以看到操作员在一旁控制机器人进行格斗。
宇树科技相关负责人对(duì)此解释(jiěshì)道(dào),AI语音操控(cāokòng)响应延迟比较明显,影响对机器人的实时控制。手柄操控让参赛者更直观、更精准地操控机器人,也更易于(yìyú)上手,有利于扩大参赛者范围。而体感操控在沉浸感上更具潜力,宇树已经开发了一套体感人形机器人控制系统,后续的比赛应该就可以给参赛者使用。
中国信通院泰尔系统实验室副总工程师刘泰(liútài)介绍,对机器人进行手柄(shǒubǐng)操控,与日常普通的遥控玩具,存在一定的区别。人形机器人其背后是(shì)一整套的大模型、运动控制模型的算法支撑,实际上是在通过这些算法来(lái)进行操控。
“采用传统的控制方法很(hěn)难让它站得(dé)住走得稳,现在通过(tōngguò)强化学习的训练方式,让它往能够站得平衡的方式由自己去探索。整体的比赛非常振奋,它的表现可以说比以往更进了一步,能够看到机器人在对抗比较强的情况下,也能够保持很好的稳定性,包括全身的运动机构(jīgòu)协调(xiétiáo),是科技进步和产业进步很好的结合。” 刘泰提到。
田丰认为,“在暂时还不能实现(shíxiàn)通用人工智能AGI的(de)前提下,能否通过人机协同来达到比较好的效果,是当前业内探索的方向。而这场比赛也展现了一定的成果(chéngguǒ),这也是很有价值的。”
▍实时感知仍存困境 机器人大脑待(dài)突破
不过,由人类遥控操作的(de)机器人(jīqìrén)也存在比赛失误的情况。比如选择主动攻击对手,不当心扑空后,导致参赛机器人失去稳定性倒地,被对手“KO”。机器人想要后退来调整对战(duìzhàn)角度,却意外被擂台的围绳给缠住,需要人类来解绑等等。这其实暴露了机器人动态运动控制与实时(shíshí)感知(gǎnzhī)的不足。
“这就涉及到一个(gè)问题,机器人是否要完成仿真人类的形态。比如人背后没有长眼睛,但机器人后背是否应该设置摄像头,让(ràng)机器人扩大感知(gǎnzhī)范围。再比如人只有5个手指,但有些工业(gōngyè)场景可能6个手指会更好。人形机器人可能只是一个过渡阶段,未来可能会发展出(chū)超越人形的机器人形态。” 田丰表示。
一名观赛的业内人士(yènèirénshì)认为,从格斗过程来看,底层算法已经较为出色(chūsè),包括稳定性、视觉、灵活性、速度连贯性等,目前缺少的是真正的空间智能大(dà)模型作为机器人的大脑。
田丰表示(biǎoshì),从中美(měi)来看,在机器人大脑(dànǎo)的投入是美国的比例更大些。“国内企业大部分都在做机器人本体(běntǐ),有一些机器人企业在做小脑,也就是运动控制系统。做机器人大脑的企业大概在1/20的比例。不过,已经有一些机器人企业正在进行大脑研发。”
从产业链来看,田丰(tiánfēng)认为(rènwéi)业内更多的(de)关注焦点在于整机厂商,以及电机(diànjī)等硬件层面,而大(dà)脑也是通用型的基础性大脑。“但机器人整机其实需要软件二次开发,才能更好地在实际应用。比如面向格斗、工厂、物流等场景进行二次开发。后续产业链会涌现这类的机器人解决方案(jiějuéfāngàn)商,在公版机器人基础上开发专业的大脑。这就涉及到多模态大模型,以及RAG知识库进行融合。”
(科创板日报(rìbào)记者 黄心怡)
《科创板日报》5月26日讯(记者 黄心怡)“左右勾拳、侧踢(tī)、膝(xī)踢、闪避(shǎnbì)、跌倒起身,被KO……”一场机器人之间的格斗比赛在昨晚开打。
在这场于杭州举行的《CMG世界机器(jīqì)人大赛·系列赛》机甲格斗(gédòu)擂台赛上,宇树科技以合作方身份参赛,上场的机器人均为宇树 G1人形机器人,而内嵌算法则由四个比赛团队自研,并进行现场的手柄操控(cāokòng)。经过几轮(jǐlún)比拼,黑队"AI策算师"最终夺得冠军。

“这次比赛(bǐsài)的格斗动作,采集(cǎijí)自外部专业人员,用来给AI模型提供学习参考。”宇树科技相关负责人向《科创板日报》介绍。
在此次(cǐcì)比赛过程中,机器人暴露了仍存在动态控制、感知不足(bùzú)等问题,也展现出较强的平衡控制、人机协同能力。
多名业内人士对《科创板日报》表示,从格斗过程来看,机器人底层算法已经较为出色,但缺少真正的(de)空间智能大模型作为机器人的大脑。为了更(gèng)好地在实际应用落地,后续(hòuxù)产业链或将涌现更多二次开发的机器人解决方案(jiějuéfāngàn)商,在公版机器人基础上开发专业的大脑。
▍拳脚相加!机器人遭(zāo)重击后5秒起身
《科创板日报》注意到(dào),在相互出拳、踢腿的格斗过程中,参赛机器人能通过步伐的调整来保持(bǎochí)自身的平衡。在被击中后,机器人也能迅速起身。“虽然格斗效果一般,摔倒爬起来的灵活性把我(wǒ)惊呆了,支撑力拉满。”有(yǒu)观众表示。
“机器人倒地(dǎodì)五秒内马上能起来,重心不稳的情况下能调整身形维持平衡,这两点让我印象较为深刻。” 快思慢想研究院院长、上海交通大学计算法学与AI伦理研究中心(zhōngxīn)联席主任田丰表示,“两足机器人的动态平衡(dòngtàipínghéng)性要比四足难得多。机器狗的重心只需要落在(zài)4个脚组成的矩形(jǔxíng)内就行,支撑的面积大。而两足人形(rénxíng)机器人的重心需要落在两足的连线内。”

据悉(jùxī),宇树(yǔshù)G1机器人在对抗中保持平衡,主要依赖于仿真环境的(de)AI强化学习和本体关节的感知。通过对大量平衡数据的学习和模拟训练,机器人不断优化自身的平衡控制策略,同时本体关节的高精度传感器能够实时感知身体各部位的姿态和受力情况(qíngkuàng),为平衡控制提供关键(guānjiàn)数据。
宇树科技相关负责人向《科创板日报》介绍,IMU(惯性测量单元)在机器人保持平衡中(zhōng)发挥着重要(zhòngyào)作用,在仿真训练中同样不可或缺。IMU可以实时监测机器人的姿态、加速度等(děng)信息。
值得一提的(de)是,此次参赛的宇树科技G1手臂进行(jìnxíng)了定制化设计,拥有7个自由度,比常规的5个自由度多出两个,目的是在格斗(gédòu)中进行更灵活的招式变化(biànhuà),如勾拳、摆拳、上勾拳等拳击动作中的手腕调整,增加攻击的角度和灵活性。
上述人员介绍,G1格斗模式的训练难度一是在于瞬间爆发力要求高(gāo),需要(xūyào)机器人具备强大的动力系统来提供足够的扭矩,以实现快速动作(dòngzuò)响应。二是(èrshì)对控制算法精准度和稳定性要求高,控制算法要实时处理大量(dàliàng)传感器数据,精确计算身体各部位的运动轨迹与发力时机,实现对多关节(guānjié)、重心、姿态毫秒级的精准控制,保证动作既有力又不失协调。三是机械(jīxiè)结构强度要求高,在进行该动作时,机器人的机械结构需要承受较大的冲击力,对关节、骨骼等(děng)结构的强度和稳定性提出了很高的要求。
▍人机协同为主,操作员(cāozuòyuán)手柄遥控机器人对战
G1机器人(jīqìrén)操控方式(fāngshì)包括AI语音操控、手柄操控、体感操控,各有优缺点。而(ér)本次比赛中主要采用现场人员进行手柄操作的方式。在比赛过程中,可以看到操作员在一旁控制机器人进行格斗。
宇树科技相关负责人对(duì)此解释(jiěshì)道(dào),AI语音操控(cāokòng)响应延迟比较明显,影响对机器人的实时控制。手柄操控让参赛者更直观、更精准地操控机器人,也更易于(yìyú)上手,有利于扩大参赛者范围。而体感操控在沉浸感上更具潜力,宇树已经开发了一套体感人形机器人控制系统,后续的比赛应该就可以给参赛者使用。
中国信通院泰尔系统实验室副总工程师刘泰(liútài)介绍,对机器人进行手柄(shǒubǐng)操控,与日常普通的遥控玩具,存在一定的区别。人形机器人其背后是(shì)一整套的大模型、运动控制模型的算法支撑,实际上是在通过这些算法来(lái)进行操控。
“采用传统的控制方法很(hěn)难让它站得(dé)住走得稳,现在通过(tōngguò)强化学习的训练方式,让它往能够站得平衡的方式由自己去探索。整体的比赛非常振奋,它的表现可以说比以往更进了一步,能够看到机器人在对抗比较强的情况下,也能够保持很好的稳定性,包括全身的运动机构(jīgòu)协调(xiétiáo),是科技进步和产业进步很好的结合。” 刘泰提到。
田丰认为,“在暂时还不能实现(shíxiàn)通用人工智能AGI的(de)前提下,能否通过人机协同来达到比较好的效果,是当前业内探索的方向。而这场比赛也展现了一定的成果(chéngguǒ),这也是很有价值的。”
▍实时感知仍存困境 机器人大脑待(dài)突破
不过,由人类遥控操作的(de)机器人(jīqìrén)也存在比赛失误的情况。比如选择主动攻击对手,不当心扑空后,导致参赛机器人失去稳定性倒地,被对手“KO”。机器人想要后退来调整对战(duìzhàn)角度,却意外被擂台的围绳给缠住,需要人类来解绑等等。这其实暴露了机器人动态运动控制与实时(shíshí)感知(gǎnzhī)的不足。
“这就涉及到一个(gè)问题,机器人是否要完成仿真人类的形态。比如人背后没有长眼睛,但机器人后背是否应该设置摄像头,让(ràng)机器人扩大感知(gǎnzhī)范围。再比如人只有5个手指,但有些工业(gōngyè)场景可能6个手指会更好。人形机器人可能只是一个过渡阶段,未来可能会发展出(chū)超越人形的机器人形态。” 田丰表示。
一名观赛的业内人士(yènèirénshì)认为,从格斗过程来看,底层算法已经较为出色(chūsè),包括稳定性、视觉、灵活性、速度连贯性等,目前缺少的是真正的空间智能大(dà)模型作为机器人的大脑。
田丰表示(biǎoshì),从中美(měi)来看,在机器人大脑(dànǎo)的投入是美国的比例更大些。“国内企业大部分都在做机器人本体(běntǐ),有一些机器人企业在做小脑,也就是运动控制系统。做机器人大脑的企业大概在1/20的比例。不过,已经有一些机器人企业正在进行大脑研发。”
从产业链来看,田丰(tiánfēng)认为(rènwéi)业内更多的(de)关注焦点在于整机厂商,以及电机(diànjī)等硬件层面,而大(dà)脑也是通用型的基础性大脑。“但机器人整机其实需要软件二次开发,才能更好地在实际应用。比如面向格斗、工厂、物流等场景进行二次开发。后续产业链会涌现这类的机器人解决方案(jiějuéfāngàn)商,在公版机器人基础上开发专业的大脑。这就涉及到多模态大模型,以及RAG知识库进行融合。”
(科创板日报(rìbào)记者 黄心怡)
相关推荐
评论列表
暂无评论,快抢沙发吧~
你 发表评论:
欢迎