第17届中国高端家电趋势发布暨红顶奖颁奖盛典速记实录(4)

2025-12-19 15:07   来源:中国家电网   

  “千帆竞发,百舸争流”,此时此刻,我们看到了家电行业的蓬勃生机!当AI不再是冰冷的算法,而是拥有“身体”的智能体,我们的生活将发生怎样的颠覆?有请清华大学自动化系长聘副教授莫一林先生,带我们探析具身智能的无限可能!掌声有请!

https://upload.cheaa.com/2025/1219/1766125627507

  莫一林:尊敬的各位嘉宾,大家下午好!

  我是清华大学自动化系的长聘副教授莫一林。我目前也在做一个机器人和具身智能相关的创业项目,我们有一个公司叫做灵御智能,可能现在还是一个比较小的公司,后面也请大家有机会可以帮我们关注一下。今天特别感谢家电协会可以给我这个机会,和大家分享一下我们最近在机器人和具身智能领域的一些简单思考。

  其实我今天看到,前面的很多这些,包括家电等等这些东西,其实里面都是逐渐在走向智能化,包括刚才张斌所长也讲到,中国在智能化方面实际上现在是走在世界的前列的。大家可能对智能现在听得比较多,比如像ChatGPT等等,大家都说人工智能。当然,具身智能可能不是所有人都了解,“具身”到底是一个什么意思?其实这个词在英文里面叫做Embodied Intelligence,具身的意思就是我们平时看到智能大部分是在一个虚拟世界里面,比如您跟大模型,比如DeepSeek也好,千问也好,或者是国外一些大模型去对话,对话完全是在虚拟的电脑的空间里面发生的。具身意思就是我们要给这些智能体赋予身体,我们希望它有一个物理的实体,可以跟我们物理的现实的世界进行真正的交互。

  事实上大家就会发现,今年具身智能提得非常多,包括这个东西实际上也写到了“十五五”的这些规划里面,大家也可以看到,国外比如像特斯拉,或者像Figure这些发布的视频,国内也有很多,比如今年年初春节晚会上,宇树表演了一个转手帕的机器人,4月份在北京马拉松比赛,我们看到很多机器人能够完成半马的跑步,后面还有世界机器人的运动会等等,大家可以看到,有很多机器人越来越多地走进了我们的生活当中。

  我可以给大家看一下,就是具身智能其实我们觉得在最近有一些标志性的事件,比如说,在2019年Open AI,现在这个也是一个非常热门的领域,就是灵巧手,因为我们知道人的手是非常复杂的,我们算下来大概有21个关节,包括手上有非常好的感受器,这是灵巧手做的一个机器手,当时要100万美元一只,可以完成机器手单手拧魔方的这样一个任务。2020年这个是ETH,瑞士苏黎世理工完成了一个机器狗,用学习的方法可以在非常复杂的地形行走的这样一个任务。当然,现在大家可以看到,我们国家比如像宇树等等这些机器狗也能够做到非常好了。

  后面比如像这个是2021年英伟达提供了一套机器人的训练场,当然这个训练场是完全虚拟的,这里面每一个红色的都是一只机器狗,可以同时有上万只机器狗在这个训练场里面进行加速的训练。到2023年Google第一次提出了VLA模型,第一次把语言这个东西融入到了机器人当中,大家可以看一下,这是Google大概在5、6月份发布的它的一个视频,就是我们会看到,机器人可以完成一系列的操作,包括装配、擦拭、抓放等等这样的一个任务。这个也是最近Google在做的一个事情。

  但是,事实上我们会发现很多这些东西都有很多差强人意的情况,很多人问我,什么时候可以用机器人养老了?我觉得目标还比较遥远。这是非常先进的一大类机器人,但是是比较开放,把它失败的一些场景都给放出来了。比如像叠衣服的视频,其实它做了一个15倍的加速,但事实上这个衣服一直也没有展开,也就是说,没有进入到下一步。包括后面做一个打包的工作,最后也失败了。这个是目前做得比较好的,就是一个成功率比较高的,大家可以看到,它是在做一个叠手绢,号称可以达到99.4%的成功率,可以24小时运作。但是,我们也可以看到,现在手绢本身是相对一致的,所有手绢都长得一样,如果给它一个长方形的手绢可能就会失败掉,这是现在的情况。

  我们其实就是在思考,像现在所说的智能的机器人,或者说具身智能,它和之前的比如机器人,或者像大家关心的,其实在家电行业也有很多,比如扫地机器人,我们也可以叫机器人,其实机器人是一个很广的概念,中文里面有机器人这个词,但是英文里面Robot这个词可以涵盖非常多的东西。

  具身智能,就是什么样的一个机器人我们就认为是一个智能机器人,而不是一个扫地机器人,你可能觉得它不是那么智能。我们觉得至少有三件事情:一个是我希望它能完成各式各样的任务,我希望它不是一个单纯只能给我扫地,它可以做很多很多的,比如说,所有的家务事情都做了,这是它非常通用。然后,我希望它有很高的效率,我希望它完成这件事情非常可靠,非常快。另外,我希望整个过程当中不需要有人的介入,它自己就给我干完了。但是,现实是我们有大量的专用的机器人,比如大家家里的扫地机器人,完成的是一个特殊的任务,它就只能去扫地,但是干得很快,很好,而且这个过程现在几乎也不需要您去介入了。比如如果您要请一个用人,人是通用的,干得很快很好,但是是需要有一个人来干,并不是机器自主完成的工作,当然我们理想当中机器人应该是一个无所不能的机器人。

  事实上我们如果去看一下,就是一个在具身智能大家觉得非常类似的例子,其实是自动驾驶。大家今天可能会觉得说自动驾驶其实我们买到的车大部分都有L2级别的自动驾驶。但是,L4级别的自动驾驶实际上现在也在国内刚刚试点,比如武汉有萝卜快跑,也是在做一个试点。但是,大家可能很难想象,在2007年的时候,当时的自动驾驶已经可以达到当时在美国的凤凰城,当时自动驾驶已经可以达到4个小时无人接管,在城市道路上没有出现任何事故,没有出现任何交通违规这样的行驶。

  所以,事实上自动驾驶从2007年到现在落地L4级别的自动驾驶依然是很难落地的。所以,我们觉得距离我们达到一个完美的机器人,也就是一个在完成通用的任务时非常高效,非常自主的机器人,可能这是一个比较漫长的事情。

  其实,其实我们也可以看到,自动驾驶相对于机器人来说还是一个很简单的问题,因为自动驾驶的核心就在于它不需要也不能够和周围的环境产生交互。所以,比如说,路上有一个车,这个车是一个大卡车也好,是一个小汽车也好,您是永远不能撞它的。这个车比如我撞它,到底它会被撞飞,还是我会被撞飞,这件事情对于自动驾驶来说是不需要考虑的。但是,对于一个家用机器人,或者具身智能机器人必须要和这个世界产生交互,拿起一个东西,这个东西是软的还是硬的,应该用多大的力拿起它,这个东西是滑的还是涩的,这些都会影响我的交互逻辑。所以,机器人相比自动驾驶可能是一个更难的问题,这个事情可能需要花费更长的时间,这些具体的我就不再讲了。

  事实上我觉得还有一个问题,就是今天我们并没有考虑得特别好的,就是我们到底如何和机器人产生一个交互。大家可能希望,比如你有一间很乱的屋子,跟机器人说,把这个屋子给我收拾好,机器人就自动把这件事情做了。但是,你可以想象,机器人最后把这个房间收拾的形式跟您希望的形式是很难一样的,比如您可能希望这个东西摆在这个地方,另外一个东西摆在一个您顺手的地方。但是,如果您让机器人去做,机器人可能很难去知道这个事情。本质上的问题可能就是您告诉机器人的信息太少了。

  因为我是做一些理论的,所以我们可以讲一个非常简单的例子,就是我们经常说“书不尽言,言不尽意”,就是我告诉机器人,比如把这个屋子收拾了,因为我说这句话太简单,话里面包含的信息并不够多。所以,机器人可能很难完美地把这些事情都做到。如何找到一个和机器人更好的交互方式?

  比如说,像我们现在其实很多是基于对话的,比如我们跟大语言模型,更多是基于对话的交互方式,这种交互方式和机器人交互是否合理?我觉得其实这个也是值得探讨的。因为很多时候比如说像您如果用DeepSeek,让它给您写一篇文章,如果写出来您不满意,您可以说再重写一遍,因为虚拟世界当中它做的所有东西其实某种程度上来说是没有成本的。但是,如果我让机器人帮我做一件事情,做得不满意,比如这个过程当中它把什么东西弄洒了,我并不能简单地说,把之前的东西给回退掉,然后你再重新开始做,因为你所做的任何东西在现实当中都会有物理的影响。所以,这个就会产生非常多的,就是如何让机器人按照我们的想法去执行我们给它的任务,同时又让它有充分的自主,这个里面其实是有很多的矛盾的。

  回到今天的主题,其实我当时跟吕老师说,我们对具身智能实际上有一些我们自己的思考,如何达到完美的机器人,既通用,又高性能,又非常自主。我们觉得现在有几条不同的路线。比如说,我们看到像Google这些,他们更多的可能是在一个纯粹自主的机器人上追求更加通用,能够完成更多的任务,能够具有更多的性能。实际上我觉得还有一些其他路线,比如说,像我们说的从通用到专用的方案,事实上我觉得像今天,包括颁奖的各个获奖的产品,我觉得其实都是一个类似的想法。就是我现在已经有了一个非常好的,比如这边我有一个非常好的扫地机器人,这个其实是我从网上找到的,应该是石头的一个产品。我有一个非常好的扫地机器人,这个机器人只能扫地,我如果给它加上一个小小的机械臂,也许它就能够把一些地上的东西捡起来,也许它就能干更多的事情。比如像我们今天的厨师机也好,微波炉也好,可以给它增加一些额外的智能的东西,就希望它在原来干单一事情干得非常好,非常自主的情况下,能够让它更进一步成为一个通才,这个是其中的一个很好的通向完美机器人的一个方式。但是,这个可能就是各位在座的,大家做得非常好。

  其实从我们学校角度,包括从我们在做的这个公司的角度来说,我们其实在考虑另外一条路线,就是更像自动驾驶的路线,实际上大家去看,比如特斯拉也好,或者国内这些自动驾驶的厂家也好,其实它走的更多是从L2到L4的这样一个过渡路线,就是从纯粹人去驾驶这个车,到机器和人共同驾驶这个车,到最后机器完全接管,这样一个路线我觉得会是一个比较渐进的路线,我不需要上来造出一台完美的机器,或者造出一辆完美的车,或者自己开自己的车才能上路。

  这是我们公司做的一些机器人在做的一些事情。左边这个是我们做了一个机械臂,我们做一些柔顺,也就是它是一个柔软的机械臂,不会把您的东西打坏。比如我们这个地方展示的是写一个粉笔字,这个粉笔字需要以一定的力量把笔摁下去,这两个例子都是机器人有一个人在远程操控的。我们最近也是参加了中关村的一个具身智能的比赛,人类操作的机器人的比赛的赛道里面,我们是获得了7项,所有的7个冠军都是我们拿到的,大家可以稍微看一下,比如有一些家庭服务的场景,我们可以做一些桌面清理等等这些任务。当然,这些任务事实上背后都是有人在做一些远程操控。但是,我们希望通过这种方式,可以比较快地实现机器人的落地,比如像您的家里或者说一个社区里可能会摆着一台机器人,这台机器人可能时不时地会有人接入帮您做一些劳动。

  这是一个垃圾分拣的场景,这是工业上的一个装配的场景。

  这是我们的一个想法,就是能不能通过远程遥控的方式,来实现一个我在真实世界当中采集数据,这个其实就跟自动驾驶非常像,就是我的机器人可能是我的车在自动驾驶的情况下,我可能首先人开车,或者人开着机器人来采集数据,逐渐实现机器人的自主驾驶,并且这个过程当中我可能能够通过远程遥控来实现一些商业的价值。像我们现在其实考虑了很多,比如说,如果你遥控得很差,像一个人遥控一个机器的场景,事实上已经有一些高危的场景,一些会有爆炸物的场景等等,这些场景机器人是可以得到应用的。随着自主性提高,我们可以类似于像萝卜快跑这样的模式,就是多台车背后可能有一个操作员接管这个车,就可以实现一人多机的场景。

  总结一下,整体而言,我们觉得具身智能的目标非常明确,我们希望实现一个通用、高效,且自主的机器人。但是,如何实现这件事情,有各个不同的探索,因为现在整个行业,包括中国大家对智能都有一个非常狂热的追逐,但是具身智能现在的确面临着非常多的问题,我觉得若干条技术路线都是可能的。但是,我们从公司的角度来说,或者从我个人的角度来说,我觉得可能一条像自动驾驶一样,从L0到L2,再到L4的路线是一条可行的路线。

  我今天的演讲就到这里,谢谢各位!

上一页 1 23456...10下一页 在本页阅读全文

官方微信

TOP