大家好,我叫郭人杰。很荣幸今天在这里参加AWE高峰论坛,跟大家分享一下我们自己的一些见解和想法,因为我们公司是2024年12月刚成立,到现在一年三个月时间,我们一直在做机器人产品,也跟大家探讨一些关于人类跟机器人关系的一些思考,也是最近社会上比较火热的一个话题。

乐享科技创始人兼CEO 郭人杰
首先介绍一下我自己,我是15岁考上现代化少年班,我跳过了高中阶段,一开始学能源动力工程,研究生在学过经济学,所以工科和经济学比较复合的背景,所以我一开始就很想做创业这件事情,所以在前三年半的时间我在追觅科技担任了中国区的总裁,我们把追觅从一个可能刚刚转型为品牌的一家公司,做到了中国第一的清洁电器的品牌。2024年12月我们也成立,今年1月份在CES发布了我们全新的产品,从全尺寸的人形机器人,到50厘米的人形机器人,主要是针对家庭室内的场景,到履带式的户外的机器人,主要是针对家庭和室外的场景,目前是这三个产品系列。我们今天主要在推荐的,还是今天50厘米的室内的人形,因为我们的这是进入家庭的前提,过往一年融了三轮融资,我们整体还是在非常认真的去做这样一个好的产品。
我们对于机器人的理解和大家稍有不同,我们看到机器人从今天大家普遍讨论的工具,我们希望它跟人的关系成为一种共生的关系。为什么?是因为今天所有人在讨论机器人其实都在讨论一件事,就是效率、成本如何替代人类进入工厂。这个我觉得放在历史上来讲,是一个非常狭窄的历史史观,是因为我们今天处在工业时代,所以我们今天大量的讨论存在于工厂的交互,存在于我们跟流水线的交互。
但是实际上今天机器人我们回溯历史,中国有句古话“太阳底下无心事”,我们可以回溯历史去看机器人并不仅仅只是在今天才发生的,其实是在非常非常多年以前就已经出现了,能解决今天社会上大家一个非常大的讨论,在于说为什么要把机器人做成人形。大家可能会有非常多的理由,比如说物理世界是基于人建造的等等之类的,但我们认为真正的理由在哪?我们就去找了一下,我们认为说今天机器人可能还有另外一个存在的可能性,我们从历史中去看,3000年前在《列子·偃师》里面,是今天可能有史以来第一次在世界范围内记录人形机器人,那个时候《列子·偃师》做了一款木制的人形机器人。到了2000年前古希腊做了一款青铜人形机器人,那个时候大家做机器人都是做人形,但是那个时候的人形机器人并不是用来给人打工,或者给人洗衣服、刷碗,或者是进流水线,那个甚至没有工厂,为什么大家都做人形?后来我们发现了一个非常重要的结论,在于说大家做人形本质上是在做一个更好的自己。
其实每一个时代我们都会对自己的局限性有一些思考,比如说我们希望自己跑的更快、负载更大、作业不停等等之类的。因为我们对这个自然对这个宇宙有很多的想象,但是我们今天这个人本身,我们的时间可能一天只有24小时,我们还得睡起码4个小时等等之类的,有相对多的局限。但是今天一个机器人说不定呢,所以我们每一个时代都是用最好的材料,去做一个我们想要的人形机器人,为什么是人形?本质上是构建更好的自然,当我们构建更好的自然的时候我们一定去构建了一个人形,这个是我们看向浩瀚的历史的时候,可能得出来的结论跟今天不太一样。
所以我们认为当你在创造一个自己的时候,首先是代表了你自己,其次应该在某一个点比你更强,所以每一个人都会机会做出一个属于自己不一样的机器人的时候,大家做出来的东西应该是千奇百怪,完全不同的。最后我们相信机器人跟自己是彼此创造的过程,而不是互相取代竞争的过程。
怎么去做这件事?我们看向长期,如果要保持自己是消费级具身智能长期引领者,我们大概布了六个技术点,分别是:大脑、VLA、电机、本体结构、情绪识别模型、机械臂、灵巧手。这六个技术点上我们都找今天全球最优秀的科学家,因为本质上今天的AI竞争可能是中国的中国人和美国的中国人在竞争,所以我们在中国和硅谷分别布局了最好的科学家,带领一个小的团队,在六个技术点上做攻坚,因为我们认为在六个技术点上只要我们形成突破,我们永远都会做出最好的消费级具身智能,这个是我们对于技术本身的敬畏和思考。
第二环今天如果在这个基础上,今天在世界上遇到瓶颈我们怎么办?我们就自己去突破它。比如说今天我们要做家庭里面的具身智能,我们要让它足够小、足够轻盈,我们认为安全是前提。我们认为一个机器人如果超过8公斤进入家庭可能就会伤害到家庭的时候,我们看向今天所有市面上的电机可能不符合我们的需要,那怎么办?我们就找世界上最好的团队攻克这个需求,当我们把电机做小的时候,我们用当年做过无人机电机的团队,配合做过传统电机的团队把电机小型化,做出了世界上最轻、最小、最高扭矩的高扭矩电机。
这个是前面对技术上的理解,第二环是说怎么做出一个满足用户需要的产品?我们以前做过扫地机器人,扫地机器人从2015年、2016年惯性导航,就是撞上墙随机一个角度回来。那个时候其实没有办法扫全屋,因为路径是不规划的,因为全部都是通过惯性。那个时候我们把L级别的自动驾驶放进去,把激光雷达和SLAM放进去,那个时候L级别自动驾驶在路上还并不成熟,因为还是会有磕碰,但是一旦放到家里可以随意磕碰。我们只是加一个弹簧挡板把这个力吸收掉,所以不会伤害到家具和本体,那它就变成了一个可以工作的机器人。因为有L级别的自动驾驶所以它可以扫全屋了,所以我们一直有一个非常重要的理念在于说用可工程化的高位技术去解决具体的需求。
我们今天就看,机器人这个行业到底有哪两项技术成熟了?第一个是移动能力,以宇树科技为代表的这些机器人公司,已经把小脑的移动能力发挥到了极致,大家也看到春晚了。所以移动能力本身带来了全屋覆盖性,以前比如说扫描机的形态或者小球的形态,可能没有办法覆盖全屋,到了槛可能就卡住了,地下空间可能进不去等等之类的。但今天一个人形机器人可以在全屋很容易的行走,所以这是移动能力。第二个是交互能力,本质上多模态能力。今天当我们有音频、视频对环境的理解的时候,我可以做对人情绪的理解,对环境的识别和长期的记忆,这件事情可能是一线在AI时代来临之前没有办法做到的。今天移动能力跟交互能力会带来什么?我们怎么去定义我们自己的机器人?
首先,移动能力全屋覆盖能力带来了硬件终端的集成,在机器人形态出现之前,很多产品平台可能是没有办法真正的覆盖全屋。但是今天人形机器人出现之后,全屋移动起来之后,变成了一个首先移动摄像头可以带来全屋的安防,比如说以前做老人的跌倒监测,我们可能通过摄像头做,首先我们得装很多个才能覆盖全屋,其次老人不一定接受觉得可能像个监狱。今天一个移动的机器人里面带有摄像头的时候,可以通过激光雷达去跟随老人,但对老人来讲本质上是个交互,本质上是个陪伴,但对孩子来说可能就是一种安全守护。第二个是移动小音响,大家全屋任意地方的控制和全屋的陪伴。第三个比如说移动的闹钟,带来生活的提醒,移动的拍摄带来宠物全天候的记录剪辑和高光时刻的筛选,让大家在摸鱼看猫的时候变得更简单,所以移动能力其实带来了硬件终端的集成。
第二个是交互能力,以前所有的交互能力被局限于音响那种,或者简单嵌套一个模型。今天我们基于模型建造一个架构是说把情绪的理解、环境的识别、长期的记忆架构在一起,所以用户可以不断关联什么事情让你开心,什么事情让你不开心。这个机器人在了解清楚这些内容之后,它就可以长期做到跟你真正的反馈,不断的了解你的情绪给到你真正具体的反馈,这是我们强调说一个人级别的陪伴。
给大家看一眼机器人眼里的人是什么样子的,每一秒对机器人读取人的情绪,不论你是平静、开心等等之类的,每一秒都在变化,因为每一秒你的表情在变化,把你的情绪跟你的记忆相关联,跟你身边的环境相关联,什么事情让你开心了,什么事情让你不开心了,所以我长期可以越来越懂你,就是可以让你在不开心的时候被激励,让你在开心的时候得到更多正向的反馈,是因为我在不断记忆里什么事情是跟你情绪的关联,以及我们也可以做物体跟环境的识别,所以我们会长期关联环境。这个事情是我们今天第一个在世界上架构的模型,就是从情绪理解、环境记忆到长期记忆的这么一套模型。
尤其是我们今天不仅仅能用到一个人,我们可以用到家里的五个人。当机器人在你家运转的时候,你家五口人的情绪和环境的关联度都是能够发生的,这个是我们今天在做的第二件事情——交互能力。
移动能力跟交互能力本身的叠加会带来第三件事情——主动交互,这件事情是我们觉得会改变时代的事情,今天为止所有的硬件其实都是被动交互的,手机、电脑、ipad、音箱所有的东西都是你找它,你不找它,它不会主动向你触发。但今天一个机器人的交互方式大不一样,它会来找你。比如我们给老人写回忆录,因为我们在家里给老人做了守护和安全的场景,以前写回忆录这个APP怎么用?老人打开手机跟这个回忆录去交流,今天这个机器人会像前一个视频一样识别老人的情绪,如果看到老人五分钟都很无聊,会主动过来跟老人聊天,触发我自己的功能,比如我会问女儿出生的那天什么感受,老人开始讲,然后机器人自动开始记录,后续帮他总结。所以主动交互我们人会改变一切的硬件交互的方式,就像手机今天因为交互所以它有了AppStore,今天没有AppStore的时候,手机本质上就是打电话、发短信、上网。但有了APP每一个手机都变得不一样了,今天我们的机器人如果没有agent的时候,它可能就是一个移动的监控、移动的安防、移动的拍摄,对于宠物、小孩全屋的生活记录,但是有了agent可能会不一样。比如说我们给老人写回忆录、提醒吃药、聊康养,给小孩做角色扮演、心理健康监测,给宠物我们接口语翻译器,听懂狗的说话实时给它反馈等等之类的,所以每一个人都会下载不一样的agent去适配于自己的应用,这个是我们今天在未来看到最大的机会,就是我们看到诞生一个新的agent store的机会,本质上适配于今天的硬件不一样的交互方式,所以我们叫做它Zero Land,因为我们今天的品牌叫Zeroth。
为什么我最后收敛到前面的移动能力和交互能力之后我们做成了一个50厘米尺寸的机器人?就是因为我们探索了很久之后发现,进入家庭机器人一定有三个前提:一是安全,如果我们今天的机器人会伤害到家里的任何一个成员,包括宠物的时候,其实可能它没有办法长期在家里运转。二是全自动,今天起码需要做的像扫地机器人一样,自主的定位避障导航、运转回去充电,而不是让人去服务它,而不像今天的大部分机器人需要遥控器去控制一样。三是解决具体哪怕一个需求,不然进入家庭很快会变成一个玩具,因为你不解决具体需求,最后纯是情感陪伴的时候,它的替代品太多了,比如还有抖音。起码解决一个需求,无论是老人的看护,还是孩子的生活记录,还是宠物的远程陪伴等等之类的。
这三个前提让我们带来说,最后局限在了50厘米,2.8公斤作为我们的第一代产品。我们今天针对三方人群,第一个老人,老人的看护、陪伴、跌倒监测、吃药提醒、聊康养等。第二个是孩子,我们希望对他做陪伴和教育,包括我们在全球市场今年会完全的打开。第三个是宠物,针对宠物远程的比如说人不在家时候的陪伴交互,甚至能听懂它的对话,然后给它一些反馈,然后远程的逗猫逗狗,生活记录,记录它的一天,然后筛选高光时刻,因为我们本质上可以通过激光雷达跟随宠物,一直跟宠物在一起去做交互,这个是目前我们的三个主要的人群。但我们在探寻的里面发现还有非常多的空间,比如说一些独居的女生,每天晚上可能跟它吐槽,我们把这个模型调到非常温馨的形式,大家也会得到非常多情绪的慰藉,所以我们最近在做大量的内测,我们产品会在4月底上线,我们做大量的用户内测里面发现找到一个agent store非常大的能量,在于说其实每一个人对于一个家庭移动的机器人终端是有非常多的想象的,今天我们也在一代代的满足大家的想象,打磨我们自己最后的产品。
我们现在只有三个理念:
第一,在绝对0-1的事情里面,今天具身智能怎么走进家庭,怎么成为一个消费级的具身智能是没有人知道怎么做的,所以我们一定要高速迭代,在用户端的高速迭代,而不是闭门造车,我今天还跟公司开玩笑,我们连觉都不睡我们能不能打造出一个有生活的产品?那是不可能的,我们必须得要在用户端找到价值。
第二,赚钱养梦想。今天所有的资本都是一起来一起走,今天大家看好这个赛道无非是大家认为具身智能会成为下一个终端,最终最长期的路径,一定是我们要自己形成规模和利润,去供养自己长期的发展。
第三,技术领先,场景先行。就像前面汇报的一样在六个技术点上都招了全球最好的,包括今天全球估值最高的两家具身智能公司前十号员工都在我们公司担任各自板块的负责人,就是因为我们要找全球最好的这些科学家,无论是中国的华人还是美国的华人,最后我们去构建一个足够好的技术团队去向前攻坚,同时我们要把握住足够好的场景,因为我们认为到具身智能的壁垒跟今天传统的硬件还会有一个巨大的不同,在于今天我换手机,我只要把聊天记录跟图片能够迁移,我就能够换一个手机,但是今天换机器人未来起码是换保姆级别的难度,因为我跟它已经聊了非常多的我的喜怒哀乐,我的生活习惯之外你让我直接换掉它,哪怕今天是一个apple的机器人我也会掂量三分,我觉得这件事情是把握住场景的重要性。
分享两个是我们自己对于长期的思考,过往一段经历做追觅,我们最大的坚信,就是上一代的硬科技企业500强企业,研发在美国,供应链在中国,品牌在欧洲,大家可以回忆设计师、血统等等的。但是今天我们认为,新一代的500强硬科技公司一定是研发急速回到中国,五年前我们就是这么判断的,那个时候我们看到手机、电动汽车、无人机等等,我们相信扫地机器人作为一个复杂硬件一定会回到中国,因为我们有最高质量和最高数量的工程师。
五年之后我们看到这个趋势是势不可挡的,无论是3D打印机、运动相机,包括扫地机器人,包括具身智能,都急速的在中国发生。本质上就是我们有最高质量和最高数量的工程师。其次是我们供应链本身就在中国,第三个是品牌,这个是随着大势的逆转,就是今天中国文化、中国自信的输出,包括泡泡玛特这样一些现象级的产品,给到我们包括我们自己做科技行业的这些从业者一样的信心,今天我们让追觅也成为世界第一的扫地机器人品牌,我相信未来具身智能这个品牌一定会诞生在中国,因为本质上品牌只是人对人生活方式的向往,当我们今天供给了今天的国家和大众最好的生活的时候,我们一定会成为被向往的品牌。这就是今天世界上在发生的事情。
我们今天为什么相信我们会有机会成为一家世界级伟大的硬件公司?是因为我们看向过往两个时代的硬件,比如说手机、电动汽车、电脑,其实都诞生了MAGA7级别的公司,是世界上最高估值的七家公司之一,因为谁能让这个硬件千家万户的普及,谁就能成为真正的硬件的规模和利润的王者,今天下一个时代当我们相信是具身智能的时候,具身智能本质上是硬件和AI高度结合的产品,首先需要硬件的载体,这家公司大概率会诞生在工作,我每天在公司问的就是说如果在具身智能行业会诞生一家MAGA7的公司,而他一定是一家消费级的具身智能,为什么不能是我们?这个是我们在公司每天扪心自问的问题。
最后,我们去想中国科技到今天第四代的发展,第一代是一件衬衫换飞机的时代,就是我们做不出跟他一样东西的时候,我们用市场换了技术。第二代的时候,我们的很多前辈那些大家电品牌,那个时候我们做出了一样的东西,但是我们没有品牌的时候我们打了性价比。第三代我们看到华为、大疆、追觅、石头等等这些公司脱颖而出,其实我们都做出了更好的东西,技术跟产品我们要成为全球化卖的最贵,最高端的品牌,大家也纷纷成了各个行业的领导者。
这个过程里面还有品牌的逆转,今天我对这个世界的理解非常简单,200年前人家喝咖啡你种地的时候你总向往别人的生活,向往别人生活的时候,你拿着同样一瓶水,你都会觉得别人的水比你高级,这就是农夫山泉卖1块,依云卖10块的故事。但今天,我那个时候从英国回来,我最大的感受就是今天其实中国已经过上了中产阶级最好的生活,这件事在未来的两三年肯定大家就会意识到,我在那里真的很难生活。今天事实上过往两三年就发生了这件事情,我们也形成了全球化品牌的根基,是因为大家在羡慕我们的生活。
今天在这个浪潮里面,其实越来越多的中国科技品牌坚持着把自己的品牌走向了全球,成为了最高端的科技品牌。但我们认为这还是不够,因为在第三代的时候里面有个非常大的关键词在于好是被提前定义过的,就是我们做的比别人更好了,我们在技术、在产品上做的更好了,好本身是存在的,今天第四代中国的创业者,无论是我们95后,还是00后的创业者我们要怎么去做?我们认为我们要定义什么叫好,是说今天我们一定要做出原创性的创新,做出世界上最好的东西,而那个好是没有发生的,所以今天消费级具身智能怎么做,没有人知道。没有人知道消费级具身智能怎么做,具身智能怎么走进家庭,我们就敢于去投最多的技术,做最多的产品形态,不断的跟用户端打磨我们要探索什么是最好的产品,定义什么叫好,做原创性的创新,这个是无论今天大家看到具身智能,还是新的AI硬件,还是大量AI agent,甚至基座模型上,为什么大家有了这么多新的创新的涌现,本质上新一代的中国创业者在探索什么是好,这件事情也是我们自己把它当作己任的非常重要的一个使命和愿景。
我们自己给自己叫Zeroth的原因,就是我们希望开创这个行业,在所有的具身智能今天还在那么大,在科研端摸索的时候,在全球第一个进入消费级,进入家庭,进入跟人的交互成为可能,所以我们自己的slogan叫做“遇见,无限”很感谢大家听我对这个事情的分享跟探索,我们的产品大概会在4月底上线,我们也在京东上了我们自己的预售,大家可以去了解我们的产品,我觉得我们自己的产品可能还是今天世界上非常独特的能进入家庭的具身智能产品,大概是这些,感谢大家。
备注:速记文本未经演讲者本人确认