能说会看懂思考,Figure01只是在秀智能?

能说会看懂思考,Figure01只是在秀智能?
2024年03月19日 15:51 元宇宙日爆

会冲咖啡,还要进宝马工厂打工的Figure01 又又又进化了!

ChatGPT成了它的“大脑”,配合神经网络,这个机器人不仅能听、会看、与人对话,还能按照人类指令完成任务。展示Figure01新技能的画面让人觉得它已经极度拟人。

进化版的这款人形机器人由FigureAI与OpenAI合作开发,demo展示迅速在科技圈炸锅, 让网友不禁感慨:机器人保姆走进千家万户的科幻场景正在照进现实。

Figure01的缔造公司也迅速获得资本的青睐。目前,FigureAI已经完成了新一轮约6.75亿美元(约合人民币48.7亿元)的融资,成了硅谷科企和资本力捧的新星。

在机器人赛道,前有波士顿动力这样的老玩家,后有马斯克力主向智能机器人公司定位的特斯拉,FigureAI刚成立了3年,为何成为估值20亿美元的新独角兽?

13天学会“听、说、看” 还能思考

仅仅训练13天,Figure01已经学会了与人类对话,执行相关任务,还能自主决策。

官方发布的demo视频充分展示了Figure01对环境的感知力以及交互能力,它甚至能完成复杂的家务劳动,递送食物、收拾碗筷、清理垃圾统统不在话下。

先来看一下Figure01令人震惊的环境感知力,也就是它的“视觉”。视频中的测试者问:“Figure01,告诉我你看到了什么?”

几秒钟后,Figure01开口说话了,并精准的描述出了眼前的景象:“我看到桌子中间有一个红苹果,沥水架上有几个盘子和一个杯子,你站在旁边,手放在桌子上。”

可以看到Figure01 近乎满分地完成了视觉测试,接下来就是与环境以及人的交互。测试者接着问:“我可以吃点东西吗?”同样,响应几秒种后Figure01回答:“当然可以。”紧接着,Figure01动作连贯地将桌子上的苹果递到了人的手中。

注意,这里埋着个细节。测试时,测试者没有直接给出食物、位置及动作等指令性信息,比如“我想吃桌子上的苹果,请递给我”,而是用了人与人交流的社交语言,以一种询问、委婉的语气,测试Figure01 是否理解。而这个机器人准确Get到了测试者的点,并从桌子上找到了唯一的食物——苹果,递给了男人。不得不说,Figure01有点懂人了。

这只是“开胃菜”,下面的测试中,你会发现Figure01 还会像人一样“思考”。

接下来,测试者一边把一筐垃圾倒在机器人面前,一边让它解释“刚才为什么这么做(给苹果)”,还要求把垃圾收拾干净。紧接着,Figure01回答“我这么做是因为苹果是我在桌上看到的唯一能吃的东西。”说话间,它也把垃圾装到了筐子里,还不忘把筐子推向测试者。

Figure01已经可以实现“边说边做”这种人类常见的行为方式了。

最后,Figure01还将杯子与盘子复归原位,并复盘评价了自己刚才所做的一切:“我觉得我做得很好,我把苹果递给了你,把垃圾丢掉了,桌上的东西也都放到了该放的地方。”测试者也表示肯定后,Figure01张开双臂:“不客气,下次有需要帮忙的,请随时告诉我。”

看完这一整套交互过程,你有没有感到惊讶?有网友惊叹,这是目前见过的在语言、动作上最智能、最像人的机器人。也有人调侃道,“波士顿动力(另一家机器人公司)只能再多编一些舞蹈动作了。”有人既遂附和,“机器人应该像这样做做家务,而不是只会花拳绣腿。”

更令人震惊的是,这些训练在13天就完成了。也就说,Figure01的行为不依赖远程操控,而是通过学习得来。

那么,到底是什么让Figure01有了“视觉”、“听觉”和“大脑”?

FigureAI 解释,Figure01的操作系统整合了OpenAI提供的视觉语言大模型(VLM),以此实现机器人对图像和语言的深度理解;而智能系统部分融合了OpenAI的视觉推理和语言理解能力。

还有一个技术也十分重要——FigureAI自家的神经网络技术,这确保了机器人动作的流畅和精确,并赋予了这款机器人前所未有的自主性。

融资6.7亿美元 FigureAI为何受资本青睐?

Figure01的进化让世界看到了机器人在家庭服务、工厂作业的潜力,创建它的机器人公司FigureAI也迅速炙手可热。

据FigureAI官方消息,今年2月底,该公司完成新一轮约6.75亿美元(约合人民币48.7亿元)的融资,估值已经不只20亿美元了,亚马逊创始人贝索斯、英伟达、微软和OpenAI等硅谷科技巨头都为FigureAI提供了资金支持。

机器人领域里,前有波士顿动力,后有马斯克定位为机器人公司的特斯拉,2021年才成立的FigureAI为何受到资本青睐、占据一席之地?

主要因为FigureAI抓住了开发人形机器人的重点需求:够实用,也够智能。

要知道,FigureAI之前,最受瞩目的机器人公司是波士顿动力,其开发的机器人Atlas也曾因“能蹦会跳”刷屏社交媒体。到现在,Atlas的“绝活儿”从滚地翻跟头进化到了空中180度转体。看完视频,有人发出了灵魂一问:这有什么用?

波士顿动力的确在不断打磨机器人的运动技能,提升平衡力。但这还处在基础研究的范畴,并没有迹象表明要把人形机器人投入到人类生活的场景中。

特斯拉开发的人形机器人“擎天柱”倒是注意到了生活场景。此前,马斯克发布的视频显示,擎天柱机器人站在桌子旁,可以灵活地叠起一件黑色衬衫。

结果没过多久,这个视频被指出存在造假嫌疑,有人从视频中看到机械臂。也就是说,擎天柱的动作可能是人为操控而做出的,并非自主智能。面对质疑,马斯克也表示,擎天柱并不如外界所想象得那么厉害。

与这两家公司不同,FigureAI一直在沿着机器人自主学习做开发,也一直在朝着协助人类生活工作的愿景发展。这从公司对Figure01的研发重点中就可见一般。前期,FigureAI的重点是机器人的手指灵活性。

我们在视频中看到“递苹果”环节,FigureAI就有意展现他家机器人灵敏的手指——Figure01用右手的大拇指、食指和中指拿起碟子上的苹果,然后递给了左手,用大拇指和食指掐住后传递给测试者。整个过程充分展示了Figure01的关节灵活度和力度控制能力。

Figure01能灵活抓取物体

这一次,Figure01展现了它对人类指令、语言的理解能力,是它作为家庭服务机器人的潜力;而此前计划投入到宝马工厂的消息,则是它可能作为工业机器人替代危险工作岗位的能力。

这些都意味着,Figure01有望快速投产、实现商业化,这对投资人来说可太重要了,不然投资的钱什么时候才能得到回报?

可以说,Figure01有机会实现Atlas和“擎天柱”目前都还没做到的事,即让机器人落地到人类生产生活的具体场景中去。

如果照着这个路线发展下去,FigureAI大概率将成为第一家把人形机器人送到家庭中的公司。对于资本来说,变现也将指日可待。

财经自媒体联盟更多自媒体作者

新浪首页 语音播报 相关新闻 返回顶部