马斯克在 “we, robot” 发布会上展示了人形机器人 Optimus,它们能够做出多种动作,物体识别能力大幅增强。此前英伟达也宣布成立新的研究部门—“GEAR”,全称为 Generalist Embodied Agent Research(通用具身智能研究),同时与斯坦福展开联合研究。具身智能初创公司穹彻智能(Noematrix)宣布完成累计数亿元人民币的天使轮和 Pre-A 轮融资……
那么“具身智能”到底是什么呢?
随着 AI 的发展,“智能”一词已经变得不再陌生,具身(Embodied)指的是依附于真实世界的物理实体,就像人或者动物需要肉体一样,去认识世界、探索世界,并通过与环境的互动去影响世界。
进一步将“具身智能”与外在物理体(如人形机器人等)结合,就能形成服务于人类社会的具身智能体了。而具身智能体至少需要机械系统、控制系统、驱动系统、感知系统、人机交互系统和环境交互系统等 6 大系统才能实现。
因为涉及学科广、软硬件不成熟等诸多因素的限制,直到计算机视觉、自然语言处理、认知和推理、机器人学、博弈和伦理、机器学习等人工智能所涵盖学科不断发展到今天,具身智能才有了进一步系统发展的可能。
更聪明地认识世界
依靠语言大模型、视觉大模型等通用大模型,具身智能体可以理解文本,还能处理视觉信息,就像“大脑”,让它们能够更好地理解周围的世界。
区别于传统机器学习,通用大模型的发展,为具身智能体的理解力、连续决策力、人机交互能力等提供了全新的解决思路。以大语言模型为例,它可以帮助具身智能体更好理解并运用到高级语义知识,自动化地将自己的任务拆分成具体的动作,不再需要工程师或使用者一步步地指导。
最近多模态 AI 的发展也为具身智能的快速发展与落地应用提供了更多可能,通过跨模态学习,大模型能够更好地理解和处理不同类型的信息,从而提高其智能和适应能力,同时也对数据与算力提出了更高的要求。这也是青云智算产品与服务陆续服务通用大模型、互联网企业发挥出重要优势——有效提升资源使用率。
部署到一个具体环境中时,具身智能面对的是相对狭小的空间和特定的用户需求,可能需要基于通用大模型来训练并建立场景化的小模型。
对于小型场景化模型的训练,所需的算力通常远低于通用大模型,具体数量取决于模型的复杂度以及训练数据集的规模。除了自建小型 GPU 数据中心外,还可以选择云端的 AI 算力服务,特别是对于创业团队来说,这是更有性价比的方式。青云科技提供的 AI 算力云服务不仅能够提供高性能的 GPU 资源,在租户隔离及安全等方面也能充分满足数据保护等需求。
更多维地探索世界
现在普遍认为,人形智能机器人是具身智能体发展的通用形态和终极形态,这对于人类情感上可能更容易接受,除了为人类提供服务、提高生产力、节省体力,还可以在情感陪伴方面发挥重要作用。
然而这也充满了挑战性,从感知、运动控制再到行为操作,具身智能体必须更多维地探索世界,实现“智能的自动化”,就像人类的“大小脑”与躯干的配合。为了加速这一进程,提高用于控制机器人的具身智能模型的迭代与开发效率,也至关重要。
除了大规模 AI 算力支撑下的大模型训练,快速完成端侧迭代与开发,简化对外服务应用的部署也很重要。青云为具身智能的实际业务部署提供了一个全面而灵活的框架。通过云边协同架构,根据任务需求和实时负载动态调整资源分配,优化云端和边缘的资源使用。在边缘节点部署轻量级模型和推理引擎,减少对云端资源的依赖,降低延迟。
老龄化趋势加剧等现实因素已经展现出对人形智能机器人的强烈需求,现在已经有简单的可以完成帮助老年人去卫生间、辅助吃药等任务的智能设备,只是可能在精细化、广泛应用上还都有待提升。在持续演进中,机器人作为人工智能的载体,具备人类的操作能力需要相当的推理能力,对于边缘算力的系统能力要求也会持续提升,云边协同也恰恰是青云所擅长的。
马斯克曾预测机器人的数量和人类的数量至少是 1:1,人形机器人数量甚至可能会超过人类,随着具身智能的不断进步,我们离这一天的到来可能越来越近。青云期待与更多合作伙伴携手前行,探索更多创新场景,共同拥抱一个更加智能的未来。
4000520066 欢迎批评指正
All Rights Reserved 新浪公司 版权所有