企业微信
悟空CRM  >   公司新闻  >  听到去野餐就蹦蹦跳跳,谷歌用大模型教机器狗听懂模糊指令

听到去野餐就蹦蹦跳跳,谷歌用大模型教机器狗听懂模糊指令

悟空软件 阅读次数:948 次浏览

说一句「我们去野餐吧!」,机器狗竟高兴得蹦蹦跳跳;告诉它地面非常热,机器狗会一路小跑。难道机器狗能「听懂」人话了?某种程度上说确实如此。近日,谷歌研究博客介绍了 DeepMind 入选机器人学习会议 CoRL 2023 的一篇论文,其中提出的 SayTap 方法使用了大型语言模型,可将自然语言指令转译成四足机器人的低层控制信号,而且这些指令可以相当模糊。

人类和四足机器人之间简单有效的交互是创造能干的智能助理机器人的途径,其昭示着这样一个未来:技术以超乎我们想象的方式改善我们的生活。对于这样的人类-机器人交互系统,关键是让四足机器人有能力响应自然语言指令。

近来大型语言模型(LLM)发展迅速,已经展现出了执行高层规划的潜力。然而,对 LLM 来说,理解低层指令依然很难,比如关节角度目标或电机扭矩,尤其是对于本身就不稳定、必需高频控制信号的足式机器人。因此,大多数现有工作都会假设已为 LLM 提供了决定机器人行为的高层 API,而这就从根本上限制了系统的表现能力。

在 CoRL 2023 论文《SayTap: Language to Quadrupedal Locomotion》中,谷歌 DeepMind 与东京大学提出了一种新方法,该方法使用足部接触模式作为连接人类的自然语言指令与输出低层命令的运动控制器的桥梁。

论文地址:https://arxiv.org/abs/2306.07580

项目网站:https://saytap.github.io/

 

足部接触模式(foot contact pattern)是指四足智能体在移动时足放在地上的顺序和方式。他们基于此开发出了一种交互式四足机器人系统,让用户可以灵活地制定不同的运动行为,比如用户可以使用简单的语言命令机器人走、跑、跳或执行其它动作。

他们的贡献包括一种 LLM prompt 设计、一个奖励函数和一种能让 SayTap 控制器使用可行的接触模式分布的方法。

研究表明 SayTap 控制器能够实现多种运动模式,并且这些能力还能迁移用于真实机器人硬件。

SayTap 方法

SayTap 方法使用了一种接触模式模板,该模板是一个由 0 和 1 构成的 4 X T 矩阵,其中 0 表示智能体的脚在空中,1 表示脚落在地面。从上至下,该矩阵的每一行分别给出了左前足(FL)、右前足(FR)、左后足(RL)、右后足(RR)的足部接触模式。SayTap 的控制频率为 50 Hz,即每个 0 或 1 持续 0.02 秒。这项研究将所需足部接触模式定义为一个大小为 L_w、形状为 4 X L_w 的循环滑动窗口。该滑动窗口会从接触模式模板提取四足的接地标志,其指示了在时间 t + 1 和 t + L_w 之间机器人足是在地面还是在空中。下图给出了 SayTap 方法的概况。

听到去野餐就蹦蹦跳跳,谷歌用大模型教机器狗听懂模糊指令

SayTap 方法概述

SayTap 引入的所需足部接触模式可作为自然语言用户命令与运动控制器之间的新接口。运动控制器是用于完成主要任务的(比如遵循指定的速度)以及用于在特定时间将机器人足放在地上,以使实现的足部接触模式尽可能接近所需的接触模式。

听到去野餐就蹦蹦跳跳,谷歌用大模型教机器狗听懂模糊指令

为了做到这一点,在每个时间步骤,运动控制器以所需的足部接触模式为输入,再加上本体感官数据(如关节位置和速度)及任务相关输入(如特定于用户的速度命令)。DeepMind 使用了强化学习来训练该运动控制器,并将其表征成一个深度神经网络。在控制器的训练期间,研究者使用了一个随机生成器来采样所需的足部接触模式,然后优化策略以输出能实现所需足部接触模式的低层机器人动作。而在测试时间,则是使用 LLM 将用户指令转译成足部接触模式。

SayTap 使用足部接触模式作为连接自然语言用户指令和低层控制命令的桥梁。SayTap 既支持简单直接的指令(比如「向前慢速小跑」),也支持模糊的用户命令(比如「好消息,我们这个周末去野餐!)。通过基于强化学习的运动控制器,能让四足机器人根据命令做出反应。

 

研究表明:使用适当设计的 prompt,LLM 有能力准确地将用户命令映射到特定格式的足部接触模式模板中,即便用户命令是非结构化的或模糊的。在训练中,研究者使用随机模式生成器生成了多种接触模式模板,它们有不同的模式长度 T、基于给定步态类型 G 在一个周期内的足地接触比,使得运动控制器能够在广泛的运动模式分布上学习,获得更好的泛化能力。更多详情请参阅论文。

实验结果

使用一个仅包含三种常见足部接触模式上下文样本的简单 prompt,LLM 可将各种人类命令准确地转译成接触模式,甚至泛化用于那些没有明确指定机器人应当如何行为的情况。

SayTap prompt 简洁紧凑,包含四个组分:

(1) 用于描述 LLM 应完成的任务的一般性说明;(2) 步态定义,用于提醒 LLM 关注有关四足步态的基本知识以及它们与情绪的关联;(3) 输出格式定义(4) 演示示例,让 LLM 学习在上下文中的情况。

研究者还设定了五种速度,让机器人可以前进或后退、快速或慢速、或保持不动。

遵循简单和直接的命令

下面的动图展示了 SayTap 成功执行直接清晰命令的示例。尽管某些命令并不包含在三个上下文示例之中,但依然可以引导 LLM 表达出其在预训练阶段学习到的内部知识,这会用到 prompt 中的「步态定义模块」,即上面 prompt 中第二个模块。

遵循非结构化或模糊的命令

但更有趣的是 SayTap 处理非结构化和模糊指令的能力。只需一点提示即可将某些步态与一般情绪印象联系起来,比如机器人在听到让其兴奋的消息(如「我们去野餐吧!」)后会上下跳跃。此外,它还能准确地呈现出场景,比如当被告知地面非常热时,机器人会快速移动,让脚尽量少接触地面。

总结和未来工作

SayTap 是一个用于四足机器人的交互式系统,其允许用户灵活地制定不同的运动行为。SayTap 引入了所需足部接触模式作为自然语言与低层控制器之间的接口。这种新接口简单直接又很灵活,此外,它既支持机器人遵循直接指令,也支持机器人遵从没有明确说明机器人行为方式的命令。

DeepMind 的研究者表示,未来一大研究方向是测试暗含特定感受的命令是否能让 LLM 输出所需步态。在上面结果的步态定义模块中,研究者提供了一个将开心情绪与跳动步态联系起来的句子。如果能提供更多信息,也许能增强 LLM 解释命令的能力,比如解读隐含的感受。在实验评估中,开心情绪与跳动步态的联系能让机器人在遵从模糊的人类指令行动时表现得充满活力。另一个有趣的未来研究方向是引入多模态输入,比如视频和音频。理论上讲,从这些信号转译而来的足部接触模式也适用于这里新提出的工作流程,并有望开创更多有趣的用例。

 

悟空CRM产品更多介绍:www.5kcrm.com

相关内容

什么是CRM系统平台?基本概念、功能、使用方法、价格、价值与部署流程

 引言嘿,大家好!今天咱们聊聊一个在现代商业环境中超级重要的工具——CRM系统平台。说白了啊,这个东西就是帮公司更好地了解和处理跟客户的各种互动,从而提高销售效率、提升服务质量的一种神器。著名的CRM系统平台为什么我们要谈论它呢?那可太有道理啦!在这个竞争激烈的时代,企业要想脱颖而出,光靠产品或服务本身是不够的,还得懂得如何用心经营与客户的每一段关系。而CRM就像是企业的私人助手一样,在
相关文章

销售CRM管理系统如何提升团队执行力?

嘿,大家好!今天咱们来聊聊一个特别实用的话题——销售CRM管理系统怎么帮助提升团队的执行力。说到这个,我得先提一提悟空CRM,这可是个挺不错的工具,用起来方便又高效,很多企业都靠它解决了不少头疼的问题呢。首先,咱们得明白一件事,就是现在的市场竞争有多激烈啊。每个公司都在想方设法提高效率、增强竞争力,而销售团队作为直接面对客户的前线部队,他们的表现直接影响着公司的业绩。这时候,一个好的CRM系统就显
相关文章

如何选择适合的CRM客户管理系统?

开始之前,咱们先聊聊CRM嗨,大家好!今天想跟你们聊聊一个在商业世界里越来越火的话题——CRM客户管理系统。你可能已经听说过这个词了,但还不太清楚它具体是干嘛的。简单来说,CRM就是帮助企业更好地管理与客户之间的关系的一种工具。听起来挺专业的吧?其实用起来还挺方便的!选择CRM时要考虑什么?那么问题来了,市面上这么多CRM系统,到底哪个比较好呢?这得看你最关心哪些方面了。首先,得看这个系统是否容易
相关文章

CRM系统的核心价值是什么?如何提升企业效率?

大家好,今天咱们聊聊一个在企业管理中越来越重要的工具——CRM系统。如果你是一个企业管理者,或者正在考虑如何优化团队效率,那你一定听说过“客户关系管理”这个词。但很多人可能还停留在“听起来很高级”的阶段,不知道它到底能带来什么价值。其实,CRM系统的核心价值并不复杂,它就像是一个“客户管家”,帮你把客户信息、销售流程、团队协作全都管起来,让企业运转更高效。而说到具体怎么选,我必须推荐一下悟空CRM
相关文章

一篇文章告诉你哪家CRM客户关系管理系统开发定制公司最好?建议收藏

一篇文章告诉你哪家CRM客户关系管理系统开发定制公司最好?在当今这个竞争激烈的商业环境中,选择一个合适的CRM(客户关系管理)系统对企业的成长至关重要。一个好的CRM不仅能帮助你更好地了解和管理你的客户,还能提高工作效率、优化业务流程,并最终推动业绩增长。那么,在众多的选择中,哪一家CRM客户关系管理系统开发定制公司是最好的呢?为什么越来越多的企业选择了悟空CRM作为他们的首选解决方案呢?一、为什
相关文章

企业客户管理系统软件:商业原理、功能与优势介绍

企业客户管理系统软件:商业原理、功能与优势介绍大家好!今天咱们来聊聊一个对现代企业发展至关重要的工具——企业客户管理系统(CRM)。在商海沉浮中,谁能更好地理解并满足客户需求,谁就能走得更远。那么,CRM系统是如何帮助我们做到这一点的呢?让我们一起来看看。商业原理:连接你我他首先得说说CRM背后的商业逻辑。简单来说,它就是一个桥梁,让企业和客户之间建立了更加紧密的联系。通过收集和分析客户的各种信息
相关文章

什么是CRM系统?它有哪些优势?

《什么是CRM系统?它有哪些优势?》嘿!各位小伙伴们大家好!在商业世界里,“客户就是上帝”,这句话你们一定不陌生吧。今天呢,咱们就来聊聊企业用来“伺候”这些“上帝”的利器——客户关系管理系统(Customer Relationship Management System),简称CRM。一、什么是CRM?在开始之前,我们得先弄清楚啥是CRM系统。其实呢,这玩意儿就像是个超级贴心的小秘书,帮着公司管理
相关文章

使用CRM系统时可能会遇到的问题及解答

使用CRM系统时可能会遇到的问题及解答嘿!大家好,我是你们的老朋友——“智慧助手”。在数字化转型的大潮下,客户关系管理系统(CRM)成为了众多企业的宠儿,它帮助企业更好地管理与客户的每一次互动,从而提高销售业绩和顾客满意度。但是,在实际操作中,难免会碰到一些棘手问题,今天咱们就来聊聊那些关于CRM系统的烦恼以及解决办法。一、如何选择合适的CRM系统?选择一款适合自己的CRM产品就像找对象一样,不能
相关文章

企业销售人员如何通过线索营销获取潜在客户?

通过线索营销获取潜在客户的策略与技巧引言:解锁销售新境界的关键钥匙——线索营销在商业竞争日益激烈的今天,如何精准地定位并吸引潜在客户成为了每个企业成功路上不可或缺的一环。线索营销,作为这一过程中的核心工具,不仅能够帮助企业识别目标市场,还能有效提高转化率和客户满意度。本文将深入探讨线索营销的基本概念、实施步骤以及关键技巧,助您解锁销售的新境界。1. 线索营销:定义与重要性△悟空CRM产品截图定义:
相关文章

推荐几款好用的客户管理软件

推荐几款好用的客户管理软件在这个数字化的时代里,选择一款合适的客户关系管理系统(CRM)对于企业来说至关重要。它不仅能够帮助你更好地了解你的客户,还能提升工作效率和业务成果。今天,我们就来聊聊几款市场上评价较高的CRM系统,并特别谈谈为什么“悟空CRM”值得被关注。悟空CRM:移动优先的设计理念首先介绍的是悟空CRM。作为国内知名的SaaS CRM厂商之一,销售易最突出的特点就是其出色的移动端体验
相关文章
最新文章

什么是CRM系统平台?基本概念、功能、使用方法、价格、价值与部署流程

 引言嘿,大家好!今天咱们聊聊一个在现代商业环境中超级重要的工具——CRM系统平台。说白了啊,这个东西就是帮公司更好地了解和处理跟客户的各种互动,从而提高销售效率、提升服务质量的一种神器。著名的CRM系统平台为什么我们要谈论它呢?那可太有道理啦!在这个竞争激烈的时代,企业要想脱颖而出,光靠产品或服务本身是不够的,还得懂得如何用心经营与客户的每一段关系。而CRM就像是企业的私人助手一样,在
最新文章

销售CRM管理系统如何提升团队执行力?

嘿,大家好!今天咱们来聊聊一个特别实用的话题——销售CRM管理系统怎么帮助提升团队的执行力。说到这个,我得先提一提悟空CRM,这可是个挺不错的工具,用起来方便又高效,很多企业都靠它解决了不少头疼的问题呢。首先,咱们得明白一件事,就是现在的市场竞争有多激烈啊。每个公司都在想方设法提高效率、增强竞争力,而销售团队作为直接面对客户的前线部队,他们的表现直接影响着公司的业绩。这时候,一个好的CRM系统就显
最新文章

如何选择适合的CRM客户管理系统?

开始之前,咱们先聊聊CRM嗨,大家好!今天想跟你们聊聊一个在商业世界里越来越火的话题——CRM客户管理系统。你可能已经听说过这个词了,但还不太清楚它具体是干嘛的。简单来说,CRM就是帮助企业更好地管理与客户之间的关系的一种工具。听起来挺专业的吧?其实用起来还挺方便的!选择CRM时要考虑什么?那么问题来了,市面上这么多CRM系统,到底哪个比较好呢?这得看你最关心哪些方面了。首先,得看这个系统是否容易
最新文章

快速注册,立即使用

仅需一分钟,立即注册悟空云。悟空CRM免费试用。
客户端下载
请您留言

悟空CRM全国免费电话:400-0812-558

提交