【AI视野·今日Robot 机器人论文速览 第三十二期】Wed, 20 Apr 2022
时间:2022-09-20 18:00:01
AI视野·今日CS.Robotics 机器人论文速读
Wed, 20 Apr 2022
Totally 11 papers
??上期速览?更精彩请移动主页
Daily Robotics Papers
A Thin Format Vision-Based Tactile Sensor with A Micro Lens Array (MLA) Authors Xia Chen, Guanlan Zhang, Michael Yu Wang, Hongyu Yu 为了实现高空间分辨率和与机器学习算法的兼容性,基于视觉的触觉传感器在机器人领域得到了广泛的研究。但目前使用的传感器成像系统体积庞大,限制了其进一步应用。在此,我们提出了一个基于微透镜阵列的基础 MLA 视觉系统,实现传感器封装的低厚度格式,具有高触觉传感性能。多个微加工微透镜单元覆盖整个弹性触摸层,提供清晰的缝合触觉图像,实现高空间分辨率,厚度仅为 5 毫米。热回流和软光刻法保证了球面轮廓均匀,表面光滑。 |
Interventional Behavior Prediction: Avoiding Overly Confident Anticipation in Interactive Prediction Authors Chen Tang, Wei Zhan, Masayoshi Tomizuka 预测条件行为 CBP 为连贯的交互式预测和规划框架奠定基础,在交互式场景中实现更有效、更少保守的操作。在 CBP 在任务中,我们训练了一个类似于目标代理未来轨迹的预测模型,其条件是指定的自我代理未来轨迹。然而,我们认为 CBP 对自主代理如何影响目标代理的行为提供过度自信的预期。因此,规划者查询 CBP 模型有风险。相反,我们应该将规划轨迹视为模型学习干预下的轨迹分布的干预。我们称之为介入行为预测 IBP 任务。此外,为了正确评估离线数据集 IBP 我们提出了一个基于模型的基础 Shapley 值的度量来证明预测模型是否满足介入分布的固有时间独立性。 |
Learning Forward Dynamics Model and Informed Trajectory Sampler for Safe Quadruped Navigation Authors Yunho Kim, Chanyoung Kim, Jemin Hwangbo 对于各种复杂环境下的独立四足机器人导航,是典型的SOTA该系统由四个主模块组成mapper、global planner、local planner和command tracking controller分层组成。在本文中,我们建立了一个强大而安全的局部规划器,旨在生成一个速度计划,以跟踪整体规划器的粗略规划路径。以往的工作采用基于航路点的方法,如比例微分控制和纯跟踪,将路径跟踪问题简化为局部目标导航。然而,它们经常在复杂和狭窄的几何环境中发生碰撞,有两个原因:粗略和不准确的模型,以及当地规划师无法完全跟踪整体规划。目前,由于能更准确地从经验中学习安全性和路径可行性,深度学习方法是一种吸引人的替代方法。然而,现有的深度学习方法无法长期规划。在这项工作中,我们提出了一个由三个创新元素组成的基于学习的完全独立导航框架:学习前动力学模型 FDM、模型预测控制器和基于在线采样的知识轨迹采样器 ITS。与基线方法相比,四足机器人可以在不碰撞的情况下独立导航,并生成更平滑的命令计划。另外,我们的方法可以反应地处理计划路径上的意外障碍,避免它们。 |
Multi-UAV Collision Avoidance using Multi-Agent Reinforcement Learning with Counterfactual Credit Assignment Authors Shuangyao Huang, Haibo Zhang, Zhiyi Huang 多无人机避免碰撞是无人机组应用的一项具有挑战性的任务,因为它需要组成员之间的密切合作来规划无碰撞路径。多智能体强化学习中的集中训练和分散执行 CTDE 这是一种非常有前途的多无人机防撞方法,关键挑战是有效学习分散策略,可以协调最大化全局奖励。我们提出了一种新的多智能体评论演员学习计划,称为 MACA,避免无人机群碰撞。 MACA 利用集中的批评者来最大限度地考虑安全和能源效率的全球折扣,并利用每个无人机参与者来找到分散的策略来避免碰撞。为了解决 CTDE 在信用分配问题上,我们设计了一反事实基线,将代理的状态和行动边缘化,以评估代理在联合观察行动空间中的重要性。训练和评估 MACA,我们设计了自己的模拟环境 MACAEnv 密切模仿无人机组的真实行为。 |
Multimodal Proximity and Visuotactile Sensing With a Selectively Transmissive Soft Membrane Authors Jessica Yin, Gregory M. Campbell, James Pikul, Mark Yim 在机器人感知系统中发现的最常见的传感方法是视觉和触觉,它们可以提供全局和高度本地化的数据。然而,当目标对象从与终端执行器的静态和控制接触过渡到动态和不受控制的运动时,这些传感方法通常无法在关键时刻充分捕捉目标对象的行为。在这项工作中,我们提出了一种新型的多模式视觉触觉传感器,可以同时提供视觉触觉和接近深度数据。集成了一个传感器 RGB 相机和气压传感器感应接触,红外飞行时间 ToF 相机通过选择性透射软膜感应接近度,实现双重感应模式。介绍了机械设计、制造技术、算法实现和评价传感器的触觉和接近模式。该传感器在三个开环机器人任务中演示了接近和接触物体、捕获和投掷。 |
INFOrmation Prioritization through EmPOWERment in Visual Model-Based RL Authors Homanga Bharadhwaj, Mohammad Babaeizadeh, Dumitru Erhan, Sergey Levine 为处理复杂的视觉观察而设计的基于模型的强化学习 RL 算法通常会显式或隐式地学习某种潜在状态表示。该标准方法旨在平等地表达所有可用信息,而不区分状态的功能相关方面和不相关的干扰因素。基于模型的我们 RL 结合互信息最大化,提出了修改后的目标,允许我们以明确优先考虑功能相关因素的方式学习视觉模型 RL 不需要重建的表达和动态。我们设计背后的关键原则是将受变分授权启发的术语集成到基于相互信息的状态空间模型中。该术语优先考虑与行动相关的信息,以确保功能相关的因素首先被捕获。此外,同样的授权也促进了 RL 在这个过程中更快的探索,特别是对于不足以驱动早期学习探索的稀疏奖励任务。 |
Learning to Retrieve Relevant Experiences for Motion Planning Authors Constantinos Chamzas, Aedan Cullen, Anshumali Shrivastva, Lydia E. Kavraki 最近的工作表明,通过从数据库中检索过去的经验,可以显着提高运动规划器的性能。通常,使用在运动规划问题上定义的相似性函数来查询经验数据库以查找过去的相似问题。然而,迄今为止,大多数作品都依赖于简单的手工相似函数,并且无法在其相应的训练数据集之外进行泛化。为了解决这个限制,我们提出了 FIRE,这是一个提取规划问题的局部表示并学习它们的相似性函数的框架。为了生成训练数据,我们引入了一种新颖的自我监督方法,该方法从过去的解决方案路径中识别相似和不同的局部基元对。使用这些对,使用对比损失来训练 Siamese 网络,并在网络的潜在空间中实现相似函数。我们在 8 DOF 机械手上评估五类感知环境的运动规划问题中的 FIRE。 |
Designing an AI-Based Adaptive Controller Augmented with a System Identifier for a Micro-Class Robot Equipped with a Vibrating Actuator Authors AmirReza BabaAhmadi, Nima Naseri 在本文中,设计了一种基于神经网络的自适应控制方案,以保证配备振动执行器并遵循滑杆运动原理的微型机器人的期望行为。有两个微型振动电机已用于运行微型机器人系统。通过考虑基座的弹簧系数来表示动态建模方程。之后,研究了弹簧对地基的影响。除了设计基于神经的控制器外,还开发了基于 AI 的系统识别器,以帮助控制器更新其参数并实现其预期目标。使用这种方法,模拟了这个微型机器人运动的几个特定路径。 |
KANT: A tool for Grounding and Knowledge Management Authors Miguel . Gonz lez Santamarta, Francisco J. Rodr guez Lera, Francisco Mart n, Camino Fern ndez, Vicente Matell n 智能机器人社区通常将知识组织成符号和子符号级别。这两个层次在其符号系统字典的基础上,建立了一套用于操作知识的符号和规则。因此,对应关系接地或知识表示需要特定的软件技术来锚定这两个级别之间的连续和离散状态变量。本文介绍了一种名为 KANT 知识管理的开源工具的设计和评估,让系统架构的不同组件控制机器人查询、保存、编辑和删除知识库中的数据,而不必担心类型和源数据的实现。使用 KANT,管理子符号信息的组件可以顺利地与符号组件交互。 |
Training and Evaluation of Deep Policies using Reinforcement Learning and Generative Models Authors Ali Ghadirzadeh, Petra Poklukar, Karol Arndt, Chelsea Finn, Ville Kyrki, Danica Kragic, M rten Bj rkman 我们提出了一个数据有效的框架来解决顺序决策问题,该框架利用了强化学习 RL 和潜在变量生成模型的结合。该框架称为 GenRL,通过引入动作潜在变量来训练深度策略,这样前馈策略搜索可以分为两部分:训练一个子策略,在给定系统状态的情况下输出动作潜在变量的分布, ii 生成模型的无监督训练,该模型输出以潜在动作变量为条件的一系列运动动作。 GenRL 能够安全探索并缓解数据效率低下的问题,因为它利用了有关有效运动动作序列的先验知识。此外,我们提供了一组评估生成模型的措施,以便我们能够在物理机器人的实际训练之前预测 RL 策略训练的性能。我们通过实验确定了生成模型的特征,这些特征对射击曲棍球和投掷篮球的两项机器人任务的最终策略训练的性能影响最大。 |
Spot the Difference: A Novel Task for Embodied Agents in Changing Environments Authors Federico Landi, Roberto Bigazzi, Marcella Cornia, Silvia Cascianelli, Lorenzo Baraldi, Rita Cucchiara 具身人工智能是最近的一个研究领域,旨在创建可以在环境中移动和操作的智能代理。该领域的现有方法要求智能体在全新和未探索的场景中行动。但是,此设置与需要在同一环境中执行多个任务的实际用例相去甚远。即使环境随时间发生变化,代理仍然可以依靠其关于场景的全局知识,同时尝试使其内部表示适应环境的当前状态。为了朝着这个设置迈出一步,我们提出了 Spot the Difference 一项针对具体 AI 的新任务,其中代理可以访问过时的环境地图,并且需要在固定的时间预算内恢复正确的布局。为此,我们从现有的 3D 空间数据集开始收集一个新的占用地图数据集,并为单个环境生成许多可能的布局。该数据集可以在流行的 Habitat 模拟器中使用,并且完全符合在导航期间使用重建的占用地图的现有方法。此外,我们提出了一种探索策略,可以利用先前的环境知识,比现有代理更快、更有效地识别场景中的变化。 |
Chinese Abs From Machine Translation |
Papers from arxiv.org
更多精彩请移步主页
pic from pexels.com