five

ROBEL|机器人技术数据集|强化学习数据集

收藏
arXiv2019-12-16 更新2024-07-25 收录
机器人技术
强化学习
下载链接:
http://www.roboticsbenchmarks.org
下载链接
链接失效反馈
资源简介:
ROBEL是一个开源的低成本机器人平台,专为现实世界的强化学习设计。该平台由谷歌研究院和加州大学伯克利分校共同开发,包含两个机器人:D'Claw,一个三指手机器人,用于促进精细操作任务的学习;D'Kitty,一个四足机器人,用于促进敏捷的腿式移动任务学习。这些模块化机器人易于维护且足够坚固,能够承受从零开始的硬件强化学习,目前已记录超过14000小时的训练时间。ROBEL提供了一系列连续控制基准任务,这些任务具有密集和稀疏的任务目标,并引入了硬件安全评分指标。数据集和相关材料可在www.roboticsbenchmarks.org访问,旨在解决强化学习在真实机器人上的应用问题,特别是在处理物理限制和环境交互方面的挑战。
提供机构:
加州大学伯克利分校, 美国 †谷歌研究院, 美国
创建时间:
2019-09-26
AI搜集汇总
数据集介绍
main_image_url
构建方式
ROBEL数据集通过构建两种低成本、模块化的机器人平台来实现,分别为D’Claw和D’Kitty。D’Claw是一款九自由度的操作机器人,专门用于灵巧的操作任务;D’Kitty则是一款十二自由度的四足机器人,专注于敏捷的腿式移动任务。这些机器人使用现成的组件和通用的原型制作工具(如3D打印机和激光切割机),并且可以在几个小时内组装完成。ROBEL平台的模块化设计使其能够以合理的成本构建高自由度的机器人,并且易于维护。D’Claw和D’Kitty都已经通过了独立复制和可靠性测试,展示了其可重复性和可扩展性。
特点
ROBEL数据集的特点在于其低成本、模块化和可重复性。ROBEL平台提供了高自由度的机器人,同时保持了低成本和易于维护的特点。这些机器人已经经历了超过14000小时的现实世界训练,证明了其耐用性和可靠性。此外,ROBEL还包括一系列连续控制基准任务,这些任务具有密集和稀疏的任务目标,并引入了硬件安全评分指标。ROBEL平台支持模拟后端,以便快速原型设计,并且提供了基准分数,这些分数使用了各种基于学习的方法。ROBEL平台的结果可以在不同机构中的机器人副本中复制,这进一步证明了其可重复性。
使用方法
ROBEL数据集的使用方法包括以下步骤:首先,用户可以从ROBEL平台获取机器人硬件、设计文件、详细的组装说明、训练策略、基线细节、任务视频等所有必需的补充材料。然后,用户可以选择D’Claw或D’Kitty机器人进行特定的任务,如灵巧的操作或敏捷的腿式移动。接着,用户可以使用OpenAI Gym API实现MDP设置,并根据需要选择模拟或现实世界硬件环境。ROBEL平台提供了多种控制模式、感知选项和通信速度,以适应不同的实验需求。最后,用户可以使用ROBEL平台提供的基准分数和安全评分指标来评估不同学习算法的性能。
背景与挑战
背景概述
近年来,基于学习的机器人控制方法取得了显著进展,这得益于模拟基准的广泛可用性和强化学习算法的灵活性与可扩展性。然而,将模拟环境中的学习成果转移到真实世界机器人上仍然面临着巨大的挑战,例如物理现象的不准确建模和领域迁移问题。为了解决这一问题,ROBEL平台应运而生。ROBEL是一个开源平台,旨在为现实世界中的强化学习提供经济实惠的机器人。该平台推出了两款机器人,分别针对不同的任务领域:D’Claw是一款三指手机器人,用于学习灵巧的操作任务;D’Kitty是一款四足机器人,用于学习敏捷的腿部运动任务。这些低成本、模块化的机器人易于维护,并且足够坚固,能够在硬件上进行超过14000小时的强化学习。为了利用这个平台,研究人员提出了一套可扩展的连续控制基准任务,这些任务具有密集和稀疏的任务目标,并且引入了硬件安全评分指标。该研究对相关领域的影响力在于,它提供了一个低成本、可扩展的平台,使得更广泛的社区能够在可重复的设置下实现现实世界的结果。
当前挑战
尽管ROBEL平台在现实世界中的强化学习方面取得了进展,但仍然面临一些挑战。首先,真实世界中的机器人学习通常不考虑物理限制,例如,激进地探索可能会导致机器人因自身与环境物理环境的碰撞而磨损或永久损坏。其次,当前机器人研究主要在高成本的工业级机器人上进行,这些机器人旨在在受控环境中进行精确、人工监控的操作。这些机器人围绕传统控制方法设计,侧重于精度、可重复性和易于表征。这与基于学习的机器人控制方法的需求形成了鲜明对比,后者对不完美的传感和驱动具有鲁棒性,但需要高度的抗冲击性,以便进行长时间的现实世界试错学习;低成本和易于维护,以便通过复制实现可扩展性;以及可靠的机制,以便在没有严格人工监控的情况下进行大规模数据收集。此外,将模拟环境中的学习成果转移到真实世界机器人上仍然是一个难题。ROBEL平台的出现为解决这些问题提供了一种新的思路,但仍然需要进一步的研究和开发。
常用场景
经典使用场景
ROBEL数据集为强化学习在真实世界中的应用提供了一个开放源代码的、经济高效的机器人平台。该数据集引入了两种机器人,分别用于加速不同任务领域的强化学习研究:D’Claw是一个三指机械手机器人,用于学习灵巧操作任务;D’Kitty是一个四足机器人,用于学习敏捷的腿部运动任务。这些低成本、模块化的机器人易于维护,并且足够坚固,可以承受超过14000小时的硬件上的强化学习。为了利用这个平台,我们提出了一套可扩展的连续控制基准任务,用于每种机器人。这些任务具有密集和稀疏的任务目标,并额外引入了硬件安全的评分指标。我们使用各种基于学习的方法在一组初始任务上提供了基准分数。此外,我们还展示了这些结果可以在位于不同机构的不同机器人副本中复制。代码、文档、设计文件、详细的组装说明、训练策略、基线细节、任务视频以及所有用于复制结果的补充材料都可以在www.roboticsbenchmarks.org上找到。
实际应用
ROBEL数据集的实际应用场景包括但不限于:灵巧操作任务(如抓取、放置、组装)、敏捷的腿部运动任务(如行走、跑步、跳跃)以及与真实世界环境交互的任务(如避障、导航、与环境互动)。这些应用场景涵盖了机器人技术的广泛领域,包括工业自动化、家庭服务、医疗辅助和灾难响应等。ROBEL数据集为这些应用场景提供了强大的工具,帮助研究人员开发出能够在真实世界中有效运行的机器人系统。
衍生相关工作
ROBEL数据集的衍生相关工作包括但不限于:使用ROBEL平台进行强化学习算法的研究、基于ROBEL数据集开发新的机器人控制策略、使用ROBEL平台进行真实世界机器人系统的测试和评估、以及使用ROBEL数据集进行机器学习和人工智能的基础研究。这些衍生工作不仅推动了机器人技术的进步,也为其他相关领域的研究提供了新的思路和方法。
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4099个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

MedDialog

MedDialog数据集(中文)包含了医生和患者之间的对话(中文)。它有110万个对话和400万个话语。数据还在不断增长,会有更多的对话加入。原始对话来自好大夫网。

github 收录

CUHK-PEDES

Cuhk-pedes数据集是带有字幕注释的行人数据集。它包含13,003人以上的40,206图像。图像是从五个现有的人员重新识别数据集 (CUHK03,市场1501,SSM,VIPER和CUHK01) 中收集的,而每个图像都由众包工人用2个文本描述进行注释。句子包含有关人的外观,动作,姿势的丰富细节。

OpenDataLab 收录

OpenSonarDatasets

OpenSonarDatasets是一个致力于整合开放源代码声纳数据集的仓库,旨在为水下研究和开发提供便利。该仓库鼓励研究人员扩展当前的数据集集合,以增加开放源代码声纳数据集的可见性,并提供一个更容易查找和比较数据集的方式。

github 收录

PU Dataset

德国帕德博恩大学(PU)轴承故障诊断数据集提供了丰富的轴承故障信号数据,包括内圈、外圈和滚动体故障等多种类型的轴承故障。与其他数据集相比,PU数据集的特色在于包含了大量的电机驱动系统故障数据,为轴承故障诊断研究提供了一个全面的实验平台。

github 收录

riotu-lab/Synthetic-UAV-Flight-Trajectories

该数据集包含超过5000条随机无人机(UAV)轨迹,这些轨迹是在20小时的飞行时间内收集的,主要用于训练AI模型,如轨迹预测应用。数据集通过自动化管道生成和预处理无人机合成轨迹,使其可以直接用于AI模型训练。数据集的特点是参数化的轨迹,遵循预定义的模式,特别是圆形和无限路径。数据集的结构包括数据字段,如时间戳和无人机的3D位置(x, y, z坐标)。

hugging_face 收录