five

mikasa_robo_subset_lerobot

收藏
Hugging Face2025-12-02 更新2025-12-03 收录
下载链接:
https://huggingface.co/datasets/liyouzhou/mikasa_robo_subset_lerobot
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集与机器人学相关,包含不同剧集、帧和机器人执行的任务的信息。数据集的结构详细说明了所包含的数据类型,如图像、机器人状态、动作和任务名称。数据集以Parquet文件格式存储,并包含相应的视频文件。使用的机器人类型为'franka'。数据集仅分为训练集。特征部分详细介绍了数据类型、形状以及其他详细信息,如视频编解码器和格式。数据集缺少主页和论文引用信息。

This dataset is related to robotics, containing information about different episodes, frames, and tasks executed by robots. The structure of the dataset details the included data categories, such as images, robot states, actions, and task names. The dataset is stored in Parquet file format, with accompanying video files. The type of robot utilized is 'franka'. The dataset is only split into a training set. The feature section elaborates on data types, their shapes, and other specific details including video codecs and formats. This dataset lacks both homepage and paper citation information.
创建时间:
2025-12-02
原始信息汇总

数据集概述

基本信息

  • 数据集名称: mikasa_robo_subset_lerobot
  • 创建工具: LeRobot (https://github.com/huggingface/lerobot)
  • 许可证: Apache 2.0
  • 任务类别: 机器人学
  • 标签: LeRobot, mikasa_robo_tfds_subset, rlds, openx, franka

数据集结构

  • 总情节数: 1250
  • 总帧数: 31707
  • 总任务数: 3
  • 总视频数: 1250
  • 数据块数: 2
  • 数据块大小: 1000
  • 帧率: 20 FPS
  • 机器人类型: Franka
  • 代码库版本: v2.1
  • 数据分割: 训练集 (0:1250)
  • 数据文件路径模式: data/chunk-{episode_chunk:03d}/episode_{episode_index:06d}.parquet
  • 视频文件路径模式: videos/chunk-{episode_chunk:03d}/{video_key}/episode_{episode_index:06d}.mp4

数据特征

  • observation.images.image:

    • 数据类型: 视频
    • 形状: [128, 128, 3]
    • 维度名称: ["height", "width", "rgb"]
    • 视频信息:
      • 高度: 128 像素
      • 宽度: 128 像素
      • 编解码器: av1
      • 像素格式: yuv420p
      • 是否为深度图: 否
      • 帧率: 20 FPS
      • 通道数: 3
      • 是否包含音频: 否
  • observation.state:

    • 数据类型: float32
    • 形状: [8]
    • 维度名称: {"motors": ["x", "y", "z", "roll", "pitch", "yaw", "pad", "gripper"]}
  • action:

    • 数据类型: float32
    • 形状: [7]
    • 维度名称: {"motors": ["x", "y", "z", "roll", "pitch", "yaw", "gripper"]}
  • task_name:

    • 数据类型: string
    • 形状: [1]
  • timestamp:

    • 数据类型: float32
    • 形状: [1]
    • 维度名称: null
  • frame_index:

    • 数据类型: int64
    • 形状: [1]
    • 维度名称: null
  • episode_index:

    • 数据类型: int64
    • 形状: [1]
    • 维度名称: null
  • index:

    • 数据类型: int64
    • 形状: [1]
    • 维度名称: null
  • task_index:

    • 数据类型: int64
    • 形状: [1]
    • 维度名称: null

引用信息

  • 主页: [More Information Needed]
  • 论文: [More Information Needed]
  • BibTeX 引用: [More Information Needed]
搜集汇总
数据集介绍
main_image_url
构建方式
在机器人学习领域,高质量的数据集对于算法训练至关重要。mikasa_robo_subset_lerobot数据集依托LeRobot框架构建,通过Franka机器人平台采集了1250条完整交互轨迹,总计包含31707个数据帧。数据以分块形式组织,每块容纳1000条轨迹,并以Parquet格式高效存储,确保了大规模机器人操作数据的结构化与可管理性。
特点
该数据集在机器人操作任务中展现出鲜明的技术特征。其核心观测数据包含128x128像素的三通道图像序列,以20帧每秒的速率编码为AV1格式,同时辅以8维浮点型机器人状态向量。动作空间则定义为7维连续控制指令,覆盖了位置、姿态与夹爪操作。数据集涵盖了3种独立任务,每条轨迹均标注了任务名称、时间戳及索引信息,为多任务学习提供了清晰的结构化支撑。
使用方法
研究者可通过HuggingFace平台直接访问该数据集,利用其预定义的训练划分进行模型开发。数据加载遵循标准RLDS格式,每个Parquet文件对应单条机器人轨迹,包含完整的图像观测、状态序列及动作标签。用户可基于LeRobot提供的工具链进行数据预处理,将图像序列与控制指令对齐,进而应用于模仿学习、强化学习或视觉运动策略训练等前沿研究方向。
背景与挑战
背景概述
在机器人学习领域,高质量、大规模的真实世界交互数据集对于推动模仿学习与强化学习算法的实际应用至关重要。mikasa_robo_subset_lerobot数据集作为LeRobot项目的一部分,由Hugging Face社区于近期构建并开源,旨在为基于Franka机械臂的机器人操作任务提供标准化的演示数据。该数据集包含1250条轨迹,覆盖3种不同任务,以20Hz频率采集了包含128x128像素RGB图像、8维状态向量及7维动作指令在内的多模态序列,其核心研究问题聚焦于如何利用真实世界的异构传感数据来训练能够泛化至新场景的机器人策略。此类数据集的涌现,显著降低了机器人学习的研究门槛,促进了开源协作生态的发展,为数据驱动的机器人控制方法提供了宝贵的实证基础。
当前挑战
该数据集致力于解决机器人操作任务中模仿学习与离线强化学习所面临的挑战,即如何从有限的人类演示中学习鲁棒且可泛化的控制策略。具体而言,挑战体现在学习算法需要处理高维视觉观察与低维状态动作之间的复杂映射,并在存在传感器噪声、环境变化及动作延迟的情况下保持策略的稳定性。在数据集构建过程中,挑战主要源于真实世界数据采集的复杂性与一致性维护。例如,需要确保Franka机械臂在不同任务执行中轨迹的精确同步与校准,协调图像、状态与动作数据的时间对齐,并以高效压缩格式(如AV1编码视频)存储大规模序列数据,同时保持数据分割的合理性与元信息完整性,以支持后续的分布式训练与评估。
常用场景
经典使用场景
在机器人学习领域,mikasa_robo_subset_lerobot数据集为模仿学习与强化学习算法的训练与评估提供了关键支持。该数据集包含Franka机器人执行多种任务的交互记录,涵盖图像观测、状态信息及动作序列,其结构化格式遵循RLDS标准,便于研究者直接用于策略网络的端到端训练。经典应用场景包括基于视觉的机器人操控任务,如物体抓取与放置,通过大量真实世界交互数据,有效促进了从仿真到实际环境的策略迁移研究。
衍生相关工作
围绕该数据集,已衍生出多项经典研究工作,主要集中在机器人模仿学习与视觉运动策略领域。例如,基于Transformer的序列建模方法利用其多模态轨迹进行端到端策略学习;同时,该数据集常被用作基准测试工具,用于评估离线强化学习算法在真实机器人任务上的性能。相关研究进一步扩展至多任务学习与元强化学习框架,推动了机器人技能组合与泛化能力的前沿探索。
数据集最近研究
最新研究方向
在机器人学习领域,高质量、大规模的真实世界交互数据集正成为推动模仿学习与强化学习算法发展的关键基石。mikasa_robo_subset_lerobot数据集作为LeRobot生态系统的一部分,以其结构化的机器人操作序列(RLDS格式)和丰富的多模态观测(包括128x128 RGB图像与8维状态向量),为研究者提供了宝贵的真实Franka机器人操作轨迹。当前前沿研究聚焦于利用此类数据集训练端到端的视觉运动策略模型,特别是结合扩散模型或Transformer架构来处理高维视觉输入并生成精确的关节空间或任务空间动作。随着具身人工智能和通用机器人操作任务的兴起,该数据集支持的研究方向正与“机器人基础模型”这一热点紧密相连,旨在通过大规模离线数据预训练,实现策略在多样化场景中的泛化与快速适应,从而降低真实机器人训练的样本复杂性与安全风险,对推动机器人走向更自主、灵巧的实用化阶段具有深远意义。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作