so100_dice10

Hugging Face2025-05-22 更新2025-05-23 收录

下载链接：

https://huggingface.co/datasets/apayan/so100_dice10

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集使用LeRobot工具创建，包含了一个机器人（so100类型）执行任务的视频和相关信息。数据集共有5个剧集，2765帧，15个视频，1个任务，数据被分为训练集。每个剧集包含1000个片段，帧率为20fps。数据集提供了多种观测信息，包括机器人的动作、状态、顶部、前方和手腕的图像，以及时间戳、帧索引、剧集索引等。所有数据以Parquet格式存储，视频以h264编码的MP4格式存储。

This dataset is developed using the LeRobot tool, and contains videos and associated metadata of a so100-type robot executing a single task. The dataset includes 5 episodes, 2765 total frames, 15 video clips, with all data split into the training set. Each episode contains 1000 segments, with a frame rate of 20 fps. The dataset provides diverse observation modalities, including robot actions, joint states, top-down, front-facing, and wrist-mounted images, as well as timestamps, frame indices, episode indices, and other relevant supplementary information. All non-video data is stored in Parquet format, while the video files are encoded with the h264 codec and saved in MP4 format.

创建时间：

2025-05-22

搜集汇总

数据集介绍

构建方式

在机器人技术领域，so100_dice10数据集依托LeRobot平台精心构建，采用结构化数据采集范式。该数据集包含5个完整交互片段，总计2765帧数据，以20帧/秒的采样率记录机器人操作过程。数据存储采用分块式管理，每个数据块容量为1000帧，通过标准化Parquet格式实现高效存取，确保数据序列的完整性与时序一致性。

特点

该数据集在机器人操作任务中展现出多维感知特性，同时涵盖六自由度机械臂动作指令与对应关节状态观测。视觉感知系统配备三视角图像采集，包含顶部、前方及腕部摄像头，均以480×640分辨率RGB格式记录操作场景。数据集采用统一时间戳索引机制，支持跨模态数据对齐，为机器人模仿学习提供丰富的时空关联信息。

使用方法

研究人员可通过加载Parquet数据文件直接访问结构化数据集，利用帧索引与片段索引实现精准数据定位。该数据集专为训练集设计，支持机器人策略学习算法的端到端训练。用户可同步获取动作指令、关节状态观测及多视角视觉输入，构建完整的感知-动作闭环，适用于行为克隆、强化学习等机器人学习范式的实证研究。

背景与挑战

背景概述

机器人学习领域近年来在模仿学习与强化学习融合方面取得显著进展，so100_dice10数据集作为LeRobot项目的重要组成部分，专注于解决多视角视觉感知与机械臂控制策略的协同优化问题。该数据集通过集成顶部、前部和腕部三视角图像流与六自由度关节动作数据，构建了面向真实场景的机器人操作任务序列。其采用Apache 2.0开源协议，包含5个完整任务片段和2765帧多维数据，为机器人行为克隆与策略泛化研究提供了标准化基准。

当前挑战

在机器人操作任务领域，该数据集需应对高维视觉动作空间映射的复杂性，解决多模态传感器时序对齐与状态动作表征一致性的核心难题。构建过程中面临多路视频流同步采集的技术瓶颈，需确保20Hz采样频率下三视角图像与关节状态的精确时序匹配。数据标准化处理环节涉及异构传感器数据的时空校准，以及大规模视控数据存储与检索的工程挑战，这些因素共同制约着机器人操作策略的迁移效能。

常用场景

经典使用场景

在机器人学习领域，so100_dice10数据集通过多视角视觉观察与关节状态数据的同步记录，为模仿学习算法提供了丰富的训练素材。该数据集收录了机械臂执行任务时的完整运动轨迹，包含顶部、前部和腕部三个视角的高清视频流，配合六自由度关节角度数据，构建了机器人感知与动作的对应关系。研究人员可利用这些多模态数据训练端到端的控制策略，使机器人能够从视觉输入直接生成相应的关节运动指令。

解决学术问题

该数据集有效解决了机器人模仿学习中样本效率低下的核心问题。通过提供真实机械臂操作场景下的高质量示范数据，显著降低了策略学习对交互样本的需求量。其精心设计的传感器配置方案，为研究多模态表征融合、跨视角视觉一致性等关键课题提供了实验基础。数据集的结构化组织方式还促进了机器人技能迁移研究，使得在有限数据条件下实现泛化成为可能。

衍生相关工作

围绕该数据集衍生的研究工作主要集中在行为克隆算法的改进与创新。学者们利用其多模态特性开发了视觉-动作映射网络，实现了从原始像素到控制指令的端到端学习。基于此数据集的工作还推动了分层强化学习在机器人控制中的应用，将复杂任务分解为可学习的子技能。这些研究不仅验证了数据集的质量，还拓展了模仿学习在真实机器人系统中的边界。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集