dice4

Hugging Face2025-04-20 更新2025-04-21 收录

下载链接：

https://huggingface.co/datasets/Bartm3/dice4

下载链接

链接失效反馈

官方服务：

资源简介：

这是一个包含机器人动作和状态数据的机器学习数据集，具体类型为so100机器人。数据集共有10个剧集，6198个帧，1个任务，20个视频和1个数据块，每个数据块的大小为1000。数据集的视频帧率为30fps，并且提供了训练数据集的划分。数据集还包括了动作、状态、视频画面、时间戳、帧索引、剧集索引、索引和任务索引等特征信息。

创建时间：

2025-04-18

原始信息汇总

数据集概述

基本信息

名称: Bartm3/dice4
许可证: Apache-2.0
任务类别: 机器人学（robotics）
标签: LeRobot, so100, tutorial

数据集描述

创建工具: 使用LeRobot创建
主页: 未提供
论文: 未提供

数据集结构

数据文件格式: Parquet
配置名称: default
数据文件路径: data//.parquet

元数据信息

代码库版本: v2.1
机器人类型: so100
总集数: 10
总帧数: 6198
总任务数: 1
总视频数: 20
总块数: 1
块大小: 1000
帧率: 30 fps
分割: 训练集（0:10）

数据路径

数据路径模板: data/chunk-{episode_chunk:03d}/episode_{episode_index:06d}.parquet
视频路径模板: videos/chunk-{episode_chunk:03d}/{video_key}/episode_{episode_index:06d}.mp4

特征

动作（action）:
- 数据类型: float32
- 形状: [6]
- 名称: main_shoulder_pan, main_shoulder_lift, main_elbow_flex, main_wrist_flex, main_wrist_roll, main_gripper
观测状态（observation.state）:
- 数据类型: float32
- 形状: [6]
- 名称: 同动作特征
观测图像（observation.images.laptop 和 observation.images.phone）:
- 数据类型: video
- 形状: [480, 640, 3]
- 名称: height, width, channels
- 视频信息:
  - fps: 30.0
  - 高度: 480
  - 宽度: 640
  - 通道: 3
  - 编解码器: av1
  - 像素格式: yuv420p
  - 是否为深度图: false
  - 是否有音频: false
时间戳（timestamp）:
- 数据类型: float32
- 形状: [1]
帧索引（frame_index）:
- 数据类型: int64
- 形状: [1]
集索引（episode_index）:
- 数据类型: int64
- 形状: [1]
索引（index）:
- 数据类型: int64
- 形状: [1]
任务索引（task_index）:
- 数据类型: int64
- 形状: [1]

引用

BibTeX: 未提供

搜集汇总

数据集介绍

构建方式

dice4数据集依托LeRobot开源框架构建，采用模块化数据采集策略，通过so100型机器人执行标准化任务流程。数据以30fps帧率同步记录机械臂6自由度关节动作、双视角视觉观测及时间戳信息，原始数据经AV1编码压缩后存储为Parquet格式，每1000帧划分为一个数据块，共包含10个完整操作片段，形成6198帧的多模态时序数据。

特点

该数据集以机器人操作任务为核心，突出多传感器融合特性。动作空间涵盖肩部平移/旋转、肘部屈伸、腕部弯曲/扭转及夹持器开合6维连续控制量；观测空间包含笔记本电脑与手机双视角的640×480像素RGB视频流，各通道均附带精确到毫秒级的时间同步标记。数据采用分块存储设计，支持快速随机访问，且所有数值字段均以float32标准化处理，确保模型训练稳定性。

使用方法

使用者可通过解析meta/info.json获取数据组织结构，按照指定路径模板加载Parquet文件。训练集包含全部10个操作片段，视频数据需配合FFmpeg解码。典型应用场景包括：基于时空特征的模仿学习、多视角视觉伺服控制算法验证、连续动作空间策略优化等。建议结合PyTorch或TensorFlow框架构建数据管道，利用帧索引实现跨模态数据对齐，注意处理不同采样率传感器的时序插值问题。

背景与挑战

背景概述

dice4数据集由LeRobot团队开发，专注于机器人领域的研究与应用。该数据集基于so100机器人平台构建，涵盖了机器人在执行任务过程中的多模态数据，包括关节动作、状态观测以及来自笔记本电脑和手机的视频数据。数据集的设计旨在为机器人控制、行为模仿和任务学习等研究提供丰富的实验素材。尽管数据集的具体创建时间和主要研究人员信息尚未公开，但其结构化的数据组织和详细的元信息标注，为机器人学习算法的开发和验证提供了重要支持。数据集采用Apache 2.0许可协议，进一步促进了其在学术和工业界的广泛应用。

当前挑战

dice4数据集在解决机器人任务学习问题时面临多重挑战。从领域问题来看，机器人动作的精确建模与多模态数据（如视频与状态数据）的同步对齐是核心难点，这直接影响了算法的训练效果与实际应用的泛化能力。在数据构建过程中，如何确保不同传感器（如摄像头与关节编码器）数据的时间一致性，以及如何处理高维视频数据与低维状态数据的融合，均为技术上的关键挑战。此外，数据集的规模相对有限，仅包含10个任务片段和6198帧数据，可能限制了复杂模型的训练需求。数据多样性的不足也可能导致算法在未见任务上的表现不佳。

常用场景

经典使用场景

在机器人控制与行为学习领域，dice4数据集以其多模态数据结构和精确的机械臂动作记录，成为研究机器人任务执行能力的理想选择。该数据集通过记录so100型机械臂的关节角度、夹爪状态及多视角视频数据，为模仿学习与强化学习算法提供了丰富的训练素材。其30fps的高频采样和6自由度动作空间，特别适合用于研究复杂操作任务中时序动作的连贯性与精确性。

解决学术问题

该数据集有效解决了机器人领域动作泛化性研究的核心难题。通过提供标准化的大规模操作数据，研究者能够突破传统小样本实验的局限，深入探索跨任务迁移学习、多模态感知融合等关键问题。其包含的6198帧同步传感器数据，为建立动作-状态关联模型提供了坚实基础，显著提升了机械臂控制策略的鲁棒性研究效率。

衍生相关工作

该数据集已催生多项机器人学习领域的重要研究，包括基于Transformer的多模态策略网络架构、时空注意力机制的动作预测模型等创新工作。LeRobot团队在其基础上开发的基准测试系统，已成为评估机械臂操作能力的标准工具。相关衍生研究在2023年ICRA等顶级会议上获得广泛关注，推动了机器人学习从仿真到实物的跨越。

以上内容由遇见数据集搜集并总结生成