five

dice4

收藏
Hugging Face2025-04-20 更新2025-04-21 收录
下载链接:
https://huggingface.co/datasets/Bartm3/dice4
下载链接
链接失效反馈
官方服务:
资源简介:
这是一个包含机器人动作和状态数据的机器学习数据集,具体类型为so100机器人。数据集共有10个剧集,6198个帧,1个任务,20个视频和1个数据块,每个数据块的大小为1000。数据集的视频帧率为30fps,并且提供了训练数据集的划分。数据集还包括了动作、状态、视频画面、时间戳、帧索引、剧集索引、索引和任务索引等特征信息。
创建时间:
2025-04-18
原始信息汇总

数据集概述

基本信息

  • 名称: Bartm3/dice4
  • 许可证: Apache-2.0
  • 任务类别: 机器人学(robotics)
  • 标签: LeRobot, so100, tutorial

数据集描述

  • 创建工具: 使用LeRobot创建
  • 主页: 未提供
  • 论文: 未提供

数据集结构

  • 数据文件格式: Parquet
  • 配置名称: default
  • 数据文件路径: data//.parquet

元数据信息

  • 代码库版本: v2.1
  • 机器人类型: so100
  • 总集数: 10
  • 总帧数: 6198
  • 总任务数: 1
  • 总视频数: 20
  • 总块数: 1
  • 块大小: 1000
  • 帧率: 30 fps
  • 分割: 训练集(0:10)

数据路径

  • 数据路径模板: data/chunk-{episode_chunk:03d}/episode_{episode_index:06d}.parquet
  • 视频路径模板: videos/chunk-{episode_chunk:03d}/{video_key}/episode_{episode_index:06d}.mp4

特征

  • 动作(action):
    • 数据类型: float32
    • 形状: [6]
    • 名称: main_shoulder_pan, main_shoulder_lift, main_elbow_flex, main_wrist_flex, main_wrist_roll, main_gripper
  • 观测状态(observation.state):
    • 数据类型: float32
    • 形状: [6]
    • 名称: 同动作特征
  • 观测图像(observation.images.laptop 和 observation.images.phone):
    • 数据类型: video
    • 形状: [480, 640, 3]
    • 名称: height, width, channels
    • 视频信息:
      • fps: 30.0
      • 高度: 480
      • 宽度: 640
      • 通道: 3
      • 编解码器: av1
      • 像素格式: yuv420p
      • 是否为深度图: false
      • 是否有音频: false
  • 时间戳(timestamp):
    • 数据类型: float32
    • 形状: [1]
  • 帧索引(frame_index):
    • 数据类型: int64
    • 形状: [1]
  • 集索引(episode_index):
    • 数据类型: int64
    • 形状: [1]
  • 索引(index):
    • 数据类型: int64
    • 形状: [1]
  • 任务索引(task_index):
    • 数据类型: int64
    • 形状: [1]

引用

  • BibTeX: 未提供
搜集汇总
数据集介绍
main_image_url
构建方式
dice4数据集依托LeRobot开源框架构建,采用模块化数据采集策略,通过so100型机器人执行标准化任务流程。数据以30fps帧率同步记录机械臂6自由度关节动作、双视角视觉观测及时间戳信息,原始数据经AV1编码压缩后存储为Parquet格式,每1000帧划分为一个数据块,共包含10个完整操作片段,形成6198帧的多模态时序数据。
特点
该数据集以机器人操作任务为核心,突出多传感器融合特性。动作空间涵盖肩部平移/旋转、肘部屈伸、腕部弯曲/扭转及夹持器开合6维连续控制量;观测空间包含笔记本电脑与手机双视角的640×480像素RGB视频流,各通道均附带精确到毫秒级的时间同步标记。数据采用分块存储设计,支持快速随机访问,且所有数值字段均以float32标准化处理,确保模型训练稳定性。
使用方法
使用者可通过解析meta/info.json获取数据组织结构,按照指定路径模板加载Parquet文件。训练集包含全部10个操作片段,视频数据需配合FFmpeg解码。典型应用场景包括:基于时空特征的模仿学习、多视角视觉伺服控制算法验证、连续动作空间策略优化等。建议结合PyTorch或TensorFlow框架构建数据管道,利用帧索引实现跨模态数据对齐,注意处理不同采样率传感器的时序插值问题。
背景与挑战
背景概述
dice4数据集由LeRobot团队开发,专注于机器人领域的研究与应用。该数据集基于so100机器人平台构建,涵盖了机器人在执行任务过程中的多模态数据,包括关节动作、状态观测以及来自笔记本电脑和手机的视频数据。数据集的设计旨在为机器人控制、行为模仿和任务学习等研究提供丰富的实验素材。尽管数据集的具体创建时间和主要研究人员信息尚未公开,但其结构化的数据组织和详细的元信息标注,为机器人学习算法的开发和验证提供了重要支持。数据集采用Apache 2.0许可协议,进一步促进了其在学术和工业界的广泛应用。
当前挑战
dice4数据集在解决机器人任务学习问题时面临多重挑战。从领域问题来看,机器人动作的精确建模与多模态数据(如视频与状态数据)的同步对齐是核心难点,这直接影响了算法的训练效果与实际应用的泛化能力。在数据构建过程中,如何确保不同传感器(如摄像头与关节编码器)数据的时间一致性,以及如何处理高维视频数据与低维状态数据的融合,均为技术上的关键挑战。此外,数据集的规模相对有限,仅包含10个任务片段和6198帧数据,可能限制了复杂模型的训练需求。数据多样性的不足也可能导致算法在未见任务上的表现不佳。
常用场景
经典使用场景
在机器人控制与行为学习领域,dice4数据集以其多模态数据结构和精确的机械臂动作记录,成为研究机器人任务执行能力的理想选择。该数据集通过记录so100型机械臂的关节角度、夹爪状态及多视角视频数据,为模仿学习与强化学习算法提供了丰富的训练素材。其30fps的高频采样和6自由度动作空间,特别适合用于研究复杂操作任务中时序动作的连贯性与精确性。
解决学术问题
该数据集有效解决了机器人领域动作泛化性研究的核心难题。通过提供标准化的大规模操作数据,研究者能够突破传统小样本实验的局限,深入探索跨任务迁移学习、多模态感知融合等关键问题。其包含的6198帧同步传感器数据,为建立动作-状态关联模型提供了坚实基础,显著提升了机械臂控制策略的鲁棒性研究效率。
衍生相关工作
该数据集已催生多项机器人学习领域的重要研究,包括基于Transformer的多模态策略网络架构、时空注意力机制的动作预测模型等创新工作。LeRobot团队在其基础上开发的基准测试系统,已成为评估机械臂操作能力的标准工具。相关衍生研究在2023年ICRA等顶级会议上获得广泛关注,推动了机器人学习从仿真到实物的跨越。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作