dusty_3cam

Hugging Face2025-08-12 更新2025-08-13 收录

下载链接：

https://huggingface.co/datasets/sandhyavs/dusty_3cam

下载链接

链接失效反馈

官方服务：

资源简介：

LeRobot数据集是一个包含50个episodes的机器人数据集，每个episode包含多个frames，总共有4183个frames。数据集提供了机器人动作、状态、原始摄像头图像、分割后的摄像头图像、深度摄像头图像和时间戳等信息。数据集适用于机器人学相关的研究和开发任务，遵循apache-2.0许可。

创建时间：

2025-08-11

原始信息汇总

数据集概述

基本信息

许可证: Apache-2.0
任务类别: 机器人学
标签: LeRobot
创建工具: LeRobot

数据集结构

配置名称: default
数据文件: data//.parquet
代码库版本: v2.1
机器人类型: dusty
总集数: 50
总帧数: 4183
总任务数: 1
总视频数: 150
总块数: 1
块大小: 1000
帧率: 30 fps
分割: 训练集 (0:50)

数据路径

数据路径: data/chunk-{episode_chunk:03d}/episode_{episode_index:06d}.parquet
视频路径: videos/chunk-{episode_chunk:03d}/{video_key}/episode_{episode_index:06d}.mp4

特征

动作

数据类型: float32
形状: [4]
名称: arm_left_angle, arm_right_angle, palm_left_angle, palm_right_angle

观测状态

数据类型: float32
形状: [4]
名称: arm_left_angle, arm_right_angle, palm_left_angle, palm_right_angle

观测图像

camera_raw

数据类型: video
形状: [640, 852, 3]
名称: height, width, channels
视频信息:
- 高度: 640
- 宽度: 852
- 编解码器: av1
- 像素格式: yuv420p
- 深度图: false
- 帧率: 30 fps
- 通道: 3
- 音频: false

camera_segmented

数据类型: video
形状: [320, 320, 1]
名称: height, width, channels
视频信息:
- 高度: 320
- 宽度: 320
- 编解码器: av1
- 像素格式: yuv420p
- 深度图: false
- 帧率: 30 fps
- 通道: 3
- 音频: false

camera_depth

数据类型: video
形状: [109, 224, 1]
名称: height, width, channels
视频信息:
- 高度: 109
- 宽度: 224
- 编解码器: av1
- 像素格式: yuv420p
- 深度图: false
- 帧率: 30 fps
- 通道: 3
- 音频: false

其他特征

timestamp: float32, 形状 [1]
frame_index: int64, 形状 [1]
episode_index: int64, 形状 [1]
index: int64, 形状 [1]
task_index: int64, 形状 [1]

搜集汇总

数据集介绍

构建方式

dusty_3cam数据集基于LeRobot开源框架构建，专为机器人学习任务设计。该数据集通过三摄像头系统采集多模态数据，包含50个完整任务片段，总计4183帧图像数据。数据以分块形式存储，每个数据块包含1000帧，采用Parquet格式高效压缩，视频流以MP4格式保存，帧率稳定在30fps。数据采集过程严格记录机械臂角度、手掌角度等状态信息，确保动作与观测的同步性。

使用方法

使用该数据集时，可通过meta/info.json文件获取完整的结构描述。数据按episode组织，路径模板明确指示了parquet数据文件和MP4视频文件的存储位置。研究者可基于帧索引实现跨模态数据对齐，动作和状态数据可直接用于强化学习训练。视频数据采用AV1编码，建议使用兼容的编解码器进行处理。数据集已预设训练集划分，涵盖全部50个任务片段，可直接用于模型训练与验证。

背景与挑战

背景概述

dusty_3cam数据集由LeRobot团队构建，专注于机器人技术领域的研究与应用。该数据集通过多摄像头系统捕捉机器人在不同任务中的动作和环境反馈，旨在为机器人控制与行为学习提供丰富的多模态数据支持。其核心研究问题聚焦于如何利用视觉、深度和分割图像数据提升机器人在复杂环境中的自主决策能力。尽管数据集的具体创建时间和主要研究人员信息尚未公开，但其基于Apache 2.0许可证的开源特性，为机器人学领域的算法开发和模型训练提供了重要资源。

当前挑战

dusty_3cam数据集在解决机器人行为学习问题时面临多重挑战。从领域问题来看，如何高效融合多摄像头（原始图像、分割图像和深度图像）的异构数据以实现精准的环境感知与动作控制，是该数据集的核心难题。在构建过程中，数据采集的同步性与一致性成为关键挑战，尤其是在多模态数据（如视频、深度信息与机械臂动作）的时间对齐上。此外，数据集规模相对有限，仅包含50个任务片段和4183帧数据，可能制约复杂模型的训练效果。视频数据的编解码格式（如AV1）和分辨率差异（如640x852与320x320并存）也为数据处理流程增加了复杂性。

常用场景

经典使用场景

在机器人控制与感知研究领域，dusty_3cam数据集以其多模态传感器数据为特色，成为机器人动作规划与环境交互研究的基准测试平台。该数据集通过整合原始视觉、深度图像及分割图像，配合精确的机械臂关节角度记录，为模仿学习与强化学习算法提供了丰富的训练素材。研究者可基于连续帧间的状态-动作对应关系，构建端到端的机器人控制策略。

解决学术问题

该数据集有效解决了机器人领域三大核心问题：多模态感知数据的时序对齐难题、真实场景下机械臂动作的精确建模需求，以及有限样本条件下的泛化性能瓶颈。通过提供同步采集的三种相机数据与关节状态，研究者能够深入分析视觉特征与运动控制的耦合关系，为具身智能中的感知-动作闭环系统设计奠定数据基础。

实际应用

在工业自动化场景中，dusty_3cam数据集支持开发基于视觉的抓取系统，其深度与分割信息可直接用于目标检测与位姿估计。医疗机器人领域可利用该数据集模拟手术器械操控，通过迁移学习缩短实际应用中的调试周期。数据集包含的异常操作记录更为安全控制算法提供了珍贵的负样本。

数据集最近研究