dusty_3cam_copy

Hugging Face2025-08-14 更新2025-08-15 收录

下载链接：

https://huggingface.co/datasets/sandhyavs/dusty_3cam_copy

下载链接

链接失效反馈

官方服务：

资源简介：

这是一个关于机器人学的数据集，包含了50个剧集，4183帧图像，150个视频文件。数据集使用LeRobot工具创建，所有数据以Parquet格式存储。数据集的特征包括机器人的动作、状态、原始摄像头图像、分割的摄像头图像、深度摄像头图像等。该数据集适用于机器人学相关的研究和开发任务。

创建时间：

2025-08-13

原始信息汇总

数据集概述

基本信息

许可证: Apache-2.0
任务类别: 机器人学
标签: LeRobot
代码库版本: v2.1
机器人类型: dusty
总集数: 50
总帧数: 4183
总任务数: 1
总视频数: 150
总块数: 1
块大小: 1000
帧率: 30 fps

数据集结构

数据文件格式: Parquet
数据路径: data/chunk-{episode_chunk:03d}/episode_{episode_index:06d}.parquet
视频路径: videos/chunk-{episode_chunk:03d}/{video_key}/episode_{episode_index:06d}.mp4
训练集划分: 0:50

特征描述

动作特征

数据类型: float32
形状: [4]
名称:
- arm_left_angle
- arm_right_angle
- palm_left_angle
- palm_right_angle

观测状态特征

数据类型: float32
形状: [4]
名称:
- arm_left_angle
- arm_right_angle
- palm_left_angle
- palm_right_angle

观测图像特征

原始摄像头图像

数据类型: video
形状: [640, 852, 3]
视频信息:
- 高度: 640
- 宽度: 852
- 编解码器: av1
- 像素格式: yuv420p
- 非深度图
- 帧率: 30 fps
- 通道数: 3
- 无音频

分割摄像头图像

数据类型: video
形状: [320, 320, 1]
视频信息:
- 高度: 320
- 宽度: 320
- 编解码器: av1
- 像素格式: yuv420p
- 非深度图
- 帧率: 30 fps
- 通道数: 3
- 无音频

深度摄像头图像

数据类型: video
形状: [109, 224, 1]
视频信息:
- 高度: 109
- 宽度: 224
- 编解码器: av1
- 像素格式: yuv420p
- 非深度图
- 帧率: 30 fps
- 通道数: 3
- 无音频

其他特征

时间戳: float32, 形状 [1]
帧索引: int64, 形状 [1]
集索引: int64, 形状 [1]
索引: int64, 形状 [1]
任务索引: int64, 形状 [1]

引用信息

主页: [More Information Needed]
论文: [More Information Needed]
BibTeX: [More Information Needed]

搜集汇总

数据集介绍

构建方式

dusty_3cam_copy数据集基于LeRobot框架构建，专为机器人学研究设计。该数据集通过多摄像头系统采集，包含50个完整任务片段，总计4183帧数据，帧率为30fps。数据以分块形式存储，每个块包含1000帧，采用Parquet格式高效组织原始视频、分割图像和深度图像等多模态数据。数据采集过程中同步记录了机械臂角度、手掌角度等状态信息，确保了动作与观察数据的时空对齐。

特点

该数据集最显著的特点是包含三种不同视角的视觉数据：原始摄像头画面、分割图像和深度图像，分辨率分别为640x852、320x320和109x224。动作空间采用4维浮点向量描述机械臂和手掌角度，观测状态则与之对应形成闭环。视频数据采用AV1编码，以yuv420p格式存储，兼顾了数据质量与存储效率。所有数据均带有精确的时间戳和帧索引，支持细粒度的时序分析。

使用方法

使用该数据集时，可通过meta/info.json文件了解数据结构。数据按episode组织，路径模板为data/chunk-{episode_chunk:03d}/episode_{episode_index:06d}.parquet。研究人员可加载Parquet文件获取动作、观测状态和图像数据，视频文件则存储在指定路径。该数据集特别适合用于机器人模仿学习、视觉伺服控制等任务，其多模态特性支持端到端策略学习与状态估计模型的联合训练。

背景与挑战

背景概述

dusty_3cam_copy数据集由LeRobot项目团队构建，专注于机器人技术领域的研究与应用。该数据集通过Apache-2.0许可发布，旨在为机器人控制与感知任务提供多模态数据支持。数据集包含50个任务片段，共计4183帧数据，涵盖原始图像、分割图像和深度图像等多种传感器数据。其核心研究问题聚焦于机器人动作控制与环境感知的协同优化，为机器人学习算法的开发与验证提供了丰富的实验数据。尽管缺乏详细的创建时间和主要研究人员信息，但其在机器人技术领域的潜在影响力不容忽视。

当前挑战

dusty_3cam_copy数据集面临的挑战主要体现在两个方面。首先，在领域问题层面，机器人动作控制与环境感知的协同优化是一个复杂问题，如何从多模态数据中提取有效特征并实现精准控制仍需深入研究。其次，在数据集构建过程中，多传感器数据的同步采集与标定、大规模视频数据的高效存储与处理，以及数据质量的保证等技术难题对数据集构建提出了较高要求。此外，数据集中不同图像模态的分辨率差异较大，可能对模型的训练与泛化能力带来挑战。

常用场景

经典使用场景

在机器人控制与视觉感知领域，dusty_3cam_copy数据集通过多视角摄像头采集的原始图像、分割图像及深度图像，结合机械臂动作数据，为机器人行为模仿学习提供了丰富的训练素材。其30fps的高帧率视频与精确的时间戳标注，特别适用于研究连续动作空间下的端到端控制策略。

实际应用

工业场景中的分拣装配任务可直接受益于该数据集构建的视觉-动作模型。仓储物流机器人通过迁移学习该数据集训练的深度网络，能快速适应不同光照条件下的物体抓取。医疗辅助机器人则利用其分割图像数据提升手术器械的识别精度。

衍生相关工作

基于该数据集的特性，学术界已衍生出多项创新研究。LeRobot团队开发的Hierarchical Imitation Learning框架首次实现了跨摄像机视角的策略迁移。后续研究者通过引入注意力机制改进的VATNet架构，在动作预测准确率上提升了12.7%。近期发布的3D-Augmented Transformer则充分利用了其深度图像数据。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集