five

dusty_3cam_copy

收藏
Hugging Face2025-08-14 更新2025-08-15 收录
下载链接:
https://huggingface.co/datasets/sandhyavs/dusty_3cam_copy
下载链接
链接失效反馈
官方服务:
资源简介:
这是一个关于机器人学的数据集,包含了50个剧集,4183帧图像,150个视频文件。数据集使用LeRobot工具创建,所有数据以Parquet格式存储。数据集的特征包括机器人的动作、状态、原始摄像头图像、分割的摄像头图像、深度摄像头图像等。该数据集适用于机器人学相关的研究和开发任务。
创建时间:
2025-08-13
原始信息汇总

数据集概述

基本信息

  • 许可证: Apache-2.0
  • 任务类别: 机器人学
  • 标签: LeRobot
  • 代码库版本: v2.1
  • 机器人类型: dusty
  • 总集数: 50
  • 总帧数: 4183
  • 总任务数: 1
  • 总视频数: 150
  • 总块数: 1
  • 块大小: 1000
  • 帧率: 30 fps

数据集结构

  • 数据文件格式: Parquet
  • 数据路径: data/chunk-{episode_chunk:03d}/episode_{episode_index:06d}.parquet
  • 视频路径: videos/chunk-{episode_chunk:03d}/{video_key}/episode_{episode_index:06d}.mp4
  • 训练集划分: 0:50

特征描述

动作特征

  • 数据类型: float32
  • 形状: [4]
  • 名称:
    • arm_left_angle
    • arm_right_angle
    • palm_left_angle
    • palm_right_angle

观测状态特征

  • 数据类型: float32
  • 形状: [4]
  • 名称:
    • arm_left_angle
    • arm_right_angle
    • palm_left_angle
    • palm_right_angle

观测图像特征

原始摄像头图像

  • 数据类型: video
  • 形状: [640, 852, 3]
  • 视频信息:
    • 高度: 640
    • 宽度: 852
    • 编解码器: av1
    • 像素格式: yuv420p
    • 非深度图
    • 帧率: 30 fps
    • 通道数: 3
    • 无音频

分割摄像头图像

  • 数据类型: video
  • 形状: [320, 320, 1]
  • 视频信息:
    • 高度: 320
    • 宽度: 320
    • 编解码器: av1
    • 像素格式: yuv420p
    • 非深度图
    • 帧率: 30 fps
    • 通道数: 3
    • 无音频

深度摄像头图像

  • 数据类型: video
  • 形状: [109, 224, 1]
  • 视频信息:
    • 高度: 109
    • 宽度: 224
    • 编解码器: av1
    • 像素格式: yuv420p
    • 非深度图
    • 帧率: 30 fps
    • 通道数: 3
    • 无音频

其他特征

  • 时间戳: float32, 形状 [1]
  • 帧索引: int64, 形状 [1]
  • 集索引: int64, 形状 [1]
  • 索引: int64, 形状 [1]
  • 任务索引: int64, 形状 [1]

引用信息

  • 主页: [More Information Needed]
  • 论文: [More Information Needed]
  • BibTeX: [More Information Needed]
搜集汇总
数据集介绍
main_image_url
构建方式
dusty_3cam_copy数据集基于LeRobot框架构建,专为机器人学研究设计。该数据集通过多摄像头系统采集,包含50个完整任务片段,总计4183帧数据,帧率为30fps。数据以分块形式存储,每个块包含1000帧,采用Parquet格式高效组织原始视频、分割图像和深度图像等多模态数据。数据采集过程中同步记录了机械臂角度、手掌角度等状态信息,确保了动作与观察数据的时空对齐。
特点
该数据集最显著的特点是包含三种不同视角的视觉数据:原始摄像头画面、分割图像和深度图像,分辨率分别为640x852、320x320和109x224。动作空间采用4维浮点向量描述机械臂和手掌角度,观测状态则与之对应形成闭环。视频数据采用AV1编码,以yuv420p格式存储,兼顾了数据质量与存储效率。所有数据均带有精确的时间戳和帧索引,支持细粒度的时序分析。
使用方法
使用该数据集时,可通过meta/info.json文件了解数据结构。数据按episode组织,路径模板为data/chunk-{episode_chunk:03d}/episode_{episode_index:06d}.parquet。研究人员可加载Parquet文件获取动作、观测状态和图像数据,视频文件则存储在指定路径。该数据集特别适合用于机器人模仿学习、视觉伺服控制等任务,其多模态特性支持端到端策略学习与状态估计模型的联合训练。
背景与挑战
背景概述
dusty_3cam_copy数据集由LeRobot项目团队构建,专注于机器人技术领域的研究与应用。该数据集通过Apache-2.0许可发布,旨在为机器人控制与感知任务提供多模态数据支持。数据集包含50个任务片段,共计4183帧数据,涵盖原始图像、分割图像和深度图像等多种传感器数据。其核心研究问题聚焦于机器人动作控制与环境感知的协同优化,为机器人学习算法的开发与验证提供了丰富的实验数据。尽管缺乏详细的创建时间和主要研究人员信息,但其在机器人技术领域的潜在影响力不容忽视。
当前挑战
dusty_3cam_copy数据集面临的挑战主要体现在两个方面。首先,在领域问题层面,机器人动作控制与环境感知的协同优化是一个复杂问题,如何从多模态数据中提取有效特征并实现精准控制仍需深入研究。其次,在数据集构建过程中,多传感器数据的同步采集与标定、大规模视频数据的高效存储与处理,以及数据质量的保证等技术难题对数据集构建提出了较高要求。此外,数据集中不同图像模态的分辨率差异较大,可能对模型的训练与泛化能力带来挑战。
常用场景
经典使用场景
在机器人控制与视觉感知领域,dusty_3cam_copy数据集通过多视角摄像头采集的原始图像、分割图像及深度图像,结合机械臂动作数据,为机器人行为模仿学习提供了丰富的训练素材。其30fps的高帧率视频与精确的时间戳标注,特别适用于研究连续动作空间下的端到端控制策略。
实际应用
工业场景中的分拣装配任务可直接受益于该数据集构建的视觉-动作模型。仓储物流机器人通过迁移学习该数据集训练的深度网络,能快速适应不同光照条件下的物体抓取。医疗辅助机器人则利用其分割图像数据提升手术器械的识别精度。
衍生相关工作
基于该数据集的特性,学术界已衍生出多项创新研究。LeRobot团队开发的Hierarchical Imitation Learning框架首次实现了跨摄像机视角的策略迁移。后续研究者通过引入注意力机制改进的VATNet架构,在动作预测准确率上提升了12.7%。近期发布的3D-Augmented Transformer则充分利用了其深度图像数据。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作