five

eval_collect_mvactd25

收藏
Hugging Face2026-05-20 更新2026-05-20 收录
下载链接:
https://huggingface.co/datasets/stevenworkspace/eval_collect_mvactd25
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集是使用LeRobot创建的机器人数据集,专门用于移动AI机器人任务。它包含一个总剧集和1084帧数据,采样频率为30 fps。数据特征包括动作和观测:动作由16个浮点数组成,代表左右关节的位置和速度;观测包括状态和来自三个摄像头(cam_high、cam_left_wrist、cam_right_wrist)的图像视频,每个视频的分辨率为480x640像素,3个通道,采用AV1编码。数据集结构以parquet文件格式存储,总数据文件大小为100 MB,视频文件大小为200 MB,适用于训练机器人控制和视觉任务。

This dataset is a robot dataset created using LeRobot, specifically designed for mobile AI robot tasks. It contains one total episode and 1084 frames of data, with a sampling frequency of 30 fps. Data features include actions and observations: actions consist of 16 floating-point numbers representing the position and velocity of left and right joints; observations include state and image videos from three cameras (cam_high, cam_left_wrist, cam_right_wrist), each video with a resolution of 480x640 pixels, 3 channels, encoded in AV1. The dataset structure is stored in parquet file format, with a total data file size of 100 MB and video file size of 200 MB, suitable for training robot control and vision tasks.
提供机构:
stevenworkspace
创建时间:
2026-05-20
原始信息汇总

数据集概述

该数据集名为 eval_collect_mvactd25,由 LeRobot 框架创建,专为机器人领域研究设计。数据集采用 Apache-2.0 许可证。

基本信息

  • 创建工具: LeRobot
  • 许可证: Apache-2.0
  • 机器人类型: mobileai_robot
  • 数据集版本: v3.0

数据规模

  • 总片数: 1
  • 总帧数: 1084
  • 总任务数: 1
  • 块大小: 1000
  • 数据文件大小: 100 MB
  • 视频文件大小: 200 MB
  • 帧率: 30 FPS

数据分割

数据集包含一个训练集,其定义为 "train": "0:1",表示所有数据均用于训练。

数据结构

数据以 Parquet 格式存储,路径为 data/chunk-{chunk_index:03d}/file-{file_index:03d}.parquet。视频以 MP4 格式存储,路径为 videos/{video_key}/chunk-{chunk_index:03d}/file-{file_index:03d}.mp4

特征详情

  • action: 包含 16 个维度的动作指令(float32),涵盖左右机械臂各 6 个关节位置、左右底盘关节位置以及线速度和角速度。
    • 形状: [16]
  • observation.state: 包含 16 个维度的机器人状态观测(float32),与动作空间结构一致。
    • 形状: [16]
  • observation.images.cam_high: 高清视觉图像(视频),分辨率为 480x640,3 通道 RGB,使用 AV1 编解码器,30 FPS。
    • 形状: [480, 640, 3]
  • observation.images.cam_left_wrist: 左腕部视觉图像(视频),分辨率为 480x640,3 通道 RGB,使用 AV1 编解码器,30 FPS。
    • 形状: [480, 640, 3]
  • observation.images.cam_right_wrist: 右腕部视觉图像(视频),分辨率为 480x640,3 通道 RGB,使用 AV1 编解码器,30 FPS。
    • 形状: [480, 640, 3]
  • timestamp: 时间戳(float32),形状 [1]
  • frame_index: 帧索引(int64),形状 [1]
  • episode_index: 片段索引(int64),形状 [1]
  • index: 全局索引(int64),形状 [1]
  • task_index: 任务索引(int64),形状 [1]

附加信息

5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作