five

eval_smolvla_harvest_v1_multitask2

收藏
Hugging Face2026-05-14 更新2026-05-14 收录
下载链接:
https://huggingface.co/datasets/tomato-store/eval_smolvla_harvest_v1_multitask2
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集是使用LeRobot平台创建的一个机器人学数据集,专门用于双臂机器人(bi_so_follower类型)的任务执行。数据集包含2个完整的情节(episodes),总计686帧数据,覆盖2个不同的任务。数据以parquet文件格式存储,并附有对应的mp4视频文件。核心特征包括动作数据(12维浮点数组,表示左右机械臂的12个关节位置,如肩部、肘部、手腕和夹爪的位置)、观测状态(与动作相同的12维关节位置)、以及来自三个摄像头的视觉观测(camera1和camera2分辨率为480x640,camera3分辨率为360x640,均为RGB视频,帧率20fps)。此外,数据集还包含时间戳、帧索引、情节索引、任务索引等元数据。该数据集适用于机器人控制、模仿学习或强化学习等研究,旨在提供多模态的机器人交互数据。

This robotics dataset was developed using the LeRobot platform, tailored for task execution of dual-arm robots (bi_so_follower type). It contains 2 complete episodes, totaling 686 frames of data covering 2 distinct tasks. The data is stored in Parquet file format, with corresponding MP4 video files provided. Its core features include action data (a 12-dimensional floating-point array representing 12 joint positions of the left and right robotic arms, such as those of the shoulder, elbow, wrist and gripper), observation states (12-dimensional joint positions consistent with the action data), and visual observations from three cameras: camera1 and camera2 have a resolution of 480x640, camera3 has a resolution of 360x640, all are RGB videos with a frame rate of 20fps. Additionally, the dataset includes metadata such as timestamps, frame indices, episode indices and task indices. This dataset is applicable to research in robotic control, imitation learning, reinforcement learning and related fields, aiming to provide multi-modal robotic interaction data.
提供机构:
tomato-store
创建时间:
2026-05-14
原始信息汇总

数据集概述

数据集名称:eval_smolvla_harvest_v1_multitask2
主页:https://huggingface.co/datasets/tomato-store/eval_smolvla_harvest_v1_multitask2
许可证:Apache-2.0
任务类别:机器人学(robotics)
标签:LeRobot

数据集结构

该数据集使用 LeRobot 创建,采用 Parquet 格式存储数据,包含以下关键信息:

  • 代码库版本:v3.0
  • 机器人类型:bi_so_follower
  • 总 Episode 数:2
  • 总帧数:686
  • 总任务数:2
  • Chunk 大小:1000
  • 数据文件大小:100 MB
  • 视频文件大小:200 MB
  • 帧率:20 FPS
  • 数据集划分:仅包含训练集(train: 0:2)

数据特征

数据集包含以下特征字段:

动作(action)

  • 数据类型:float32
  • 形状:[12]
  • 字段说明:左右机械臂各 6 个关节位置(包括肩关节、肘关节、腕关节和夹爪),共 12 维

观测状态(observation.state)

  • 数据类型:float32
  • 形状:[12]
  • 字段说明:与动作字段结构相同,包含左右机械臂各 6 个关节位置

观测图像(observation.images)

包含三个摄像头视角的图像数据:

  1. camera1:分辨率 480×640,3 通道,H.264 编码,20 FPS
  2. camera2:分辨率 480×640,3 通道,H.264 编码,20 FPS
  3. camera3:分辨率 360×640,3 通道,H.264 编码,20 FPS

其他特征

  • timestamp:时间戳(float32,形状 [1])
  • frame_index:帧索引(int64,形状 [1])
  • episode_index:Episode 索引(int64,形状 [1])
  • index:全局索引(int64,形状 [1])
  • task_index:任务索引(int64,形状 [1])

存储路径

  • 数据文件路径data/chunk-{chunk_index:03d}/file-{file_index:03d}.parquet
  • 视频文件路径videos/{video_key}/chunk-{chunk_index:03d}/file-{file_index:03d}.mp4
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作