five

eval_smol_vla_1

收藏
Hugging Face2026-01-17 更新2026-01-17 收录
下载链接:
https://huggingface.co/datasets/kaiseong/eval_smol_vla_1
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集是使用LeRobot创建的,主要用于机器人技术领域。数据集包含5个episodes,5394帧,1个任务,数据文件大小为100MB,视频文件大小为200MB,帧率为30fps。数据集的结构包括动作、观察状态、图像(前视和腕部视角)、时间戳、帧索引、episode索引、索引和任务索引等特征。
提供机构:
kaiseong
创建时间:
2026-01-17
原始信息汇总

数据集概述

基本信息

  • 数据集名称: eval_smol_vla_1
  • 发布平台: Hugging Face
  • 许可证: Apache-2.0
  • 任务类别: 机器人学
  • 相关标签: LeRobot

创建与来源

  • 本数据集使用 LeRobot 创建。

数据集结构

总体统计

  • 机器人类型: piper_follower
  • 总情节数: 5
  • 总帧数: 5394
  • 总任务数: 1
  • 数据块大小: 1000
  • 数据文件总大小: 100 MB
  • 视频文件总大小: 200 MB
  • 帧率: 30 FPS
  • 数据分割: 训练集包含所有5个情节(索引0到5)。

文件组织

  • 数据文件路径模式: data/chunk-{chunk_index:03d}/file-{file_index:03d}.parquet
  • 视频文件路径模式: videos/{video_key}/chunk-{chunk_index:03d}/file-{file_index:03d}.mp4

数据特征

本数据集包含以下特征:

动作

  • 数据类型: float32
  • 形状: [7]
  • 字段名: j1, j2, j3, j4, j5, j6, gripper

观测状态

  • 数据类型: float32
  • 形状: [7]
  • 字段名: j1, j2, j3, j4, j5, j6, gripper

观测图像 - 前视摄像头

  • 数据类型: 视频
  • 形状: [720, 1280, 3] (高度,宽度,通道)
  • 视频信息:
    • 高度: 720 像素
    • 宽度: 1280 像素
    • 编解码器: av1
    • 像素格式: yuv420p
    • 是否为深度图: 否
    • 帧率: 30 FPS
    • 通道数: 3
    • 包含音频: 否

观测图像 - 腕部摄像头

  • 数据类型: 视频
  • 形状: [480, 640, 3] (高度,宽度,通道)
  • 视频信息:
    • 高度: 480 像素
    • 宽度: 640 像素
    • 编解码器: av1
    • 像素格式: yuv420p
    • 是否为深度图: 否
    • 帧率: 30 FPS
    • 通道数: 3
    • 包含音频: 否

索引与元数据

  • 时间戳: 数据类型 float32,形状 [1]
  • 帧索引: 数据类型 int64,形状 [1]
  • 情节索引: 数据类型 int64,形状 [1]
  • 索引: 数据类型 int64,形状 [1]
  • 任务索引: 数据类型 int64,形状 [1]

引用信息

  • 论文: 信息缺失
  • BibTeX引用: 信息缺失
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作