five

eval_SmolVLA-100-300K

收藏
Hugging Face2026-03-12 更新2026-03-12 收录
下载链接:
https://huggingface.co/datasets/castlejin/eval_SmolVLA-100-300K
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集是使用LeRobot创建的,主要用于机器人技术领域。数据集包含12575帧,2个episodes,1个任务,数据文件大小为100MB,视频文件大小为200MB,帧率为30fps。数据集中包含动作、观测状态、图像(顶部和手腕视角)、时间戳、帧索引、episode索引、索引和任务索引等特征。
提供机构:
castlejin
创建时间:
2026-03-12
原始信息汇总

数据集概述

基本信息

  • 数据集名称: eval_SmolVLA-100-300K
  • 创建工具: LeRobot (https://github.com/huggingface/lerobot)
  • 许可证: Apache-2.0
  • 任务类别: 机器人学
  • 标签: LeRobot

数据集结构

  • 数据格式: Parquet 文件
  • 数据文件路径模式: data/chunk-{chunk_index:03d}/file-{file_index:03d}.parquet
  • 视频文件路径模式: videos/{video_key}/chunk-{chunk_index:03d}/file-{file_index:03d}.mp4
  • 数据分块大小: 1000 帧
  • 帧率: 30 FPS
  • 数据划分: 训练集包含全部 2 个片段(索引 0 到 2)

数据规模

  • 总片段数: 2
  • 总帧数: 12575
  • 总任务数: 1
  • 数据文件总大小: 100 MB
  • 视频文件总大小: 200 MB

数据特征

动作特征 (action)

  • 数据类型: float32
  • 形状: [6]
  • 维度名称:
    • shoulder_pan.pos
    • shoulder_lift.pos
    • elbow_flex.pos
    • wrist_flex.pos
    • wrist_roll.pos
    • gripper.pos

状态观测 (observation.state)

  • 数据类型: float32
  • 形状: [6]
  • 维度名称: 与动作特征相同

顶部摄像头图像 (observation.images.top)

  • 数据类型: 视频
  • 形状: [544, 720, 3] (高度, 宽度, 通道)
  • 视频信息:
    • 高度: 544 像素
    • 宽度: 720 像素
    • 编解码器: AV1
    • 像素格式: yuv420p
    • 是否为深度图: 否
    • 帧率: 30 FPS
    • 通道数: 3
    • 包含音频: 否

腕部摄像头图像 (observation.images.wrist)

  • 数据类型: 视频
  • 形状: [544, 720, 3] (高度, 宽度, 通道)
  • 视频信息: 与顶部摄像头图像相同

元数据特征

  • 时间戳 (timestamp): float32 类型,形状 [1]
  • 帧索引 (frame_index): int64 类型,形状 [1]
  • 片段索引 (episode_index): int64 类型,形状 [1]
  • 索引 (index): int64 类型,形状 [1]
  • 任务索引 (task_index): int64 类型,形状 [1]

技术信息

  • 代码库版本: v3.0
  • 机器人类型: so_follower

引用信息

  • 主页: 未提供
  • 论文: 未提供
  • BibTeX 引用: 未提供
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作