five

picking_smolVLA

收藏
Hugging Face2026-04-03 更新2026-04-03 收录
下载链接:
https://huggingface.co/datasets/VMuccio/picking_smolVLA
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集为HuggingFace LeRobot格式机器人数据集。
提供机构:
VMuccio
创建时间:
2026-04-03
原始信息汇总

数据集概述

基本属性

  • 数据集名称: picking_smolVLA
  • 创建工具: LeRobot (https://github.com/huggingface/lerobot)
  • 许可证: Apache-2.0
  • 任务类别: 机器人学
  • 标签: LeRobot

数据集规模与结构

  • 总情节数: 60
  • 总帧数: 17457
  • 总任务数: 4
  • 数据块大小: 1000
  • 数据文件大小: 100 MB
  • 视频文件大小: 200 MB
  • 帧率: 30 FPS
  • 数据分割: 训练集 (0:60)
  • 数据文件格式: Parquet
  • 视频文件格式: MP4 (AV1 编码)
  • 代码库版本: v3.0
  • 机器人类型: so_follower

数据特征

动作空间

  • 特征名称: action
  • 数据类型: float32
  • 形状: [6]
  • 维度名称: shoulder_pan.pos, shoulder_lift.pos, elbow_flex.pos, wrist_flex.pos, wrist_roll.pos, gripper.pos

观测空间

状态观测

  • 特征名称: observation.state
  • 数据类型: float32
  • 形状: [6]
  • 维度名称: shoulder_pan.pos, shoulder_lift.pos, elbow_flex.pos, wrist_flex.pos, wrist_roll.pos, gripper.pos

图像观测

夹爪摄像头图像

  • 特征名称: observation.images.gripper
  • 数据类型: video
  • 形状: [480, 640, 3]
  • 维度名称: height, width, channels
  • 视频信息: 高度480像素,宽度640像素,3通道,AV1编码,YUV420p像素格式,非深度图,30 FPS,无音频

顶部摄像头图像

  • 特征名称: observation.images.top
  • 数据类型: video
  • 形状: [480, 640, 3]
  • 维度名称: height, width, channels
  • 视频信息: 高度480像素,宽度640像素,3通道,AV1编码,YUV420p像素格式,非深度图,30 FPS,无音频

前方摄像头图像

  • 特征名称: observation.images.front
  • 数据类型: video
  • 形状: [480, 640, 3]
  • 维度名称: height, width, channels
  • 视频信息: 高度480像素,宽度640像素,3通道,AV1编码,YUV420p像素格式,非深度图,30 FPS,无音频

索引与元数据

  • 时间戳: float32, 形状[1]
  • 帧索引: int64, 形状[1]
  • 情节索引: int64, 形状[1]
  • 索引: int64, 形状[1]
  • 任务索引: int64, 形状[1]

文件路径模式

  • 数据文件路径: data/chunk-{chunk_index:03d}/file-{file_index:03d}.parquet
  • 视频文件路径: videos/{video_key}/chunk-{chunk_index:03d}/file-{file_index:03d}.mp4

可视化

  • 可视化空间: https://huggingface.co/spaces/lerobot/visualize_dataset?path=VMuccio/picking_smolVLA
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作