eval_SmolVLA-100-120k-720p
收藏Hugging Face2026-03-12 更新2026-03-12 收录
下载链接:
https://huggingface.co/datasets/castlejin/eval_SmolVLA-100-120k-720p
下载链接
链接失效反馈官方服务:
资源简介:
该数据集是通过LeRobot创建的机器人学习数据集,包含1个完整的情节和3863帧数据。数据集结构包括动作数据(6个关节位置)、观察状态(6个关节位置)、顶部和手腕摄像头拍摄的视频图像(720x1280分辨率,30fps),以及时间戳、帧索引、情节索引等元数据。数据以parquet格式存储,视频以mp4格式存储,总数据量约300MB(数据100MB+视频200MB)。
This dataset is a robotic learning dataset created via LeRobot, containing 1 full episode and 3863 frames of data. The dataset structure includes action data (6 joint positions), observation states (6 joint positions), video images captured by the top and wrist cameras (720×1280 resolution, 30 fps), as well as metadata such as timestamps, frame indices and episode indices. The data is stored in Parquet format, while the videos are stored in MP4 format, with a total data volume of approximately 300 MB (100 MB for data and 200 MB for videos).
提供机构:
castlejin
创建时间:
2026-03-12
原始信息汇总
数据集概述
基本信息
- 数据集名称: eval_SmolVLA-100-120k-720p
- 创建工具: LeRobot (https://github.com/huggingface/lerobot)
- 许可证: Apache-2.0
- 任务类别: 机器人学
- 标签: LeRobot
数据集规模与结构
- 总情节数: 1
- 总帧数: 3863
- 总任务数: 1
- 数据块大小: 1000
- 数据文件总大小: 100 MB
- 视频文件总大小: 200 MB
- 帧率: 30 FPS
- 数据格式: Parquet
- 视频格式: MP4 (AV1 编码)
- 数据路径模式:
data/chunk-{chunk_index:03d}/file-{file_index:03d}.parquet - 视频路径模式:
videos/{video_key}/chunk-{chunk_index:03d}/file-{file_index:03d}.mp4 - 数据划分: 训练集 (100%,索引范围: 0:1)
数据特征
动作特征 (action)
- 数据类型: float32
- 形状: [6]
- 特征名称:
- shoulder_pan.pos
- shoulder_lift.pos
- elbow_flex.pos
- wrist_flex.pos
- wrist_roll.pos
- gripper.pos
状态观测特征 (observation.state)
- 数据类型: float32
- 形状: [6]
- 特征名称:
- shoulder_pan.pos
- shoulder_lift.pos
- elbow_flex.pos
- wrist_flex.pos
- wrist_roll.pos
- gripper.pos
顶部图像观测特征 (observation.images.top)
- 数据类型: 视频
- 形状: [720, 1280, 3] (高度, 宽度, 通道)
- 视频信息:
- 高度: 720 像素
- 宽度: 1280 像素
- 编解码器: av1
- 像素格式: yuv420p
- 是否为深度图: 否
- 帧率: 30 FPS
- 通道数: 3
- 包含音频: 否
腕部图像观测特征 (observation.images.wrist)
- 数据类型: 视频
- 形状: [720, 1280, 3] (高度, 宽度, 通道)
- 视频信息:
- 高度: 720 像素
- 宽度: 1280 像素
- 编解码器: av1
- 像素格式: yuv420p
- 是否为深度图: 否
- 帧率: 30 FPS
- 通道数: 3
- 包含音频: 否
元数据特征
- 时间戳 (
timestamp): float32, 形状 [1] - 帧索引 (
frame_index): int64, 形状 [1] - 情节索引 (
episode_index): int64, 形状 [1] - 索引 (
index): int64, 形状 [1] - 任务索引 (
task_index): int64, 形状 [1]
技术详情
- 代码库版本: v3.0
- 机器人类型: so_follower
- 图像分辨率: 720p (1280x720)



