five

video_encoder_config_test_v2_1_20260513_151841

收藏
Hugging Face2026-05-13 更新2026-05-13 收录
下载链接:
https://huggingface.co/datasets/CarolinePascal/video_encoder_config_test_v2_1_20260513_151841
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集是一个机器人学领域的数据集,专注于机器人控制任务,使用LeRobot工具创建。它包含一个总时长为691帧的单个episode,以30fps的帧率采集。数据特征包括机器人的动作(6维关节位置:肩部平移、肩部提升、肘部弯曲、手腕弯曲、手腕旋转和夹爪位置)、观测状态(与动作相同的6维关节位置)以及两个视角的视频观测(手腕和顶部视角,均为480x640分辨率,3通道,H.264编码)。此外,数据集还包含时间戳、帧索引、episode索引、任务索引等元数据。数据集采用Apache 2.0许可证,存储为parquet格式,总数据文件大小为100MB,视频文件大小为200MB。机器人类型为so_follower,适用于训练机器人控制模型。
提供机构:
CarolinePascal
创建时间:
2026-05-13
原始信息汇总

数据集概述

基本信息

  • 数据集名称: video_encoder_config_test_v2_1_20260513_151841
  • 许可证: Apache-2.0
  • 任务类别: 机器人学 (Robotics)
  • 标签: LeRobot
  • 创建工具: 基于 LeRobot 构建

数据集规模

  • 总片段数 (Episodes): 1
  • 总帧数 (Frames): 691
  • 总任务数 (Tasks): 1
  • 帧率 (FPS): 30
  • 数据文件大小: 100 MB
  • 视频文件大小: 200 MB

数据集结构

  • 数据文件格式: Parquet (data/*/*.parquet)
  • 视频文件格式: MP4 (videos/{video_key}/chunk-{chunk_index:03d}/file-{file_index:03d}.mp4)
  • 数据切分:
    • 训练集: 0:1 (全部数据用于训练)

特征 (Features)

特征名称 数据类型 形状 描述
action float32 (6,) 机器人动作指令,包括6个关节位置
observation.state float32 (6,) 机器人状态观测,与动作对应6个关节位置
observation.images.wrist video (480, 640, 3) 腕部摄像头视频,分辨率480x640,RGB三通道
observation.images.top video (480, 640, 3) 顶部摄像头视频,分辨率480x640,RGB三通道
timestamp float32 (1,) 时间戳
frame_index int64 (1,) 帧索引
episode_index int64 (1,) 片段索引
index int64 (1,) 全局索引
task_index int64 (1,) 任务索引

视频配置详情

  • 视频编解码器: H.264
  • 像素格式: yuv444p
  • 视频帧率: 30 FPS
  • 视频质量参数:
    • CRF: 10
    • g: 2 (关键帧间隔)
  • 视频后端: PyAV
  • 是否为深度图: 否
  • 无音频

机器人信息

  • 机器人类型: so_follower

代码库版本

  • Codebase 版本: v3.0
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作