five

video_encoder_config_test_v2_4_20260513_153750

收藏
Hugging Face2026-05-13 更新2026-05-13 收录
下载链接:
https://huggingface.co/datasets/CarolinePascal/video_encoder_config_test_v2_4_20260513_153750
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集是使用LeRobot创建的机器人技术数据集,主要用于机器人控制和学习任务。数据集包含一个情节(episode),共121帧数据,帧率为30fps。数据特征包括:6维浮点型动作向量(控制机械臂的肩部、肘部、腕部和夹持器位置)、6维浮点型观测状态向量(与动作向量相同)、来自两个摄像头视角(手腕和顶部)的视频观测(分辨率480x640,3通道RGB,H.264编码),以及时间戳、帧索引、情节索引、任务索引等元数据。数据以parquet文件格式存储,视频以mp4格式存储。机器人类型为so_follower。数据集总大小:数据文件100MB,视频文件200MB。

This dataset is a robotics dataset created using LeRobot, primarily used for robot control and learning tasks. It contains one episode with 121 frames of data at a frame rate of 30fps. The data features include: a 6-dimensional floating-point action vector (controlling the shoulder, elbow, wrist, and gripper positions of the robotic arm), a 6-dimensional floating-point observation state vector (same as the action vector), video observations from two camera perspectives (wrist and top) with a resolution of 480x640, 3-channel RGB, H.264 encoding, as well as metadata such as timestamps, frame indices, episode indices, and task indices. The data is stored in parquet file format, and videos are stored in mp4 format. The robot type is so_follower. The total dataset size is 100MB for data files and 200MB for video files.
提供机构:
CarolinePascal
创建时间:
2026-05-13
原始信息汇总

数据集概述

该数据集(CarolinePascal/video_encoder_config_test_v2_4_20260513_153750)是一个用于机器人领域的数据集,基于 LeRobot 框架构建,采用 Apache-2.0 许可证。

数据集基本信息

  • 许可证:Apache-2.0
  • 任务类别:机器人(robotics)
  • 标签:LeRobot
  • 创建工具:LeRobot(https://github.com/huggingface/lerobot)
  • 代码库版本:v3.0
  • 帧率:30 FPS
  • 机器人类型:so_follower
  • 总片段数:1
  • 总帧数:121
  • 总任务数:1
  • 数据分割:训练集(train),范围 0:1

数据特征结构

数据包含以下特征字段:

  • action:动作指令,包含6个关节位置(shoulder_pan.pos、shoulder_lift.pos、elbow_flex.pos、wrist_flex.pos、wrist_roll.pos、gripper.pos),数据类型为 float32。
  • observation.state:机器人状态观测,同样包含6个关节位置,数据类型为 float32。
  • observation.images.wrist:腕部摄像头图像,视频格式,分辨率 480×640,3通道(RGB),编码为 h264,帧率30 FPS。
  • observation.images.top:顶部摄像头图像,视频格式,分辨率 480×640,3通道(RGB),编码为 h264,帧率30 FPS。
  • timestamp:时间戳,float32 类型。
  • frame_index:帧索引,int64 类型。
  • episode_index:片段索引,int64 类型。
  • index:全局索引,int64 类型。
  • task_index:任务索引,int64 类型。

数据文件信息

  • 数据文件格式:.Parquet
  • 视频文件格式:.mp4
  • 数据存储路径规则
    • 数据:data/chunk-{chunk_index:03d}/file-{file_index:03d}.parquet
    • 视频:videos/{video_key}/chunk-{chunk_index:03d}/file-{file_index:03d}.mp4
  • 数据文件总大小:约 100 MB
  • 视频文件总大小:约 200 MB
  • 数据块大小:1000

可视化

您可以通过 LeRobot 可视化工具在线浏览该数据集:https://huggingface.co/spaces/lerobot/visualize_dataset?path=CarolinePascal/video_encoder_config_test_v2_4_20260513_153750

5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作