test_g

Hugging Face2025-07-15 更新2025-07-16 收录

下载链接：

https://huggingface.co/datasets/ameimei/test_g

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集使用LeRobot创建，与机器人学相关。数据集包含2个视频文件，分为1个块，每个块包含1000个数据点。数据集的帧率为30fps，共有878帧，2个剧集，1个任务。数据集的结构包括动作、观察状态、前视图图像等特征。数据以Parquet文件格式存储，视频为AV1编码的MP4文件。数据集仅在训练集上有分割。

创建时间：

2025-07-10

原始信息汇总

数据集概述

基本信息

许可证: apache-2.0
任务类别: robotics
标签: LeRobot
创建工具: LeRobot

数据集结构

数据文件格式: parquet
配置文件: default
数据文件路径: data//.parquet

元数据信息

代码库版本: v2.1
机器人类型: so101_follower
总集数: 2
总帧数: 878
总任务数: 1
总视频数: 2
总块数: 1
块大小: 1000
帧率: 30 fps
训练集划分: 0:2

数据特征

动作 (action):
- 数据类型: float32
- 形状: [6]
- 名称: shoulder_pan.pos, shoulder_lift.pos, elbow_flex.pos, wrist_flex.pos, wrist_roll.pos, gripper.pos
观测状态 (observation.state):
- 数据类型: float32
- 形状: [6]
- 名称: shoulder_pan.pos, shoulder_lift.pos, elbow_flex.pos, wrist_flex.pos, wrist_roll.pos, gripper.pos
观测图像 (observation.images.front):
- 数据类型: video
- 形状: [480, 640, 3]
- 名称: height, width, channels
- 视频信息:
  - 高度: 480
  - 宽度: 640
  - 编解码器: av1
  - 像素格式: yuv420p
  - 是否为深度图: false
  - 帧率: 30 fps
  - 通道数: 3
  - 是否包含音频: false
时间戳 (timestamp):
- 数据类型: float32
- 形状: [1]
帧索引 (frame_index):
- 数据类型: int64
- 形状: [1]
集索引 (episode_index):
- 数据类型: int64
- 形状: [1]
索引 (index):
- 数据类型: int64
- 形状: [1]
任务索引 (task_index):
- 数据类型: int64
- 形状: [1]

引用信息

BibTeX: [More Information Needed]

搜集汇总

数据集介绍

构建方式

在机器人技术领域，test_g数据集通过LeRobot框架精心构建，采用Apache 2.0开源许可。该数据集包含2个完整的情节，总计878帧数据，以30帧每秒的速率采集。数据以分块形式存储，每个分块容量为1000帧，采用Parquet格式高效组织，确保数据的完整性和可访问性。

使用方法

该数据集适用于机器人控制算法的训练与验证，用户可通过加载Parquet文件访问动作、观测及视频数据。支持按情节或帧索引进行数据切片，便于机器学习模型输入。结合LeRobot框架，可实现端到端的机器人学习任务，如模仿学习或强化学习，推动自动化系统的智能化发展。

背景与挑战

背景概述

机器人学习领域近年来致力于构建大规模行为数据集以推动具身智能发展。test_g数据集作为LeRobot项目的重要组成部分，专注于多模态机器人操作任务的轨迹记录与学习。该数据集通过Apache 2.0协议开源，采用so101_follower型机器人采集包含关节状态、视觉观测与动作指令的时序数据，其结构化设计为模仿学习与强化学习算法提供了高质量的训练样本。

当前挑战

该数据集需解决机器人操作任务中的高维状态动作空间建模挑战，包括从视觉输入到连续动作的精确映射问题。构建过程中面临多传感器时序对齐、大规模视频数据压缩存储等技术难点，同时需确保不同任务间数据分布的一致性。数据采集还需克服真实物理环境中机械延迟与噪声干扰对数据质量的影响。

常用场景

经典使用场景

在机器人学习领域，test_g数据集通过记录六自由度机械臂的关节位置与视觉观测数据，为模仿学习与行为克隆算法提供高质量演示轨迹。其多模态特性支持研究者构建从视觉输入到动作输出的端到端策略网络，典型应用于机械臂抓取、物体操纵等任务的行为策略训练与验证。

解决学术问题

该数据集有效解决了机器人技能传递中的示范数据稀缺性问题，为无模型强化学习提供可靠的离线训练样本。通过精确记录状态-动作对与同步视觉反馈，它支持跨模态表征学习、动作预测模型优化等研究，显著降低了真实机器人实验的试错成本与硬件损耗。

实际应用

在工业自动化场景中，该数据集可直接用于训练协作机械臂的物体分拣、精密装配等任务策略。其标准化的数据格式与Apache 2.0许可支持企业快速部署基于学习的控制系统，尤其适用于需要适应环境变化的柔性制造生产线。

数据集最近研究