eval_wooden_stick_box_test

Hugging Face2026-01-23 更新2026-01-24 收录

下载链接：

https://huggingface.co/datasets/andrejarden/eval_wooden_stick_box_test

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集是使用LeRobot创建的机器人数据集，包含10个剧集、13966帧和1个任务。数据文件大小为100MB，视频文件大小为200MB，帧率为30fps。数据集结构包括动作、观察状态（包括关节位置和前端图像）、时间戳和各种索引。数据格式为Parquet，视频格式为MP4。

创建时间：

2026-01-15

原始信息汇总

数据集概述

基本信息

数据集名称: eval_wooden_stick_box_test
创建工具: LeRobot (https://github.com/huggingface/lerobot)
许可证: Apache-2.0
任务类别: 机器人学

数据集结构

总任务数: 1
总情节数: 10
总帧数: 13966
数据文件总大小: 100 MB
视频文件总大小: 200 MB
帧率: 30 FPS
数据块大小: 1000
代码库版本: v3.0
机器人类型: so101_follower
数据分割: 训练集 (0:10)

数据文件路径

数据路径: data/chunk-{chunk_index:03d}/file-{file_index:03d}.parquet
视频路径: videos/{video_key}/chunk-{chunk_index:03d}/file-{file_index:03d}.mp4

数据特征

动作

数据类型: float32
形状: [6]
名称: shoulder_pan.pos, shoulder_lift.pos, elbow_flex.pos, wrist_flex.pos, wrist_roll.pos, gripper.pos

观测状态

数据类型: float32
形状: [6]
名称: shoulder_pan.pos, shoulder_lift.pos, elbow_flex.pos, wrist_flex.pos, wrist_roll.pos, gripper.pos

观测图像（前视）

数据类型: video
形状: [480, 640, 3]
名称: height, width, channels
视频高度: 480
视频宽度: 640
视频编解码器: av1
像素格式: yuv420p
是否为深度图: false
视频帧率: 30
视频通道数: 3
是否包含音频: false

元数据

时间戳: 数据类型 float32，形状 [1]
帧索引: 数据类型 int64，形状 [1]
情节索引: 数据类型 int64，形状 [1]
索引: 数据类型 int64，形状 [1]
任务索引: 数据类型 int64，形状 [1]

引用信息

论文: [More Information Needed]
主页: [More Information Needed]
BibTeX: [More Information Needed]

搜集汇总

数据集介绍

构建方式

在机器人操作领域，数据集的构建往往依赖于真实世界的物理交互记录。eval_wooden_stick_box_test数据集通过LeRobot平台，利用so101_follower型机器人采集了10个完整操作片段，总计包含13966帧数据。这些数据以每秒30帧的速率录制，并以分块存储的Parquet格式组织，每个数据块约包含1000帧，确保了高效的数据管理与访问。视频数据采用AV1编码，分辨率为640x480，与机器人的关节位置、状态观测及时间戳等多模态信息同步记录，形成了一个结构化的机器人操作数据集。

特点

该数据集的特点在于其多模态融合与精细的结构化设计。它不仅提供了机器人六个关节（肩部平移、肩部升降、肘部弯曲、腕部弯曲、腕部旋转及夹爪）的位置动作与状态观测，还同步包含了前端摄像头采集的RGB视频流。数据以帧索引、片段索引和任务索引进行层次化标记，支持按时间或任务维度的灵活检索。视频与传感器数据的高精度对齐，以及采用现代编码格式的紧凑存储，使得数据集兼具丰富的信息含量与高效的存取性能，适用于复杂的机器人学习任务。

使用方法

使用该数据集时，研究人员可通过解析meta/info.json中的结构描述，按指定路径加载Parquet格式的数据文件。数据集已预分为训练集，涵盖全部10个操作片段，用户可依据帧索引或片段索引提取所需的动作、观测及视频序列。对于机器人策略学习或行为克隆等任务，可以结合关节位置数据与视觉观测进行模型训练。视频文件可通过对应的视频路径独立访问，支持视觉感知模块的单独分析或与状态数据的联合建模，为机器人操作研究提供全面的实验基础。

背景与挑战

背景概述

在机器人学习领域，高质量、结构化的真实世界交互数据对于推动模仿学习与强化学习算法的进步至关重要。eval_wooden_stick_box_test数据集由LeRobot平台构建，专注于机械臂操作任务，具体涉及木质棍棒与箱体的交互测试。该数据集收录了10个完整交互序列，包含近1.4万帧的多模态观测数据，如关节状态、前视图像及对应动作指令，旨在为机器人操作策略的评估与泛化能力研究提供基准。其采用Apache 2.0开源协议，体现了开放科学精神，助力社区在真实物理系统上验证算法性能。

当前挑战

该数据集致力于解决机器人操作任务中策略泛化与评估的挑战，尤其在非结构化环境下处理刚性物体交互的复杂动力学问题。构建过程中面临多重困难：需确保机械臂动作与视觉观测的高精度同步，以维持时序一致性；多模态数据（如关节角度与高清视频）的采集、压缩与存储需平衡效率与保真度；有限的任务场景与样本量可能制约模型在未见情境下的泛化能力验证。此外，数据标注与质量控制的自动化流程亦是实现规模化收集的关键瓶颈。

常用场景

经典使用场景

在机器人操作领域，eval_wooden_stick_box_test数据集为机械臂操控任务提供了宝贵的实验数据。该数据集记录了机械臂在特定任务中的关节位置、图像观测及时间序列信息，其经典使用场景集中于机器人模仿学习与策略评估。研究人员可借助这些数据训练模型学习从视觉输入到关节动作的映射关系，进而实现精准的物体操控，为机器人自主执行复杂操作任务奠定基础。

实际应用

在实际工业与物流场景中，eval_wooden_stick_box_test数据集可直接应用于自动化分拣与装配系统的开发。基于数据驱动的控制策略能够使机械臂学会稳定抓取与放置不规则物体，适应动态环境变化。此类技术可优化生产线效率，降低人力成本，并为服务机器人执行家庭辅助任务提供技术支撑，体现了数据在赋能智能机器人实际部署中的核心价值。

衍生相关工作

围绕该数据集，学术界已衍生出多项经典研究工作，主要集中在端到端机器人操控模型的构建与优化。例如，结合视觉Transformer与动作预测网络的新型架构被提出，以提升长时序任务中的决策准确性。同时，基于该数据的跨模态表示学习研究也促进了机器人感知与控制一体化框架的发展，为后续更复杂的多任务学习与元学习探索提供了重要基础。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集