boxingtest2_d1_ta
收藏Hugging Face2025-07-19 更新2025-07-20 收录
下载链接:
https://huggingface.co/datasets/zijian2022/boxingtest2_d1_ta
下载链接
链接失效反馈官方服务:
资源简介:
该数据集是通过LeRobot创建的,包含了15个剧集,共有12791帧,1个任务,30个视频和1个数据块。每个数据块大小为1000帧,帧率为30fps。数据集的结构包括机器人动作、观察状态、笔记本电脑和手机的视频图像、时间戳、帧索引、剧集索引、索引和任务索引等特征。所有数据均按照Apache-2.0许可进行共享。
创建时间:
2025-07-19
原始信息汇总
数据集概述
基本信息
- 许可证: apache-2.0
- 任务类别: robotics
- 标签: LeRobot
- 创建工具: LeRobot
数据集结构
- 配置名称: default
- 数据文件格式: data//.parquet
- 代码库版本: v2.1
- 机器人类型: so100_follower
- 总集数: 15
- 总帧数: 12791
- 总任务数: 1
- 总视频数: 30
- 总块数: 1
- 块大小: 1000
- 帧率: 30 fps
- 训练集划分: 0:15
数据路径
- 数据路径: data/chunk-{episode_chunk:03d}/episode_{episode_index:06d}.parquet
- 视频路径: videos/chunk-{episode_chunk:03d}/{video_key}/episode_{episode_index:06d}.mp4
特征描述
-
动作 (action):
- 数据类型: float32
- 形状: [6]
- 名称: shoulder_pan.pos, shoulder_lift.pos, elbow_flex.pos, wrist_flex.pos, wrist_roll.pos, gripper.pos
-
观察状态 (observation.state):
- 数据类型: float32
- 形状: [6]
- 名称: shoulder_pan.pos, shoulder_lift.pos, elbow_flex.pos, wrist_flex.pos, wrist_roll.pos, gripper.pos
-
观察图像 (observation.images.laptop 和 observation.images.phone):
- 数据类型: video
- 形状: [480, 640, 3]
- 名称: height, width, channels
- 视频信息:
- 高度: 480
- 宽度: 640
- 编解码器: av1
- 像素格式: yuv420p
- 是否为深度图: false
- 帧率: 30 fps
- 通道数: 3
- 是否包含音频: false
-
其他特征:
- timestamp: float32, 形状 [1]
- frame_index: int64, 形状 [1]
- episode_index: int64, 形状 [1]
- index: int64, 形状 [1]
- task_index: int64, 形状 [1]
引用信息
- BibTeX: [More Information Needed]
搜集汇总
数据集介绍

构建方式
在机器人学领域,高质量的数据集对于算法训练和系统验证至关重要。boxingtest2_d1_ta数据集通过LeRobot平台构建,采用先进的机器人操作记录技术,采集了15个完整操作序列,共计12791帧数据。数据以分块形式存储于Parquet格式文件中,每块包含1000帧,帧率为30fps,确保数据的高效存取和时序完整性。数据集详细记录了机械臂关节位置、视觉观测等多模态信息,为机器人控制研究提供了丰富的实验素材。
特点
该数据集在机器人操作任务领域展现出显著的多模态特性。其核心价值在于同时包含机械臂六自由度关节位置的动作指令和状态反馈,以及来自笔记本电脑和手机的双视角视觉数据。480×640分辨率的RGB视频流以AV1编码存储,配合精确的时间戳和帧索引,为时空对齐分析提供保障。数据字段命名规范,张量维度明确,特别适合用于模仿学习、强化学习等需要跨模态关联的算法研究。
使用方法
研究者可通过HuggingFace平台直接获取该数据集,其标准化的Parquet格式兼容主流数据处理框架。使用前需解析meta/info.json中的元数据,明确数据路径结构和特征含义。训练集包含全部15个操作序列,建议按照分块加载策略逐步处理大规模视频数据。典型应用场景包括:基于视觉的机械臂动作预测、多传感器数据融合算法开发,或作为机器人操作任务的基准测试数据集。注意需遵守Apache-2.0许可协议的要求。
背景与挑战
背景概述
boxingtest2_d1_ta数据集由LeRobot团队基于机器人研究领域的需求构建,旨在为机器人控制与行为学习提供高质量的多模态数据支持。该数据集依托Apache 2.0开源协议发布,包含15个完整的行为序列和12791帧数据,涵盖了6自由度机械臂的关节状态、视觉观测及时间戳等多维度信息。其核心价值在于通过标准化数据格式(如Parquet文件)和结构化元数据,解决了机器人模仿学习中动作-观测对齐、多传感器融合等关键问题,为强化学习、行为克隆等算法提供了基准测试平台。
当前挑战
该数据集面临的核心挑战体现在算法与应用两个层面:在算法层面,如何从异构传感器数据(如30fps视频流与机械臂关节角)中提取时空一致性特征,以解决动态场景下的动作预测问题;在构建层面,需克服多设备同步采集时的时钟漂移问题,以及高分辨率视频数据存储与处理的效率瓶颈。技术文档中未明确标注的论文与主页信息,也反映出学术可复现性方面的完善空间。
常用场景
经典使用场景
在机器人控制与学习领域,boxingtest2_d1_ta数据集为研究者提供了一个多模态交互环境下的动作执行与状态观测平台。该数据集通过记录机械臂的关节位置、夹持器状态以及多视角视频数据,成为验证强化学习算法在连续动作空间中策略优化效果的经典基准。其高精度时间戳与帧索引设计,特别适合用于研究动作序列与视觉观测的时序对齐问题。
解决学术问题
该数据集有效解决了机器人模仿学习中动作-观测映射关系的建模难题。通过提供6自由度机械臂的精确关节角度数据和同步多视角视觉反馈,研究者能够深入分析本体感知与外部感知的协同机制。其结构化数据格式显著降低了多模态数据融合的研究门槛,为机器人技能迁移、状态表示学习等前沿方向提供了标准化评估框架。
衍生相关工作
该数据集催生了多项机器人学习领域的创新研究,包括基于跨模态注意力机制的动作预测模型、多传感器融合的状态估计方法等。部分团队利用其视频-动作对数据开发了视觉伺服控制的端到端解决方案,另有研究通过迁移学习将数据集中的运动模式应用于新型机械臂的零样本控制。
以上内容由遇见数据集搜集并总结生成



