boxingtest2_d5_ta
收藏Hugging Face2025-07-19 更新2025-07-20 收录
下载链接:
https://huggingface.co/datasets/zijian2022/boxingtest2_d5_ta
下载链接
链接失效反馈官方服务:
资源简介:
该数据集是一个机器人数据集,包含15个剧集,共计12791帧,专注于单个任务。数据集包含30个视频文件,分为一个数据块,每个数据块包含1000帧。数据集的特征包括机器人的动作和状态信息,以及来自笔记本电脑和手机摄像头的视频数据。所有数据遵循Apache-2.0许可证。
创建时间:
2025-07-19
原始信息汇总
数据集概述
基本信息
- 名称: boxingtest2_d5_ta
- 许可证: Apache-2.0
- 任务类别: 机器人学 (Robotics)
- 标签: LeRobot
数据集描述
- 创建工具: LeRobot
- 主页: [无相关信息]
- 论文: [无相关信息]
数据集结构
- 代码库版本: v2.1
- 机器人类型: so100_follower
- 总集数: 15
- 总帧数: 12791
- 总任务数: 1
- 总视频数: 30
- 总块数: 1
- 块大小: 1000
- 帧率: 30 fps
- 数据路径:
data/chunk-{episode_chunk:03d}/episode_{episode_index:06d}.parquet - 视频路径:
videos/chunk-{episode_chunk:03d}/{video_key}/episode_{episode_index:06d}.mp4
特征
- 动作 (action):
- 数据类型: float32
- 形状: [6]
- 名称: shoulder_pan.pos, shoulder_lift.pos, elbow_flex.pos, wrist_flex.pos, wrist_roll.pos, gripper.pos
- 观测状态 (observation.state):
- 数据类型: float32
- 形状: [6]
- 名称: shoulder_pan.pos, shoulder_lift.pos, elbow_flex.pos, wrist_flex.pos, wrist_roll.pos, gripper.pos
- 观测图像 (observation.images.laptop & observation.images.phone):
- 数据类型: video
- 形状: [480, 640, 3]
- 名称: height, width, channels
- 视频信息:
- 高度: 480
- 宽度: 640
- 编解码器: av1
- 像素格式: yuv420p
- 是否为深度图: false
- 帧率: 30 fps
- 通道数: 3
- 是否包含音频: false
- 时间戳 (timestamp):
- 数据类型: float32
- 形状: [1]
- 帧索引 (frame_index):
- 数据类型: int64
- 形状: [1]
- 集索引 (episode_index):
- 数据类型: int64
- 形状: [1]
- 索引 (index):
- 数据类型: int64
- 形状: [1]
- 任务索引 (task_index):
- 数据类型: int64
- 形状: [1]
引用
- BibTeX: [无相关信息]
搜集汇总
数据集介绍

构建方式
在机器人技术领域,高质量的数据集对算法训练至关重要。boxingtest2_d5_ta数据集通过LeRobot平台精心构建,采用先进的机器人系统so100_follower进行数据采集。该数据集包含15个完整的情景(episodes),总计12791帧数据,以30fps的帧率记录,并按照1000帧为一个块(chunk)进行组织。数据以Parquet格式存储,确保高效读取和处理,同时配套30个视频文件,为研究者提供丰富的多模态信息。
特点
该数据集在机器人动作捕捉方面展现出显著优势,其核心特征包括6维度的关节位置数据(shoulder_pan.pos至gripper.pos),以及双视角的视觉观测(480x640分辨率的laptop与phone摄像头视频)。数据维度设计科学,动作与观测状态采用相同维度结构,便于对比分析。时间戳、帧索引等元数据完整,支持精确的时间序列分析,视频数据采用AV1编码,在保证质量的同时优化存储效率。
使用方法
研究者可通过解析Parquet文件获取机器人动作指令和状态观测数据,结合配套视频进行多模态学习。数据集已预分为训练集(15个episodes),适合用于模仿学习或强化学习算法的训练。视频文件路径与数据块索引采用标准化命名规则(如chunk-{episode_chunk:03d}),便于程序化调用。使用前需注意检查LeRobot代码库v2.1版本的兼容性,确保能正确处理视频编解码参数。
背景与挑战
背景概述
boxingtest2_d5_ta数据集由LeRobot团队基于Apache 2.0开源协议构建,专注于机器人控制领域的研究与应用。该数据集采集自so100_follower型机器人平台,包含15个完整任务片段、12791帧多模态数据,涵盖6自由度机械臂动作控制与双视角视觉观测。其核心价值在于为机器人模仿学习与行为克隆算法提供了高质量的时空对齐多模态数据,通过30Hz同步记录的关节状态、控制指令及480p双路视频流,有效支撑了机器人操作技能迁移的研究。
当前挑战
该数据集面临的主要挑战体现在两方面:在领域问题层面,机器人操作任务需解决高维连续动作空间与视觉观测的复杂映射关系,且机械臂动态特性增加了行为策略的泛化难度;在构建过程中,多传感器时序同步精度要求达到毫秒级,双路视频流与关节状态数据的严格对齐对采集系统提出苛刻要求,而6自由度机械臂动作的连续采样又需平衡数据密度与存储开销的矛盾。
常用场景
经典使用场景
在机器人控制领域,boxingtest2_d5_ta数据集为研究多关节机械臂的运动规划和任务执行提供了丰富的实验数据。该数据集通过记录机械臂各关节的位置信息以及多视角的视频数据,为研究者提供了模拟真实操作环境的宝贵资源。经典使用场景包括机械臂动作模仿学习、基于视觉反馈的控制策略优化等。
解决学术问题
该数据集有效解决了机器人控制领域中的若干关键问题,包括高维连续动作空间的策略学习、多模态感知信息的融合处理以及长序列任务的执行规划。通过提供精确的关节位置数据和同步的视频记录,研究者能够深入探索机械臂在复杂任务中的表现,为算法验证和性能评估提供了标准化基准。
衍生相关工作
基于该数据集,研究者已开展了多项创新工作,包括开发新型的深度强化学习框架用于机械臂控制、探索多模态感知在机器人操作中的应用以及改进模仿学习算法在长序列任务中的表现。这些工作显著推动了机器人控制算法的发展,并为后续研究奠定了重要基础。
以上内容由遇见数据集搜集并总结生成



