battery

Hugging Face2025-07-27 更新2025-07-28 收录

下载链接：

https://huggingface.co/datasets/adungus/battery

下载链接

链接失效反馈

官方服务：

资源简介：

LeRobot数据集是一个包含机器人操作数据的集合，它记录了机器人的位置和移动等信息。数据集由1个剧集组成，每个剧集包含500帧，共有1个任务和2个视频。数据以Parquet格式存储，并提供了相应的视频文件。数据集适用于机器人学相关的任务和研究。

The LeRobot Dataset is a collection of robotic manipulation data that records information such as robot positions and movements. It consists of 1 single episode, which contains 500 frames, along with 1 task and 2 videos. The data is stored in Parquet format, with corresponding video files provided. This dataset is suitable for robotics-related tasks and research.

创建时间：

2025-07-27

原始信息汇总

数据集概述

基本信息

数据集名称: battery
许可证: Apache-2.0
任务类别: 机器人学 (robotics)
标签: LeRobot
创建工具: LeRobot

数据集结构

数据文件格式: Parquet
数据文件路径: data/*/*.parquet
配置名称: default

元数据信息

代码库版本: v2.1
机器人类型: so100_follower
总集数: 1
总帧数: 500
总任务数: 1
总视频数: 2
总块数: 1
块大小: 1000
帧率 (FPS): 30
数据分割: 训练集 (train): "0:1"

数据路径

数据文件路径模板: data/chunk-{episode_chunk:03d}/episode_{episode_index:06d}.parquet
视频文件路径模板: videos/chunk-{episode_chunk:03d}/{video_key}/episode_{episode_index:06d}.mp4

特征描述

动作 (action)
- 数据类型: float32
- 形状: [6]
- 名称: shoulder_pan.pos, shoulder_lift.pos, elbow_flex.pos, wrist_flex.pos, wrist_roll.pos, gripper.pos
观测状态 (observation.state)
- 数据类型: float32
- 形状: [6]
- 名称: 同动作特征
观测图像 (observation.images.gripper)
- 数据类型: video
- 形状: [720, 1280, 3]
- 视频信息:
  - 高度: 720
  - 宽度: 1280
  - 编解码器: av1
  - 像素格式: yuv420p
  - 非深度图
  - 帧率: 30
  - 通道数: 3
  - 无音频
观测图像 (observation.images.top)
- 数据类型: video
- 形状: [720, 1280, 3]
- 视频信息: 同gripper图像
其他特征
- 时间戳 (timestamp): float32, 形状 [1]
- 帧索引 (frame_index): int64, 形状 [1]
- 集索引 (episode_index): int64, 形状 [1]
- 索引 (index): int64, 形状 [1]
- 任务索引 (task_index): int64, 形状 [1]

引用信息

BibTeX: [More Information Needed]

搜集汇总

数据集介绍

构建方式

该数据集依托LeRobot开源框架构建，采用模块化设计理念对机器人操作数据进行系统化采集。通过SO100型机械臂的六自由度关节位置传感器（包括肩部平移/抬升、肘部弯曲、腕部弯曲/旋转及夹持器开合）实时记录操作轨迹，同步采集720P分辨率的多视角视频流（顶部视角与夹持器视角），以30fps的帧率将动作指令、状态观测与视觉数据在时间维度精确对齐，最终以Parquet列式存储格式组织500帧有效数据。

特点

数据集以机器人操作任务为核心，其显著特征在于多模态数据的深度融合。动作空间涵盖6维连续关节控制指令，状态观测空间对应机械臂各关节的实际位置反馈。视觉模态包含双路RGB视频流，采用AV1编码压缩确保数据紧凑性。时间戳与帧索引机制实现了毫秒级时序同步，而统一的Parquet存储结构则支持高效随机访问。这种结构化设计特别适合强化学习与模仿学习算法的端到端训练需求。

使用方法

使用者可通过解析meta/info.json获取数据组织结构，按照chunk-{episode_chunk:03d}的目录规范加载Parquet文件。每个数据样本包含同步的动作指令、关节状态、双视角图像及时间标记，建议采用流式读取策略处理视频数据以降低内存消耗。训练集划分已预设为全量数据，研究者可结合PyTorch或TensorFlow框架构建数据管道，特别适用于机器人操作策略的监督学习或行为克隆任务。

背景与挑战

背景概述

电池数据集（battery dataset）由LeRobot团队开发，专注于机器人控制领域的研究。该数据集记录了机器人执行任务时的动作、状态和视觉信息，旨在为机器人学习和控制算法提供高质量的训练数据。数据集包含500帧数据，涵盖6自由度机械臂的动作和状态信息，以及来自顶部和夹爪摄像头的视觉数据。这些数据对于研究机器人动作规划、状态估计和视觉伺服控制等核心问题具有重要价值。尽管数据集的具体创建时间和主要研究人员信息尚未公开，但其基于Apache 2.0许可证的开源特性，为机器人学界的算法开发和验证提供了便利。

当前挑战

电池数据集面临的主要挑战包括两方面：在领域问题层面，机器人控制任务的高维连续动作空间和复杂环境感知要求对算法的泛化能力和鲁棒性提出了严峻考验，如何从有限的500帧数据中学习有效的控制策略成为关键难题；在构建过程层面，多模态数据的同步采集与标定（如机械臂状态与视觉数据的时空对齐）、大规模视频数据的高效存储与检索（采用AV1编解码的720p视频流），以及6自由度动作空间的精确标注都是极具挑战性的技术难点。此外，数据集的单一任务和有限样本量可能制约其在复杂场景下的应用价值。

常用场景

经典使用场景

在机器人控制与自动化领域，battery数据集通过记录机械臂关节位置、夹爪状态及多视角视频数据，为机器人动作模仿学习提供了标准化的训练基准。其结构化存储的时序动作-观测对，特别适合用于开发基于深度强化学习的机械臂轨迹规划算法，研究者可通过分析720P高清视频流与6维关节角度的同步映射关系，构建端到端的视觉伺服控制系统。

衍生相关工作

该数据集的发布催生了多项机器人学习领域的创新研究，包括基于时空注意力机制的多视角动作预测模型、利用对比学习实现跨机器人平台的知识迁移框架等。部分团队进一步扩展了原始数据集，通过添加力觉传感器数据构建了更完备的触觉-视觉融合基准，推动了具身智能研究从纯视觉感知向多模态感知的演进。

数据集最近研究