wire1_dataset

Hugging Face2026-01-23 更新2026-01-24 收录

下载链接：

https://huggingface.co/datasets/kb127/wire1_dataset

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集由LeRobot创建，包含机器人技术相关的数据。数据集结构包括动作、观察状态、前视图和顶视图的图像、时间戳和各种索引。具体特征包括6个自由度的机械臂位置数据、480x640分辨率的RGB视频帧（30fps）、时间戳和帧索引等。数据集总共有20个episodes，11908帧数据，分为训练集（0:20）。数据以parquet文件格式存储，视频以mp4格式存储。

创建时间：

2026-01-22

原始信息汇总

数据集概述

基本信息

数据集名称: wire1_dataset
创建工具: LeRobot (https://github.com/huggingface/lerobot)
许可证: Apache-2.0
任务类别: 机器人学
标签: LeRobot

数据集规模与结构

总情节数: 20
总帧数: 11908
总任务数: 1
数据块大小: 1000
数据文件总大小: 100 MB
视频文件总大小: 200 MB
帧率: 30 FPS
数据分割: 训练集 (0:20)

数据文件格式与路径

数据文件格式: Parquet
数据文件路径模式: data/chunk-{chunk_index:03d}/file-{file_index:03d}.parquet
视频文件路径模式: videos/{video_key}/chunk-{chunk_index:03d}/file-{file_index:03d}.mp4

数据特征

动作空间

特征名称: action
数据类型: float32
维度: [6]
关节名称:
- shoulder_pan.pos
- shoulder_lift.pos
- elbow_flex.pos
- wrist_flex.pos
- wrist_roll.pos
- gripper.pos

观测空间

状态观测

特征名称: observation.state
数据类型: float32
维度: [6]
关节名称:
- shoulder_pan.pos
- shoulder_lift.pos
- elbow_flex.pos
- wrist_flex.pos
- wrist_roll.pos
- gripper.pos

图像观测 - 前视摄像头

特征名称: observation.images.front
数据类型: video
图像尺寸: 480×640×3 (高度×宽度×通道)
视频编码: AV1
像素格式: yuv420p
是否为深度图: 否
帧率: 30 FPS
音频: 无

图像观测 - 顶部摄像头

特征名称: observation.images.top
数据类型: video
图像尺寸: 480×640×3 (高度×宽度×通道)
视频编码: AV1
像素格式: yuv420p
是否为深度图: 否
帧率: 30 FPS
音频: 无

元数据特征

时间戳: float32, 维度 [1]
帧索引: int64, 维度 [1]
情节索引: int64, 维度 [1]
索引: int64, 维度 [1]
任务索引: int64, 维度 [1]

技术信息

代码库版本: v3.0
机器人类型: so_follower

引用信息

论文: 未提供
BibTeX引用: 未提供

搜集汇总

数据集介绍

构建方式

在机器人技术领域，数据集的构建往往依赖于实际硬件平台与软件框架的协同工作。wire1_dataset 便是借助 LeRobot 这一开源机器人学习框架，通过 so_follower 型机器人采集了20个完整任务片段，共计11908帧数据。数据以分块形式存储于Parquet文件中，每块包含1000帧，同时配套保存了从前置与顶部视角拍摄的视频流，帧率为30fps，编码格式为AV1。这种结构化的存储方式不仅确保了数据的高效访问，也为后续的模型训练提供了时序连贯的多模态输入。

特点

该数据集的特点体现在其丰富的多模态信息与精细的标注结构上。它同步记录了机器人的六维关节位置作为动作指令，以及相同维度的状态观测值，形成了动作-状态对的完整映射。视觉方面，数据集提供了双视角RGB视频流，分辨率均为640x480，为环境感知提供了立体视觉线索。此外，每一帧数据均附有时间戳、帧索引、任务索引等元数据，使得数据在时序上与任务层面都具有清晰的对应关系，为模仿学习与强化学习算法的开发奠定了坚实基础。

使用方法

对于希望利用该数据集的研究者而言，其使用方法清晰而直接。数据集已预分为训练集，涵盖全部20个任务片段。用户可通过指定的路径模式加载分块的Parquet数据文件，从而高效读取动作、状态及元数据。配套的视频文件则独立存储，研究者可根据需要将其与对应的状态-动作序列进行对齐。这种数据与视频分离的组织形式，既方便了大规模数值数据的快速处理，也兼顾了高带宽视觉数据的灵活调用，适用于训练端到端的机器人控制策略或进行行为克隆等研究。

背景与挑战

背景概述

wire1_dataset作为机器人学习领域的一项新兴数据资源，依托HuggingFace的LeRobot开源框架构建而成，其核心聚焦于机器人模仿学习与行为克隆的研究范式。该数据集通过集成多视角视觉感知与关节状态信息，旨在为机器人灵巧操作任务提供高质量的演示轨迹，从而推动端到端策略学习模型的进展。尽管其创建时间与主要研究人员信息尚未公开，但数据集的结构设计体现了当前机器人学领域对大规模、多模态交互数据的需求，有望为具身智能系统的实际部署提供关键的数据支撑。

当前挑战

wire1_dataset所针对的领域挑战在于解决机器人模仿学习中样本效率低下与泛化能力不足的难题，尤其是在复杂动态环境下从视觉输入到连续动作空间的映射问题。构建过程中的挑战则体现在多传感器数据的时空对齐、高维视频流的高效压缩存储，以及确保演示轨迹在真实机器人平台上的可复现性。此外，数据集的规模相对有限，仅包含20个任务片段，可能制约了深度模型对长时程任务与异常状态的学习能力。

常用场景

经典使用场景

在机器人学习领域，wire1_dataset以其多模态观测数据为特色，成为模仿学习与强化学习算法的经典测试平台。该数据集整合了机械臂的关节状态与多视角视觉信息，为研究者提供了丰富的交互轨迹，常用于训练端到端的策略网络，使机器人能够从人类示范中学习复杂的操作任务，如物体抓取与放置。

解决学术问题

该数据集有效应对了机器人学中样本效率低下与泛化能力不足的挑战。通过提供结构化且标注清晰的真实世界交互数据，它支持了离线强化学习、行为克隆等方法的验证，促进了从仿真到现实迁移的研究，为克服领域鸿沟与数据稀缺问题提供了实证基础。

衍生相关工作

围绕wire1_dataset，学术界衍生了一系列经典研究，包括基于Transformer的多模态策略学习、视觉-动作对齐模型，以及跨任务迁移框架。这些工作不仅深化了对机器人感知与决策协同机制的理解，还推动了开源机器人学习生态的发展，为后续大规模数据集的构建奠定了方法论基础。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集