INSIGHT-dataset-3

Hugging Face2025-09-08 更新2025-09-09 收录

下载链接：

https://huggingface.co/datasets/paragon7060/INSIGHT-dataset-3

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集使用LeRobot框架创建，包含一个Franka Panda机器人的操作数据。数据集分为50个剧集，共有3005帧，涵盖6个任务。数据包括机器人的状态观测、手腕和肩膀的图像及语义分割、深度图等信息。每个剧集包含300个视频，总共1个数据块，每个数据块包含1000帧。视频的帧率为10fps，格式为av1编码的yuv420p，没有音频。

创建时间：

2025-09-05

原始信息汇总

INSIGHT-dataset-3 数据集概述

基本信息

任务类别: 机器人学
标签: LeRobot
代码库版本: v2.1
机器人类型: franka_panda
帧率: 10 fps
许可证: 未提供
论文: 未提供
主页: 未提供

数据集规模

总任务数: 6
总片段数: 50
总帧数: 3005
总视频数: 300
数据块数: 1
数据块大小: 1000
数据分割: 训练集 (0:50)

数据结构

数据文件路径

数据路径: data/chunk-{episode_chunk:03d}/episode_{episode_index:06d}.parquet
视频路径: videos/chunk-{episode_chunk:03d}/{video_key}/episode_{episode_index:06d}.mp4

特征描述

观测数据

observation.state:
- 数据类型: float32
- 形状: [34]
- 包含: 末端执行器位置、四元数、关节角度、速度、力矩等状态信息
图像观测 (wrist, wrist_semantic, left_shoulder, left_shoulder_semantic, right_shoulder, right_shoulder_semantic):
- 数据类型: video
- 形状: [3, 480, 640]
- 格式: AV1编码，yuv420p像素格式，无音频
- 分辨率: 480×640
深度观测 (wrist_depth, left_shoulder_depth, right_shoulder_depth):
- 数据类型: float32
- 形状: [1, 480, 640]

动作数据

action:
- 数据类型: float32
- 形状: [8]
- 包含: 7个关节角度和1个夹爪控制

其他数据

next.reward: 奖励信号 (float32, [1])
action.skill_id: 技能ID (int32, [1])
timestamp: 时间戳 (float32, [1])
frame_index: 帧索引 (int64, [1])
episode_index: 片段索引 (int64, [1])
index: 索引 (int64, [1])
task_index: 任务索引 (int64, [1])

创建信息

创建工具: LeRobot (https://github.com/huggingface/lerobot)

搜集汇总

数据集介绍

构建方式

在机器人技术领域，INSIGHT-dataset-3通过LeRobot平台系统性地采集了Franka Panda机械臂的多模态交互数据。该数据集包含50个完整任务片段，总计3005帧数据，以10fps的采样频率记录。数据以分块形式存储于Parquet文件中，每个文件囊括了机械臂的状态观测、多视角图像及深度信息，并同步标注了动作指令与奖励信号，确保了数据的时间对齐与完整性。

使用方法

研究者可通过加载Parquet格式的数据文件，直接访问帧索引下的多模态输入与动作标签。该数据集适用于端到端机器人策略训练、行为克隆及强化学习算法的验证。视频数据以MP4格式独立存储，可通过路径模板灵活调用。训练集涵盖全部50个任务片段，支持跨任务泛化能力评估，为机器人操作技能的学习与迁移提供了标准化基准。

背景与挑战

背景概述

INSIGHT-dataset-3作为机器人操作学习领域的重要数据资源，由HuggingFace的LeRobot项目团队构建，专注于Franka Panda机械臂的多模态操作任务。该数据集通过集成高维视觉感知与精确的动作控制信号，旨在推动模仿学习与强化学习算法在复杂环境中的实际应用。其设计涵盖了六类典型操作任务，包含3005帧高质量时序数据，为机器人行为克隆与策略泛化研究提供了坚实的数据基础。

当前挑战

该数据集需解决机器人操作中高维状态-动作映射的复杂性挑战，包括多视角视觉信息与关节控制的协同建模问题。构建过程中面临多传感器时序同步、大规模视频数据压缩存储、以及真实环境中动作标注噪声抑制等技术难点，同时需保证不同任务间数据分布的一致性与策略迁移的有效性。

常用场景

经典使用场景

在机器人学习领域，INSIGHT-dataset-3数据集通过Franka Panda机械臂采集的多模态数据，为模仿学习与强化学习算法提供了丰富的训练素材。其经典应用场景包括机器人技能模仿、行为克隆以及端到端策略学习，研究者可利用该数据集中的关节状态、视觉观察与动作序列，训练机器人执行复杂的操作任务。

解决学术问题

该数据集有效解决了机器人学习中缺乏高质量、多视角、多模态演示数据的问题，为研究模仿学习、视觉-动作映射、跨任务泛化等关键课题提供了基准数据。其意义在于推动机器人感知-决策-控制一体化研究，促进真实环境中机器人操作技能的自动化学习与迁移。

实际应用

在实际应用中，该数据集可支撑工业自动化中的抓取、装配、分拣等任务，服务机器人中的物品操作与环境交互，以及医疗辅助机器人的精细操作训练。其多视角视觉与深度信息为机器人在实际场景中的感知与定位提供了重要数据支持。

数据集最近研究