five

example_dataset

收藏
Hugging Face2025-12-01 更新2025-12-02 收录
下载链接:
https://huggingface.co/datasets/WhitneyDesignLabs/example_dataset
下载链接
链接失效反馈
官方服务:
资源简介:
这是一个关于机器人技术的数据集,包含了一个名为so-100的机器人类型,共有21个剧集,13947帧,1个任务。数据集以Parquet文件格式存储,并提供了对应的视频文件。数据集中的特征包括机器人的动作、状态、时间戳、剧集索引、帧索引、任务索引等。此外,数据集还包含了主副两个摄像头视角的图像。

This is a robotics dataset focused on a robot type named so-100. It contains 21 episodes, 13947 frames, and one single task. The dataset is stored in Parquet file format, with corresponding video files provided. The included features cover robot motion, states, timestamps, episode indices, frame indices, task indices, and more. Additionally, the dataset provides images captured from both the main and auxiliary camera perspectives.
创建时间:
2025-12-01
原始信息汇总

数据集概述

基本信息

  • 数据集名称: example_dataset
  • 创建工具: LeRobot (https://github.com/huggingface/lerobot)
  • 许可证: Apache 2.0
  • 任务类别: 机器人学
  • 标签: LeRobot

数据集规模

  • 总情节数: 21
  • 总帧数: 13947
  • 总任务数: 1
  • 数据块大小: 1000
  • 帧率: 30 FPS
  • 数据文件总大小: 100 MB
  • 视频文件总大小: 500 MB

数据划分

  • 训练集: 包含所有21个情节(索引0至21)

数据结构与特征

数据集以Parquet文件格式存储,主要包含以下特征:

动作与状态

  • action: 浮点32位数组,形状为[6],代表6个电机的动作值(motor_1 至 motor_6),帧率为30 FPS。
  • observation.state: 浮点32位数组,形状为[6],代表6个电机的状态值(motor_1 至 motor_6),帧率为30 FPS。

索引与时间戳

  • timestamp: 浮点32位数组,形状为[1],帧率为30 FPS。
  • episode_index: 整型64位数组,形状为[1],帧率为30 FPS。
  • frame_index: 整型64位数组,形状为[1],帧率为30 FPS。
  • task_index: 整型64位数组,形状为[1],帧率为30 FPS。
  • index: 整型64位数组,形状为[1],帧率为30 FPS。

图像观测

  • observation.images.main: 视频类型,形状为[240, 320, 3](高度、宽度、通道),帧率为30 FPS,视频编码为avc1,像素格式为yuv420p,非深度图,无音频。
  • observation.images.secondary_0: 视频类型,形状为[240, 320, 3](高度、宽度、通道),帧率为30 FPS,视频编码为avc1,像素格式为yuv420p,非深度图,无音频。
  • observation.images.secondary_1: 视频类型,形状为[240, 320, 3](高度、宽度、通道),帧率为30 FPS,视频编码为avc1,像素格式为yuv420p,非深度图,无音频。

文件存储路径

  • 数据文件路径模式: data/chunk-{chunk_index:03d}/file-{file_index:03d}.parquet
  • 视频文件路径模式: videos/{video_key}/chunk-{chunk_index:03d}/file-{file_index:03d}.mp4

元数据

  • 机器人类型: so-100
  • 代码库版本: v3.0

引用信息

  • 主页: 信息缺失
  • 论文: 信息缺失
  • BibTeX引用: 信息缺失
搜集汇总
数据集介绍
main_image_url
构建方式
在机器人学习领域,高质量的数据集是推动算法发展的基石。example_dataset依托LeRobot开源框架构建,通过记录so-100型机器人的实际交互过程,系统采集了21个完整任务片段,共计13947帧数据。数据以每秒30帧的速率同步捕获机器人的六维关节动作、状态观测值及多视角视觉信息,并采用分块存储策略,将原始数据组织为Parquet格式文件与MP4视频流,确保了数据的高效存取与完整性。
使用方法
研究人员可通过LeRobot提供的标准数据加载接口,便捷地读取数据集中的动作、观测及图像序列。数据集已预划分为训练集,可直接用于机器人策略学习模型的训练与验证。在具体应用中,用户可依据帧索引或片段索引提取特定时段的多模态数据流,结合动作与视觉观测联合训练端到端控制模型,亦可通过状态信息进行动力学建模分析。数据集的标准化格式确保了与主流机器人学习框架的兼容性,支持高效的数据流水线构建。
背景与挑战
背景概述
在机器人学领域,数据驱动的策略学习正逐渐成为实现复杂任务泛化能力的关键途径。example_dataset依托LeRobot开源框架构建,专注于采集六自由度机械臂(so-100型)在真实环境中的交互数据。该数据集通过整合多视角视觉观测(主摄像头与两个辅助摄像头)与精确的关节状态及动作指令,旨在为机器人模仿学习与强化学习算法提供高质量的示范轨迹。其结构化存储格式与丰富的元数据标注,为研究者探索从视觉输入到连续控制动作的端到端映射奠定了坚实基础,有望推动家庭与服务场景中机器人自主操作能力的提升。
当前挑战
该数据集致力于解决机器人视觉运动控制中的核心难题,即如何从高维视觉输入中稳健地推断出精确的连续动作序列。这一过程面临动作空间探索效率低、视觉表征与动力学模型难以对齐等固有挑战。在构建层面,数据采集需协调多传感器同步,确保视频流与关节状态的时间戳严格对齐;同时,大规模交互数据的存储与高效检索要求设计精巧的分块与索引机制,以平衡数据规模与访问速度。此外,真实环境中的光照变化、物体遮挡等干扰因素,也为数据质量的一致性带来了额外考验。
常用场景
经典使用场景
在机器人学习领域,example_dataset以其丰富的多模态数据为特征,为模仿学习与强化学习算法的训练与验证提供了经典场景。该数据集收录了21个完整任务片段,包含六自由度机械臂的动作指令、状态观测以及多视角视觉信息,以30帧每秒的速率记录,使得研究者能够基于真实机器人交互轨迹,构建端到端的控制策略模型。通过整合高维传感器数据与精确的时间戳对齐,它支持从原始感知到动作生成的完整流程仿真,成为开发自主操作系统的关键基准。
解决学术问题
该数据集有效应对了机器人学中样本效率低下与仿真到现实迁移的挑战。通过提供大规模、结构化的真实世界交互数据,它降低了在物理平台上直接试验的成本与风险,使研究人员能够专注于算法创新。其精细标注的动作与状态序列,有助于探索连续控制、多任务学习以及视觉-运动协调等核心问题,推动了数据驱动方法在复杂动态环境中的可扩展性研究,为构建通用机器人智能体奠定了实证基础。
实际应用
在实际机器人部署中,example_dataset可直接用于训练工业机械臂执行精细操作任务,如装配、分拣或物体操控。基于其多摄像头视觉流与电机状态数据,能够开发出适应非结构化环境的感知-动作系统,提升机器人在仓储、医疗辅助或家庭服务等场景的自主性与鲁棒性。此外,数据集支持离线强化学习与策略蒸馏,使得在安全约束下优化现有控制策略成为可能,加速了从实验室原型到实际应用的转化进程。
数据集最近研究
最新研究方向
在机器人学习领域,多模态数据集正成为推动具身智能发展的关键资源。example_dataset作为基于LeRobot平台构建的机器人操作数据集,其融合了六维关节动作、状态观测及多视角视觉信息,为模仿学习与强化学习算法提供了丰富的训练素材。当前研究前沿聚焦于利用此类结构化时序数据,探索跨任务泛化与少样本适应能力,特别是在家庭服务与工业自动化场景中,旨在提升机器人对复杂动态环境的感知与决策水平。随着开源机器人社区的活跃,类似数据集促进了算法标准化与可复现性,加速了从仿真到真实世界的技术迁移。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作