five

xlerobot_datasets

收藏
Hugging Face2025-12-02 更新2025-12-03 收录
下载链接:
https://huggingface.co/datasets/kuyuan/xlerobot_datasets
下载链接
链接失效反馈
官方服务:
资源简介:
这是一个关于机器人学的数据集,包含29个剧集,共15218帧,2个任务。数据集使用LeRobot创建,并以Apache-2.0许可发布。数据集包含多种特征,包括动作、观测状态、正面和手腕的图像、时间戳、帧索引、剧集索引、索引和任务索引。所有数据文件以.parquet格式存储,视频文件以.mp4格式存储。

This is a robotics dataset consisting of 29 episodes, with a total of 15218 frames and covering 2 tasks. Developed using LeRobot, this dataset is released under the Apache-2.0 license. It incorporates multiple types of features, including actions, observation states, front-facing and wrist-mounted images, timestamps, frame indices, episode indices, sample indices, and task indices. All data files are stored in the .parquet format, and video files are saved in the .mp4 format.
创建时间:
2025-11-27
原始信息汇总

数据集概述

基本信息

  • 数据集名称: xlerobot_datasets
  • 发布者: kuyuan
  • 任务类别: 机器人学
  • 标签: LeRobot
  • 许可证: Apache 2.0
  • 创建工具: LeRobot (https://github.com/huggingface/lerobot)

数据集规模与结构

  • 总情节数: 29
  • 总帧数: 15218
  • 总任务数: 2
  • 数据块大小: 1000
  • 数据文件大小: 100 MB
  • 视频文件大小: 500 MB
  • 帧率: 30 FPS
  • 数据分割: 训练集 (0:29)

数据文件与路径

  • 数据文件格式: Parquet
  • 数据文件模式: data/chunk-{chunk_index:03d}/file-{file_index:03d}.parquet
  • 视频文件模式: videos/{video_key}/chunk-{chunk_index:03d}/file-{file_index:03d}.mp4

数据特征

动作

  • 数据类型: float32
  • 形状: [9]
  • 特征名称:
    • arm_shoulder_pan.pos
    • arm_shoulder_lift.pos
    • arm_elbow_flex.pos
    • arm_wrist_flex.pos
    • arm_wrist_roll.pos
    • arm_gripper.pos
    • x.vel
    • y.vel
    • theta.vel

观测状态

  • 数据类型: float32
  • 形状: [9]
  • 特征名称: (与动作特征相同)

观测图像(前视)

  • 数据类型: video
  • 形状: [480, 640, 3]
  • 维度名称: height, width, channels
  • 视频信息:
    • 高度: 480
    • 宽度: 640
    • 编解码器: av1
    • 像素格式: yuv420p
    • 是否为深度图: false
    • 帧率: 30
    • 通道数: 3
    • 包含音频: false

观测图像(腕部)

  • 数据类型: video
  • 形状: [640, 480, 3]
  • 维度名称: height, width, channels
  • 视频信息:
    • 高度: 640
    • 宽度: 480
    • 编解码器: av1
    • 像素格式: yuv420p
    • 是否为深度图: false
    • 帧率: 30
    • 通道数: 3
    • 包含音频: false

元数据

  • 时间戳: float32, 形状 [1]
  • 帧索引: int64, 形状 [1]
  • 情节索引: int64, 形状 [1]
  • 索引: int64, 形状 [1]
  • 任务索引: int64, 形状 [1]

其他信息

  • 代码库版本: v3.0
  • 机器人类型: lekiwi_client
  • 主页: [More Information Needed]
  • 论文: [More Information Needed]
  • 引用: [More Information Needed]
搜集汇总
数据集介绍
main_image_url
构建方式
在机器人学领域,高质量的数据集对于推动机器人控制与感知算法的进步至关重要。xlerobot_datasets的构建依托于LeRobot开源框架,通过实际机器人平台采集多模态交互数据。该数据集以Parquet格式存储,包含29个完整任务片段,总计15218帧数据,并以1000帧为单位进行分块管理,确保了数据的高效存取与处理。数据采集过程中,机器人执行了两种不同任务,同步记录了机械臂关节状态、末端执行器速度以及来自前视与腕部摄像头的视觉信息,构建了一个结构化的机器人操作数据集。
使用方法
研究人员可借助该数据集开展机器人模仿学习、强化学习及多模态感知等前沿探索。数据以标准Parquet文件形式提供,可通过HuggingFace数据集库或LeRobot工具链直接加载。使用时应依据meta/info.json中的路径规范访问数据块与视频文件,利用episode_index与frame_index实现精确的数据切片。模型训练时可联合利用状态观测、图像流及对应动作标签,构建端到端的控制策略;评估时则需注意数据仅包含训练划分,需自行设计验证方案以确保算法泛化能力。
背景与挑战
背景概述
在机器人学习领域,高质量、大规模的真实世界交互数据集对于推动模仿学习与强化学习算法的实际应用至关重要。xlerobot_datasets由HuggingFace的LeRobot项目创建,旨在为机器人操作任务提供多模态的演示数据。该数据集采集自lekiwi_client机器人平台,包含29个完整交互片段,总计超过15000帧,融合了机械臂关节状态、末端执行器速度以及前视与腕部摄像头视频流,为研究复杂环境下的机器人感知与控制策略提供了宝贵资源。其设计核心在于解决真实场景中机器人技能学习的样本效率与泛化能力问题,通过结构化存储与开源共享,促进了社区在具身智能方向的探索。
当前挑战
xlerobot_datasets致力于应对机器人操作任务中模仿学习与策略泛化的核心挑战,即如何从有限的人类演示中提炼出鲁棒且可迁移的控制策略。具体而言,数据集需支撑模型理解高维视觉观察与低维动作序列间的复杂映射,并在动态环境中实现精确的轨迹规划。在构建过程中,面临多传感器数据的高效同步与对齐难题,确保视频流与机械臂状态在时间上的一致性;同时,数据采集涉及真实物理设备的操作,需克服硬件可靠性、场景多样性不足以及大规模数据存储与处理的工程挑战,以保障数据质量与覆盖范围。
常用场景
经典使用场景
在机器人学习领域,xlerobot_datasets作为一款基于LeRobot框架构建的数据集,其经典使用场景聚焦于机械臂操作任务的模仿学习与强化学习研究。该数据集通过记录机械臂在特定任务中的状态观测、动作执行及视觉反馈,为算法提供了丰富的多模态交互轨迹。研究人员能够利用这些轨迹训练端到端的控制策略,模拟真实世界中的抓取、放置等精细操作,从而推动机器人自主决策能力的发展。
解决学术问题
该数据集有效解决了机器人学中样本效率低下与泛化能力不足的学术难题。通过提供结构化的多模态数据,包括关节位置、速度及双视角视觉信息,它支持了从高维感知到低维动作的映射学习。这有助于探索如何在有限真实交互数据下,实现策略的快速适应与迁移,为克服仿真到现实(Sim2Real)的鸿沟提供了实证基础,促进了数据驱动方法在机器人控制中的深入应用。
实际应用
在实际应用层面,xlerobot_datasets可服务于工业自动化与家庭服务机器人的开发。基于其记录的机械臂操作轨迹,工程师能够优化抓取路径规划、避障策略及任务序列编排,提升生产线上的分拣与装配效率。同时,该数据集支持开发适应非结构化环境的灵巧操作算法,为物流仓储、医疗辅助等场景的机器人部署提供可靠的数据支撑,加速智能机器人的落地进程。
数据集最近研究
最新研究方向
在机器人学习领域,xlerobot_datasets作为基于LeRobot框架构建的多模态数据集,正推动着机器人操作技能的前沿探索。该数据集整合了机械臂关节状态、前端与腕部视觉观测,为模仿学习与强化学习算法提供了丰富的训练素材。当前研究热点聚焦于利用此类数据训练端到端的视觉运动策略模型,旨在提升机器人在非结构化环境中的泛化能力与任务适应性。随着具身智能概念的兴起,该数据集在促进机器人理解复杂物理交互、实现精细操作方面展现出重要价值,为开源机器人社区的数据驱动研究奠定了坚实基础。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作