five

lekiwi_test

收藏
Hugging Face2025-05-08 更新2025-05-09 收录
下载链接:
https://huggingface.co/datasets/rossliu/lekiwi_test
下载链接
链接失效反馈
官方服务:
资源简介:
这是一个用于机器人学任务的 数据集,包含2个剧集,总共1783帧,1个任务,4个视频和1个片段。数据集以Parquet格式存储,并提供了相关视频文件。每个剧集包含动作、状态、正面图像、手腕图像、时间戳、帧索引、剧集索引、索引和任务索引等信息。数据集适用于机器人相关的研究和开发。

This is a dataset intended for robotics tasks. It contains 2 episodes with a total of 1783 frames, 1 task, 4 videos, and 1 segment. The dataset is stored in Parquet format, and accompanying video files are provided. Each episode includes information such as actions, states, front-facing images, wrist images, timestamps, frame indices, episode indices, indices, and task indices. This dataset is applicable to robotics-related research and development.
创建时间:
2025-04-28
原始信息汇总

数据集概述

基本信息

  • 名称: rossliu/lekiwi_test
  • 许可证: Apache-2.0
  • 任务类别: 机器人学 (robotics)
  • 标签: LeRobot, tutorial

数据集描述

  • 创建工具: LeRobot
  • 主页: [More Information Needed]
  • 论文: [More Information Needed]

数据集结构

  • 数据文件: data/*/*.parquet
  • 配置名称: default

元数据 (meta/info.json)

  • 代码库版本: v2.1
  • 机器人类型: lekiwi
  • 总集数: 2
  • 总帧数: 1783
  • 总任务数: 1
  • 总视频数: 4
  • 总块数: 1
  • 块大小: 1000
  • 帧率 (fps): 30
  • 分割:
    • 训练集: "0:2"

数据路径

  • 数据路径: data/chunk-{episode_chunk:03d}/episode_{episode_index:06d}.parquet
  • 视频路径: videos/chunk-{episode_chunk:03d}/{video_key}/episode_{episode_index:06d}.mp4

特征

  • action:
    • 数据类型: float32
    • 形状: [9]
    • 名称: shoulder_pan, shoulder_lift, elbow_flex, wrist_flex, wrist_roll, gripper, x_mm, y_mm, theta
  • observation.state:
    • 数据类型: float32
    • 形状: [9]
    • 名称: shoulder_pan, shoulder_lift, elbow_flex, wrist_flex, wrist_roll, gripper, x_mm, y_mm, theta
  • observation.images.front:
    • 数据类型: video
    • 形状: [480, 640, 3]
    • 名称: height, width, channels
    • 信息:
      • video.fps: 30.0
      • video.height: 480
      • video.width: 640
      • video.channels: 3
      • video.codec: av1
      • video.pix_fmt: yuv420p
      • video.is_depth_map: false
      • has_audio: false
  • observation.images.wrist:
    • 数据类型: video
    • 形状: [480, 640, 3]
    • 名称: height, width, channels
    • 信息:
      • video.fps: 30.0
      • video.height: 480
      • video.width: 640
      • video.channels: 3
      • video.codec: av1
      • video.pix_fmt: yuv420p
      • video.is_depth_map: false
      • has_audio: false
  • timestamp:
    • 数据类型: float32
    • 形状: [1]
    • 名称: null
  • frame_index:
    • 数据类型: int64
    • 形状: [1]
    • 名称: null
  • episode_index:
    • 数据类型: int64
    • 形状: [1]
    • 名称: null
  • index:
    • 数据类型: int64
    • 形状: [1]
    • 名称: null
  • task_index:
    • 数据类型: int64
    • 形状: [1]
    • 名称: null

引用

  • BibTeX: [More Information Needed]
搜集汇总
数据集介绍
main_image_url
构建方式
在机器人技术领域,高质量的数据集对于算法训练至关重要。lekiwi_test数据集依托LeRobot框架构建,采用模块化设计理念,通过parquet格式高效存储多模态数据。数据采集过程严格遵循标准化协议,包含2个完整任务片段和1783帧时序数据,以30fps的采样率同步记录机械臂关节状态、末端位姿及双视角视觉信息,并通过分块存储策略优化大文件读取效率。
特点
该数据集在机器人操作任务数据表征方面具有显著优势,其多维特征空间涵盖9自由度机械臂的动作向量、关节状态反馈及480p双路RGB视频流。数据标注体系采用分层命名结构,精确描述各传感器通道的物理含义,视频流附带完整的元数据信息包括编解码参数和时空对齐标记。独特的时空索引设计通过帧序号、片段索引等多级标识符确保数据可追溯性。
使用方法
研究人员可通过解析parquet文件直接获取结构化数据,利用内置的时空索引快速定位特定任务片段。前视与腕部摄像头视频数据需配合提供的路径模板加载,动作与状态数据采用float32格式存储确保计算精度。建议使用者参考特征字典中的维度说明进行数据解析,并利用30fps的时序特性进行帧级对齐分析。数据集默认划分将所有样本归入训练集,适合端到端模仿学习算法的开发验证。
背景与挑战
背景概述
lekiwi_test数据集由HuggingFace旗下的LeRobot项目团队构建,旨在为机器人学领域提供高质量的实验数据支持。该数据集聚焦于机器人动作控制与状态观测的多模态数据采集,涵盖了机械臂关节角度、末端执行器位置以及视觉感知等多维度信息。数据集采用Apache-2.0开源协议,其结构设计体现了机器人任务分解的典型范式,包含1783帧时序数据与4段视频记录,为模仿学习与强化学习算法验证提供了标准化测试平台。
当前挑战
该数据集面临的核心挑战在于机器人动作-感知对齐的时序建模问题,需解决9自由度机械臂控制指令与双视角视觉观测的跨模态同步难题。数据构建过程中存在传感器异构性挑战,包括30Hz高频视频流与关节状态数据的精确时间戳对齐,以及480p分辨率下RGB视频编解码带来的存储效率优化问题。此外,当前数据规模仅包含2个训练片段,对复杂任务泛化能力的验证形成显著制约。
常用场景
经典使用场景
在机器人控制领域,lekiwi_test数据集作为LeRobot框架下的标准测试集,主要用于机械臂运动规划算法的验证与优化。该数据集通过记录机械臂关节角度、末端执行器坐标及多视角视频流,为研究人员提供了丰富的动作-状态对应关系,特别适合用于强化学习模型在连续控制任务中的训练与评估。其高精度的时序数据和同步的多模态观测,使得算法能够在仿真环境中获得接近真实世界的反馈。
解决学术问题
该数据集有效解决了机器人学中动作-感知闭环建模的难题。通过提供标准化的机械臂运动轨迹与状态数据,研究者能够量化评估不同控制策略在相同条件下的表现差异。其包含的9自由度机械臂完整运动参数,为研究高维连续动作空间的探索-利用平衡问题提供了基准,同时多摄像头视角的视频数据为跨模态表征学习开辟了新途径。
衍生相关工作
该数据集已催生出多项机器人学习领域的创新研究,包括基于时空注意力机制的动作预测模型、多视角视觉特征融合的强化学习框架等。部分工作进一步扩展了原始数据集的边界,如通过迁移学习将其应用于异构机械臂控制,或结合物理引擎构建数据增强管道以提升样本利用率。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作