lekiwi-dataset
收藏Hugging Face2026-03-05 更新2026-03-06 收录
下载链接:
https://huggingface.co/datasets/jgreeley/lekiwi-dataset
下载链接
链接失效反馈官方服务:
资源简介:
该数据集是使用LeRobot创建的,主要用于机器人技术领域。数据集包含多个特征,如动作、观察状态、图像和时间戳等。动作和观察状态的特征均为9维浮点数组,分别代表机械臂的不同位置和速度。图像数据包括前端、腕部和顶部三个视角的视频,分辨率为1920x1080或1080x1920,3通道。数据集还包含时间戳、帧索引、片段索引和任务索引等元数据。数据以parquet格式存储,总数据文件大小为100MB,视频文件大小为200MB,帧率为10fps。适用于机器人控制、行为模仿等任务。
创建时间:
2026-03-03
原始信息汇总
数据集概述
基本信息
- 数据集名称: lekiwi-dataset
- 发布者: jgreeley
- 托管地址: https://huggingface.co/datasets/jgreeley/lekiwi-dataset
- 许可证: Apache 2.0
- 任务类别: 机器人学
- 相关标签: LeRobot
- 创建工具: 使用 LeRobot (https://github.com/huggingface/lerobot) 创建
数据集详情
- 主页: [信息缺失]
- 论文: [信息缺失]
- 引用信息: [信息缺失]
数据集结构
- 数据格式: Parquet 文件
- 数据文件路径模式:
data/chunk-{chunk_index:03d}/file-{file_index:03d}.parquet - 视频文件路径模式:
videos/{video_key}/chunk-{chunk_index:03d}/file-{file_index:03d}.mp4 - 配置: 默认配置的数据文件模式为
data/*/*.parquet
元数据信息 (meta/info.json)
- 代码库版本: v3.0
- 机器人类型: lekiwi_client
- 总情节数: 0
- 总帧数: 0
- 总任务数: 0
- 数据块大小: 1000
- 数据文件总大小: 100 MB
- 视频文件总大小: 200 MB
- 帧率: 10 FPS
- 数据分割: {}
数据特征
-
动作
- 数据类型: float32
- 形状: [9]
- 特征名:
- arm_shoulder_pan.pos
- arm_shoulder_lift.pos
- arm_elbow_flex.pos
- arm_wrist_flex.pos
- arm_wrist_roll.pos
- arm_gripper.pos
- x.vel
- y.vel
- theta.vel
-
观测状态
- 数据类型: float32
- 形状: [9]
- 特征名:
- arm_shoulder_pan.pos
- arm_shoulder_lift.pos
- arm_elbow_flex.pos
- arm_wrist_flex.pos
- arm_wrist_roll.pos
- arm_gripper.pos
- x.vel
- y.vel
- theta.vel
-
观测图像 - 前视
- 数据类型: video
- 形状: [1080, 1920, 3]
- 特征名: height, width, channels
-
观测图像 - 腕部
- 数据类型: video
- 形状: [1920, 1080, 3]
- 特征名: height, width, channels
-
观测图像 - 顶部
- 数据类型: video
- 形状: [1920, 1080, 3]
- 特征名: height, width, channels
-
时间戳
- 数据类型: float32
- 形状: [1]
- 特征名: null
-
帧索引
- 数据类型: int64
- 形状: [1]
- 特征名: null
-
情节索引
- 数据类型: int64
- 形状: [1]
- 特征名: null
-
索引
- 数据类型: int64
- 形状: [1]
- 特征名: null
-
任务索引
- 数据类型: int64
- 形状: [1]
- 特征名: null
搜集汇总
数据集介绍
构建方式
在机器人学领域,高质量的数据集对于推动机器人控制与感知算法的进步至关重要。lekiwi-dataset依托LeRobot开源框架构建而成,其数据采集过程通过lekiwi_client机器人平台实现,以10帧每秒的频率同步记录多模态观测信息。该数据集采用分块存储策略,将数据组织为以Parquet格式保存的多个数据块,每个数据块包含1000帧记录,确保了大规模数据的高效管理与访问。数据采集覆盖了机器人执行任务的全过程,涵盖了机械臂关节位置、末端执行器速度以及来自前视、腕部和顶部摄像头的视觉信息,为机器人学习提供了丰富的交互上下文。
特点
lekiwi-dataset的显著特征在于其精心设计的结构化多模态数据表示。数据集不仅提供了精确的9维机械臂动作与状态向量,详细记录了肩部平移、肩部升降、肘部弯曲、腕部弯曲、腕部旋转以及夹爪的位置与速度信息,还整合了来自三个不同视角的高清视频流,分辨率分别达到1080x1920和1920x1080,为算法提供了丰富的视觉环境感知。其数据架构通过时间戳、帧索引、回合索引和任务索引实现了精细的时序与任务关联,这种统一且标准化的特征设计极大地方便了机器人模仿学习与强化学习模型的训练与评估。
使用方法
为有效利用lekiwi-dataset进行研究与开发,用户需遵循其特定的数据加载范式。数据集以分块Parquet文件形式提供,可通过meta/info.json中的路径模板进行定位与读取。研究人员可以依据episode_index或task_index筛选特定任务序列,结合同步记录的关节状态、动作指令与多视角视频帧,构建用于行为克隆、离线强化学习或视觉运动策略学习的训练样本。由于数据已按时间顺序对齐并附有精确的时间戳,开发者能够轻松复现机器人的动态行为,或将其作为基准测试环境,用于验证各类机器人控制算法在真实世界数据上的泛化性能。
背景与挑战
背景概述
lekiwi-dataset作为机器人学习领域的一项新兴数据资源,其创建依托于HuggingFace的LeRobot开源框架,旨在推动机器人操作技能的智能化发展。该数据集聚焦于机械臂的多模态交互任务,通过整合高维度的关节位置、速度信息以及多视角视觉观测,为模仿学习与强化学习算法提供了丰富的训练样本。尽管其具体创建时间与核心研究团队尚未在公开资料中详尽披露,但数据集的结构设计体现了对机器人精细操作与感知融合的前沿探索,有望为家庭服务与工业自动化场景中的自主决策系统构建奠定数据基础。
当前挑战
该数据集致力于解决机器人操作任务中的动作规划与视觉感知协同挑战,其核心在于如何从多模态观测中学习鲁棒且泛化的控制策略。构建过程中面临诸多困难,包括多传感器数据的精确同步与对齐、高分辨率视频流带来的存储与处理负担,以及真实世界环境中动作序列的多样性与噪声干扰。此外,数据采集需确保机械臂运动的安全性,同时覆盖足够广泛的任务分布以支持模型泛化,这些因素共同构成了数据集构建与利用中的关键障碍。
常用场景
经典使用场景
在机器人学习领域,lekiwi-dataset为机器人操作任务提供了丰富的多模态数据资源。该数据集通过LeRobot框架收集,包含机械臂关节位置、速度以及多视角图像序列,典型应用于模仿学习与强化学习算法的训练与评估。研究人员利用其结构化动作与观测数据,构建端到端的控制策略模型,模拟真实环境中的抓取、放置等精细操作任务,推动机器人自主行为学习的发展。
实际应用
lekiwi-dataset在工业自动化与服务机器人领域具有直接应用价值。基于其记录的机械臂操作数据,可训练模型实现生产线上的物体分拣、装配等任务,降低人工编程成本。多视角视觉数据进一步支持场景理解与障碍物避让,提升机器人在复杂环境中的鲁棒性。该数据集为实际部署前的算法验证提供了可靠基准,加速机器人技术的产业化落地。
衍生相关工作
围绕lekiwi-dataset,已衍生出多项机器人学习领域的经典研究。例如,基于其多模态数据开发的视觉-动作映射模型,推动了跨模态表示学习的发展;利用时序帧序列的工作,深化了强化学习中的分层策略与记忆机制探索。这些研究不仅扩展了数据集的用途,还促进了LeRobot生态系统的完善,为开源机器人学习社区贡献了核心资源。
以上内容由遇见数据集搜集并总结生成



