five

calvin_small_debug_train_lerobot

收藏
Hugging Face2026-01-16 更新2026-01-17 收录
下载链接:
https://huggingface.co/datasets/redha24/calvin_small_debug_train_lerobot
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集是一个机器人相关的数据集,使用LeRobot创建。具体涉及panda机器人,包含9个任务和503帧数据。数据集包含多种观察和动作特征,如前端和手腕图像、机器人状态(如末端执行器位置、方向、关节位置等)、动作(如末端执行器位置、方向、夹持器动作等)以及时间戳、帧索引、任务索引等。数据以parquet格式存储,视频以mp4格式存储。
创建时间:
2026-01-15
原始信息汇总

数据集概述

基本信息

  • 数据集名称: calvin_small_debug_train_lerobot
  • 创建工具: LeRobot (https://github.com/huggingface/lerobot)
  • 许可证: Apache-2.0
  • 任务类别: 机器人学

数据集规模与结构

  • 总情节数: 9
  • 总帧数: 503
  • 总任务数: 9
  • 数据块大小: 1000
  • 数据文件总大小: 100 MB
  • 视频文件总大小: 500 MB
  • 帧率: 30 FPS
  • 数据分割: 训练集 (0:9)

数据特征

观测数据

  • observation.images.front:
    • 类型: 视频
    • 形状: [200, 200, 3]
    • 维度名称: ["h", "w", "c"]
  • observation.images.wrist:
    • 类型: 视频
    • 形状: [84, 84, 3]
    • 维度名称: ["h", "w", "c"]
  • observation.state:
    • 类型: float32
    • 形状: [15]
    • 维度名称: ["ee_position_x", "ee_position_y", "ee_position_z", "ee_orientation_rx", "ee_orientation_ry", "ee_orientation_rz", "gripper_width", "joint_position_00", "joint_position_01", "joint_position_02", "joint_position_03", "joint_position_04", "joint_position_05", "joint_position_06", "gripper_action"]

动作数据

  • action:
    • 类型: float32
    • 形状: [7]
    • 维度名称: ["ee_position_x", "ee_position_y", "ee_position_z", "ee_orientation_rx", "ee_orientation_ry", "ee_orientation_rz", "gripper_action"]

元数据

  • timestamp: float32, 形状: [1]
  • frame_index: int64, 形状: [1]
  • episode_index: int64, 形状: [1]
  • index: int64, 形状: [1]
  • task_index: int64, 形状: [1]

文件存储格式

  • 数据文件路径模式: data/chunk-{chunk_index:03d}/file-{file_index:03d}.parquet
  • 视频文件路径模式: videos/{video_key}/chunk-{chunk_index:03d}/file-{file_index:03d}.mp4
  • 配置文件: meta/info.json

技术信息

  • 代码库版本: v3.0
  • 机器人类型: panda

引用信息

  • 主页: [More Information Needed]
  • 论文: [More Information Needed]
  • BibTeX引用: [More Information Needed]
搜集汇总
数据集介绍
main_image_url
构建方式
在机器人学习领域,高质量的数据集对于模型训练至关重要。calvin_small_debug_train_lerobot数据集依托LeRobot平台构建,采用Apache 2.0开源协议,专为机器人操控任务设计。该数据集以Franka Emika Panda机械臂为操作实体,通过结构化方式采集了9个独立任务序列,共计503帧数据,并以30帧每秒的速率记录。数据以分块形式存储于Parquet文件中,每个块大小设定为1000,整体数据文件与视频文件分别占据100MB和500MB的存储空间,确保了数据管理的效率与可扩展性。
使用方法
为便于研究与应用,该数据集已集成于HuggingFace平台。用户可通过LeRobot代码库直接加载,数据文件路径遵循'data/chunk-{chunk_index:03d}/file-{file_index:03d}.parquet'的命名规范,视频文件则存储于相应视频路径下。数据集特征结构清晰,支持按需访问图像、状态、动作及各类索引字段。鉴于其规模适中且标注完备,该数据集适用于机器人策略学习、模仿学习或强化学习算法的调试、验证与小规模实验,为机器人智能控制研究提供了便捷的基准资源。
背景与挑战
背景概述
在机器人学习领域,高质量、大规模的数据集对于推动机器人技能泛化与自主决策研究至关重要。calvin_small_debug_train_lerobot数据集作为LeRobot项目的一部分,专注于机器人操作任务的演示数据收集,其构建依托于Apache 2.0开源协议,旨在为机器人模仿学习与强化学习算法提供结构化、多模态的训练资源。该数据集以Franka Emika Panda机械臂为平台,记录了包括前端与腕部视觉观测、机器人状态及动作指令在内的丰富时序信息,其设计核心在于通过真实世界交互数据,促进机器人对复杂操作任务的理解与执行能力的提升,为机器人泛化学习研究奠定了数据基础。
当前挑战
该数据集旨在解决机器人操作任务中的技能学习与泛化问题,其核心挑战在于如何从有限演示中提取可迁移的策略,以应对真实环境中物体多样性、场景变化及任务复杂性带来的不确定性。在构建过程中,面临多模态数据同步与对齐的技术难题,需确保视觉、状态与动作序列在时序上精确一致;同时,数据采集涉及高维度连续空间,对传感器校准、数据存储效率及标注一致性提出了较高要求,而小规模调试数据集的特性亦限制了其在复杂任务泛化能力验证方面的直接应用。
常用场景
经典使用场景
在机器人学习领域,calvin_small_debug_train_lerobot数据集作为调试与验证工具,为研究者提供了结构化的机器人操作序列数据。其经典使用场景在于模拟Franka Panda机械臂在多样化任务中的视觉-动作映射过程,通过包含前视与腕部摄像头图像、末端执行器状态及关节位置等多模态观测,配合精确的动作标签,支持端到端策略学习算法的快速原型开发与性能评估。该数据集尤其适用于小规模实验环境,帮助研究者验证模型在有限数据下的泛化能力与鲁棒性。
解决学术问题
该数据集有效应对了机器人模仿学习与强化学习中数据稀缺与标注复杂性的挑战。通过提供高质量的时序动作-状态对,它促进了基于视觉的机器人控制算法的研究,解决了从高维图像输入到连续动作空间映射的经典难题。其结构化特征设计支持多任务学习框架的探索,为研究跨任务知识迁移、样本效率提升以及长期序列预测等学术问题提供了实证基础,推动了机器人自主操作技术的理论进展。
实际应用
在实际机器人系统中,calvin_small_debug_train_lerobot数据集可直接应用于工业自动化与家庭服务机器人的技能学习。例如,基于该数据训练的模型能够指导机械臂完成抓取、放置等精细操作,提升生产线上的灵活性与适应性。在科研与教育场景中,它作为标准测试平台,加速了新算法的部署与比较,降低了机器人实验的硬件门槛,为智能体在真实世界的交互能力优化提供了可靠的数据支撑。
数据集最近研究
最新研究方向
在机器人学习领域,calvin_small_debug_train_lerobot数据集作为LeRobot框架下的调试资源,正推动着机器人操作技能的高效训练与验证。前沿研究聚焦于利用其多模态观测数据,包括前视与腕部摄像头视频以及精确的末端执行器状态,探索基于强化学习与模仿学习的策略泛化能力。热点事件中,该数据集与开源机器人社区的活跃开发紧密相连,促进了轻量级模型在真实世界任务中的快速迭代与部署。其影响在于为机器人控制算法的调试与优化提供了标准化基准,意义深远地加速了智能机器人从仿真到实际应用的转化进程。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作