feed-my-dog
收藏Hugging Face2025-06-22 更新2025-06-23 收录
下载链接:
https://huggingface.co/datasets/tilmannb/feed-my-dog
下载链接
链接失效反馈官方服务:
资源简介:
该数据集是使用LeRobot创建的,与机器人学相关。数据集包含10个视频片段,每个片段包含多个剧集,每个剧集包含1000个数据块,总共5694帧。数据。数据集的结构详细描述了包含的动作、观察状态、时间戳、帧索引等信息。数据以Parquet文件格式存储,并提供了视频文件。该数据集适用于机器人学的相关研究。
创建时间:
2025-06-22
原始信息汇总
数据集概述
基本信息
- 名称: tilmannb/feed-my-dog
- 许可证: Apache-2.0
- 任务类别: 机器人学
- 标签: LeRobot
数据集描述
- 创建工具: LeRobot
- 主页: 未提供
- 论文: 未提供
数据集结构
- 数据文件格式: Parquet
- 配置名称: default
- 数据文件路径: data//.parquet
元数据 (meta/info.json)
- 代码库版本: v2.1
- 机器人类型: so101_follower
- 总集数: 10
- 总帧数: 5694
- 总任务数: 1
- 总视频数: 10
- 总块数: 1
- 块大小: 1000
- 帧率: 30 fps
- 训练集分割: 0:10
数据路径
- 数据路径模板: data/chunk-{episode_chunk:03d}/episode_{episode_index:06d}.parquet
- 视频路径模板: videos/chunk-{episode_chunk:03d}/{video_key}/episode_{episode_index:06d}.mp4
特征
- 动作 (action)
- 数据类型: float32
- 形状: [6]
- 名称: shoulder_pan.pos, shoulder_lift.pos, elbow_flex.pos, wrist_flex.pos, wrist_roll.pos, gripper.pos
- 观测状态 (observation.state)
- 数据类型: float32
- 形状: [6]
- 名称: 同动作特征
- 观测图像 (observation.images.front)
- 数据类型: video
- 形状: [1080, 1920, 3]
- 名称: height, width, channels
- 视频信息:
- 高度: 1080
- 宽度: 1920
- 编解码器: av1
- 像素格式: yuv420p
- 是否为深度图: false
- 帧率: 30 fps
- 通道数: 3
- 是否有音频: false
- 时间戳 (timestamp)
- 数据类型: float32
- 形状: [1]
- 帧索引 (frame_index)
- 数据类型: int64
- 形状: [1]
- 集索引 (episode_index)
- 数据类型: int64
- 形状: [1]
- 索引 (index)
- 数据类型: int64
- 形状: [1]
- 任务索引 (task_index)
- 数据类型: int64
- 形状: [1]
引用
- BibTeX: 未提供
搜集汇总
数据集介绍

构建方式
在机器人技术领域,feed-my-dog数据集通过LeRobot平台精心构建,采用了先进的机器人操作记录技术。该数据集包含10个完整的情节,共计5694帧数据,以30帧每秒的频率捕捉了SO101型跟随机器人的动作细节。数据以Parquet格式存储,每个情节被分割为1000帧的块,确保了数据的高效管理和处理。动作和状态观测数据均以float32类型记录,涵盖了机器人肩部、肘部、腕部和夹持器的位置信息,为机器人控制研究提供了丰富的原始数据。
特点
feed-my-dog数据集以其多维度的数据采集而著称,不仅包含机器人的6自由度关节位置动作数据,还同步记录了对应的状态观测值。特别值得注意的是,数据集整合了高分辨率(1080x1920)的前视视频流,采用AV1编码和YUV420p像素格式,为视觉-动作联合建模提供了理想条件。所有数据均带有精确的时间戳和帧索引,支持时序分析和跨模态对齐研究。数据集采用Apache 2.0许可,其标准化的数据结构特别适合机器人学习算法的开发和验证。
使用方法
研究者可通过解析Parquet文件直接访问机器人的动作指令和状态反馈,其中动作数据包含六个关节的位置控制参数。视频数据存储在MP4格式中,可与动作数据通过统一的帧索引进行对齐。数据集已预设训练集划分(0-10全部情节),建议使用现代深度学习框架加载处理。对于时序建模任务,可利用时间戳和帧索引构建连续样本;对于模仿学习研究,则可建立观察图像到机器人动作的映射关系。数据路径采用模板化设计,便于程序化批量读取。
背景与挑战
背景概述
feed-my-dog数据集由LeRobot团队构建,专注于机器人操作任务领域。该数据集旨在通过记录机器人执行喂食任务时的多模态数据,包括关节位置、视觉观察和时间戳等信息,为机器人学习与控制研究提供高质量的真实世界交互数据。其核心研究问题聚焦于如何利用多模态感知数据提升机器人执行复杂日常任务的能力,尤其在家庭服务机器人领域具有潜在的应用价值。
当前挑战
该数据集面临的主要挑战体现在两个方面:在领域问题层面,机器人操作任务需要处理高维连续动作空间与视觉感知的复杂映射关系,同时应对真实环境中物体交互的不确定性;在构建过程层面,数据采集涉及多传感器同步、大规模视频数据存储以及机器人控制指令与感知数据的精确对齐等技术难题,这些都对数据质量与标注精度提出了严格要求。
常用场景
经典使用场景
在机器人控制领域,feed-my-dog数据集为研究机械臂的精确控制提供了丰富的实验数据。该数据集通过记录机械臂在喂食任务中的关节位置、动作序列及视觉反馈,为研究人员提供了模拟真实场景下的机器人操作样本。这些数据特别适用于训练和验证基于强化学习的机械臂控制算法,帮助研究者理解多关节协同运动的复杂性。
解决学术问题
该数据集有效解决了机器人学中动作规划与状态估计的关键问题。通过提供高精度的关节位置数据和同步的视觉信息,研究者能够深入分析机械臂在动态环境中的行为模式。数据集的结构化特征为验证新型控制算法的泛化能力提供了基准,尤其对解决高维连续动作空间中的控制难题具有重要价值。
衍生相关工作
该数据集已催生多项机器人控制领域的创新研究。基于其多模态数据特性,研究者开发了融合视觉与动作信息的混合学习框架。部分工作利用该数据集验证了模仿学习在复杂操作任务中的有效性,另有研究则探索了跨任务知识迁移的可能性,为机器人技能学习开辟了新途径。
以上内容由遇见数据集搜集并总结生成



