five

BrunoM42/robocasa_target_KettleBoiling

收藏
Hugging Face2026-03-28 更新2026-03-29 收录
下载链接:
https://hf-mirror.com/datasets/BrunoM42/robocasa_target_KettleBoiling
下载链接
链接失效反馈
官方服务:
资源简介:
--- license: apache-2.0 task_categories: - robotics tags: - LeRobot configs: - config_name: default data_files: data/*/*.parquet --- This dataset was created using [LeRobot](https://github.com/huggingface/lerobot). ## Dataset Description - **Homepage:** [More Information Needed] - **Paper:** [More Information Needed] - **License:** apache-2.0 ## Dataset Structure [meta/info.json](meta/info.json): ```json { "codebase_version": "v3.0", "robot_type": "PandaOmron", "total_episodes": 501, "total_frames": 228349, "total_tasks": 1, "chunks_size": 1000, "fps": 20, "splits": { "train": "0:501" }, "data_path": "data/chunk-{chunk_index:03d}/file-{file_index:03d}.parquet", "video_path": "videos/{video_key}/chunk-{chunk_index:03d}/file-{file_index:03d}.mp4", "features": { "observation.images.robot0_eye_in_hand": { "dtype": "video", "shape": [ 256, 256, 3 ], "names": [ "height", "width", "channel" ], "video_info": { "video.fps": 20, "video.codec": "h264", "video.pix_fmt": "yuv420p", "video.is_depth_map": false, "has_audio": false }, "info": { "video.height": 256, "video.width": 256, "video.codec": "h264", "video.pix_fmt": "yuv420p", "video.is_depth_map": false, "video.fps": 20, "video.channels": 3, "has_audio": false } }, "observation.images.robot0_agentview_left": { "dtype": "video", "shape": [ 256, 256, 3 ], "names": [ "height", "width", "channel" ], "video_info": { "video.fps": 20, "video.codec": "h264", "video.pix_fmt": "yuv420p", "video.is_depth_map": false, "has_audio": false }, "info": { "video.height": 256, "video.width": 256, "video.codec": "h264", "video.pix_fmt": "yuv420p", "video.is_depth_map": false, "video.fps": 20, "video.channels": 3, "has_audio": false } }, "observation.images.robot0_agentview_right": { "dtype": "video", "shape": [ 256, 256, 3 ], "names": [ "height", "width", "channel" ], "video_info": { "video.fps": 20, "video.codec": "h264", "video.pix_fmt": "yuv420p", "video.is_depth_map": false, "has_audio": false }, "info": { "video.height": 256, "video.width": 256, "video.codec": "h264", "video.pix_fmt": "yuv420p", "video.is_depth_map": false, "video.fps": 20, "video.channels": 3, "has_audio": false } }, "annotation.human.task_description": { "dtype": "int64", "shape": [ 1 ], "fps": 20 }, "annotation.human.task_name": { "dtype": "int64", "shape": [ 1 ], "fps": 20 }, "observation.state": { "dtype": "float64", "shape": [ 16 ], "fps": 20 }, "action": { "dtype": "float64", "shape": [ 12 ], "fps": 20 }, "next.reward": { "dtype": "float32", "shape": [ 1 ], "fps": 20 }, "next.done": { "dtype": "bool", "shape": [ 1 ], "fps": 20 }, "timestamp": { "dtype": "float32", "shape": [ 1 ], "names": null, "fps": 20 }, "frame_index": { "dtype": "int64", "shape": [ 1 ], "names": null, "fps": 20 }, "episode_index": { "dtype": "int64", "shape": [ 1 ], "names": null, "fps": 20 }, "index": { "dtype": "int64", "shape": [ 1 ], "names": null, "fps": 20 }, "task_index": { "dtype": "int64", "shape": [ 1 ], "names": null, "fps": 20 } }, "data_files_size_in_mb": 100, "video_files_size_in_mb": 200 } ``` ## Citation **BibTeX:** ```bibtex [More Information Needed] ```
提供机构:
BrunoM42
搜集汇总
数据集介绍
main_image_url
构建方式
在机器人操作任务数据集的构建领域,robocasa_target_KettleBoiling数据集通过LeRobot框架精心构建而成。该框架采用PandaOmron机器人平台,以20帧每秒的采样率,系统性地采集了501条完整的任务执行轨迹,共计228,349帧数据。数据以分块形式组织,每块包含1000帧,并存储为Parquet格式,确保了高效的数据存储与访问。整个构建过程聚焦于单一任务——烧水壶操作,通过记录机器人的多视角视觉观测、状态信息以及对应的动作序列,形成了结构化的示范数据集。
特点
该数据集在机器人模仿学习与强化学习研究中展现出显著特点。其核心在于提供了丰富的多模态观测数据,包括机器人手眼相机视角以及左右两个固定视角的高清视频流,每帧图像分辨率均为256x256像素,编码格式为H.264。同时,数据集包含了16维的机器人状态向量、12维的动作向量以及即时奖励和任务完成标志,所有数据均以20Hz的频率严格同步。这种高精度、多视角且时间对齐的数据结构,为训练复杂的端到端策略模型提供了坚实的基础。
使用方法
对于旨在利用示范数据推进机器人技能学习的研究者而言,该数据集的使用方法清晰而直接。用户可通过加载指定的Parquet数据文件来访问每一帧的观测、动作及元数据。数据集已预分为训练集,涵盖了全部501条轨迹,便于直接用于行为克隆或离线强化学习算法的训练。研究者可以依据`episode_index`和`frame_index`索引特定轨迹与时间步,并关联对应的MP4格式视频文件进行可视化分析,从而深入理解机器人执行烧水壶任务的行为模式与决策过程。
背景与挑战
背景概述
在机器人学习领域,模仿学习与强化学习的发展亟需高质量、大规模的真实世界交互数据集作为支撑。robocasa_target_KettleBoiling数据集应运而生,由LeRobot项目团队创建,专注于家庭环境中的具身智能任务。该数据集记录了PandaOmron机器人执行烧水任务的501条轨迹,包含超过22万帧的多视角视觉观测、机器人状态与动作序列,旨在为机器人操作技能的学习与泛化提供实证基础。其核心研究问题在于如何让机器人通过观察人类演示或自主探索,掌握复杂、长周期的日常操作能力,从而推动服务机器人在非结构化环境中的实际应用。
当前挑战
该数据集致力于解决机器人操作任务中长周期、多步骤序列学习的挑战,例如烧水任务涉及物体抓取、姿态调整、开关操控等连续决策,要求模型具备强大的时序理解与动作规划能力。在构建过程中,挑战主要源于真实世界数据的采集与标注:机器人硬件同步控制、多传感器数据融合、任务轨迹的精确记录均需高度可靠的系统集成;同时,大规模视频数据的存储、压缩与高效检索也带来了显著的计算与工程负担。此外,确保演示数据的多样性、覆盖任务执行中的各种边缘情况,以提升学习模型的鲁棒性,同样是数据集构建的关键难点。
常用场景
经典使用场景
在机器人操作领域,robocasa_target_KettleBoiling数据集聚焦于家庭环境中的水壶烧水任务,为机器人学习复杂操作提供了丰富的视觉与动作数据。该数据集通过PandaOmron机器人采集了501个完整操作序列,包含多视角视频和状态信息,典型应用于训练机器人模仿学习模型,使其能够理解并执行从抓取水壶到放置加热的连贯动作。数据集的高帧率视频和结构化标注支持了端到端策略学习,推动了机器人自主执行日常任务的能力。
衍生相关工作
围绕该数据集,衍生出多项经典研究工作,主要集中在机器人模仿学习和强化学习领域。例如,基于LeRobot框架的后续研究利用这些数据开发了高效的策略蒸馏方法,提升了任务完成率。同时,数据集促进了多任务学习模型的探索,如将水壶烧水动作泛化到其他加热操作。这些工作不仅扩展了数据集的学术价值,还为开源机器人社区提供了可复现的基准,推动了整个领域的标准化进程。
数据集最近研究
最新研究方向
在机器人操作领域,robocasa_target_KettleBoiling数据集聚焦于家庭环境中的水壶烧水任务,为具身智能研究提供了丰富的多模态交互数据。该数据集包含501个由PandaOmron机器人执行的完整操作序列,涵盖手眼视角与全局视角的高清视频流,以及精确的动作状态标注,为模仿学习与强化学习算法的训练与评估奠定了坚实基础。当前前沿研究围绕视觉-动作表征学习展开,旨在从多视角视频中提取鲁棒的特征表示,以提升机器人在复杂动态场景下的泛化能力。同时,结合大语言模型进行任务规划与指令理解成为热点方向,通过自然语言描述驱动机器人完成序列化操作,推动机器人向更智能、更自主的家居助手演进。这一数据集不仅加速了机器人技能学习的进程,也为跨任务迁移与安全交互等关键挑战提供了实证研究平台,对推动服务机器人的实际应用具有深远意义。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作