smithasbellavi/dataset_PressLitRedButton150Episodes

Name: smithasbellavi/dataset_PressLitRedButton150Episodes
Creator: smithasbellavi
Published: 2026-04-10 16:36:27
License: 暂无描述

Hugging Face2026-04-10 更新2026-04-12 收录

下载链接：

https://hf-mirror.com/datasets/smithasbellavi/dataset_PressLitRedButton150Episodes

下载链接

链接失效反馈

官方服务：

资源简介：

--- license: apache-2.0 task_categories: - robotics tags: - LeRobot configs: - config_name: default data_files: data/*/*.parquet --- This dataset was created using [LeRobot](https://github.com/huggingface/lerobot). <a class="flex" href="https://huggingface.co/spaces/lerobot/visualize_dataset?path=smithasbellavi/dataset_PressLitRedButton150Episodes"> <img class="block dark:hidden" src="https://huggingface.co/datasets/huggingface/badges/resolve/main/visualize-this-dataset-xl.svg"/> <img class="hidden dark:block" src="https://huggingface.co/datasets/huggingface/badges/resolve/main/visualize-this-dataset-xl-dark.svg"/> </a> ## Dataset Description - **Homepage:** [More Information Needed] - **Paper:** [More Information Needed] - **License:** apache-2.0 ## Dataset Structure [meta/info.json](meta/info.json): ```json { "codebase_version": "v3.0", "robot_type": "so_follower", "total_episodes": 110, "total_frames": 64557, "total_tasks": 1, "chunks_size": 1000, "data_files_size_in_mb": 100, "video_files_size_in_mb": 200, "fps": 30, "splits": { "train": "0:110" }, "data_path": "data/chunk-{chunk_index:03d}/file-{file_index:03d}.parquet", "video_path": "videos/{video_key}/chunk-{chunk_index:03d}/file-{file_index:03d}.mp4", "features": { "action": { "dtype": "float32", "shape": [ 6 ], "names": [ "shoulder_pan.pos", "shoulder_lift.pos", "elbow_flex.pos", "wrist_flex.pos", "wrist_roll.pos", "gripper.pos" ] }, "observation.state": { "dtype": "float32", "shape": [ 6 ], "names": [ "shoulder_pan.pos", "shoulder_lift.pos", "elbow_flex.pos", "wrist_flex.pos", "wrist_roll.pos", "gripper.pos" ] }, "observation.images.wrist.top": { "dtype": "video", "shape": [ 480, 640, 3 ], "names": [ "height", "width", "channels" ], "info": { "video.height": 480, "video.width": 640, "video.codec": "av1", "video.pix_fmt": "yuv420p", "video.is_depth_map": false, "video.fps": 30, "video.channels": 3, "has_audio": false } }, "observation.images.top.front": { "dtype": "video", "shape": [ 480, 640, 3 ], "names": [ "height", "width", "channels" ], "info": { "video.height": 480, "video.width": 640, "video.codec": "av1", "video.pix_fmt": "yuv420p", "video.is_depth_map": false, "video.fps": 30, "video.channels": 3, "has_audio": false } }, "observation.images.top.left": { "dtype": "video", "shape": [ 480, 640, 3 ], "names": [ "height", "width", "channels" ], "info": { "video.height": 480, "video.width": 640, "video.codec": "av1", "video.pix_fmt": "yuv420p", "video.is_depth_map": false, "video.fps": 30, "video.channels": 3, "has_audio": false } }, "timestamp": { "dtype": "float32", "shape": [ 1 ], "names": null }, "frame_index": { "dtype": "int64", "shape": [ 1 ], "names": null }, "episode_index": { "dtype": "int64", "shape": [ 1 ], "names": null }, "index": { "dtype": "int64", "shape": [ 1 ], "names": null }, "task_index": { "dtype": "int64", "shape": [ 1 ], "names": null } } } ``` ## Citation **BibTeX:** ```bibtex [More Information Needed] ```

license: Apache-2.0 task_categories: - 机器人学 tags: - LeRobot configs: - config_name: 默认 data_files: data/*/*.parquet 本数据集基于[LeRobot](https://github.com/huggingface/lerobot)构建。 <a class="flex" href="https://huggingface.co/spaces/lerobot/visualize_dataset?path=smithasbellavi/dataset_PressLitRedButton150Episodes"> <img class="block dark:hidden" src="https://huggingface.co/datasets/huggingface/badges/resolve/main/visualize-this-dataset-xl.svg" alt="可视化此数据集"/> <img class="hidden dark:block" src="https://huggingface.co/datasets/huggingface/badges/resolve/main/visualize-this-dataset-xl-dark.svg" alt="可视化此数据集（暗色模式）"/> </a> ## 数据集说明 - **主页：** [需补充更多信息] - **论文：** [需补充更多信息] - **许可证：** Apache-2.0 ## 数据集结构 `meta/info.json`文件内容如下： json { "代码库版本": "v3.0", "机器人类型": "so_follower", "总回合数": 110, "总帧数": 64557, "总任务数": 1, "分块大小": 1000, "数据文件总大小（单位：MB）": 100, "视频文件总大小（单位：MB）": 200, "帧率": 30, "数据集划分": { "训练集": "0:110" }, "数据文件路径格式": "data/chunk-{chunk_index:03d}/file-{file_index:03d}.parquet", "视频文件路径格式": "videos/{video_key}/chunk-{chunk_index:03d}/file-{file_index:03d}.mp4", "数据特征": { "动作": { "数据类型": "float32", "形状": [6], "维度名称": [ "肩旋转关节位置（shoulder_pan.pos）", "肩升降关节位置（shoulder_lift.pos）", "肘屈伸关节位置（elbow_flex.pos）", "腕屈伸关节位置（wrist_flex.pos）", "腕滚动关节位置（wrist_roll.pos）", "夹爪位置（gripper.pos）" ] }, "观测状态": { "数据类型": "float32", "形状": [6], "维度名称": [ "肩旋转关节位置（shoulder_pan.pos）", "肩升降关节位置（shoulder_lift.pos）", "肘屈伸关节位置（elbow_flex.pos）", "腕屈伸关节位置（wrist_flex.pos）", "腕滚动关节位置（wrist_roll.pos）", "夹爪位置（gripper.pos）" ] }, "观测图像-腕部顶视摄像头": { "数据类型": "视频", "形状": [480, 640, 3], "维度名称": ["高度", "宽度", "通道数"], "详细信息": { "视频高度": 480, "视频宽度": 640, "视频编码格式": "av1", "像素格式": "yuv420p", "是否为深度图": 否, "视频帧率": 30, "视频通道数": 3, "是否包含音频": 否 } }, "观测图像-前上方顶视摄像头": { "数据类型": "视频", "形状": [480, 640, 3], "维度名称": ["高度", "宽度", "通道数"], "详细信息": { "视频高度": 480, "视频宽度": 640, "视频编码格式": "av1", "像素格式": "yuv420p", "是否为深度图": 否, "视频帧率": 30, "视频通道数": 3, "是否包含音频": 否 } }, "观测图像-左侧顶视摄像头": { "数据类型": "视频", "形状": [480, 640, 3], "维度名称": ["高度", "宽度", "通道数"], "详细信息": { "视频高度": 480, "视频宽度": 640, "视频编码格式": "av1", "像素格式": "yuv420p", "是否为深度图": 否, "视频帧率": 30, "视频通道数": 3, "是否包含音频": 否 } }, "时间戳": { "数据类型": "float32", "形状": [1], "维度名称": 无 }, "帧索引": { "数据类型": "int64", "形状": [1], "维度名称": 无 }, "回合索引": { "数据类型": "int64", "形状": [1], "维度名称": 无 }, "全局索引": { "数据类型": "int64", "形状": [1], "维度名称": 无 }, "任务索引": { "数据类型": "int64", "形状": [1], "维度名称": 无 } } } ## 引用 **BibTeX格式引用：** bibtex [需补充更多信息]

提供机构：

smithasbellavi

搜集汇总

数据集介绍

构建方式

在机器人学习领域，精细化操作任务的规划与执行是研究重点。数据集"PressLitRedButton150Episodes"依托LeRobot框架构建，专注于机械臂按压发亮红色按钮这一单一任务。采集过程中，利用SoFollower机器人于30帧每秒的速率下，记录共110个训练片段，生成约64,557帧有效数据。每个片段均同步收集了包含6自由度关节位置（肩部、肘部、腕部及夹爪）的动作序列与观测状态，并借助腕部、前上方、左前方三个视角的摄像头捕捉分辨率为480×640的视觉信息，以AV1编码压缩为视频流，最终将元数据与视频文件分块打包为Parquet与MP4格式。

使用方法

借助HuggingFace LeRobot库，使用者可直接通过其数据集加载接口快速接入该资源。调用`load_dataset`函数并指定数据集名称"smithasbellavi/dataset_PressLitRedButton150Episodes"，即可获取包含动作、状态、图像帧与时间戳的结构化字典。推荐利用LeRobot内置的可视化工具（如数据集预览卡片）浏览片段与关键帧，验证数据质量。在模型训练阶段，可将行动指令与观测状态配对作为输入，输出预测的6维关节动作向量，或利用图像流训练端到端的视觉运动策略。数据集已划分为单一训练集，在数据加载时支持分块迭代与批处理，适配基于PyTorch或TensorFlow的常见机器人学习流水线。

背景与挑战

背景概述

在机器人学习领域，操作技能的泛化与迁移长期受限于高质量示范数据的匮乏，尤其是针对精密操控任务的数据集更是稀缺。dataset_PressLitRedButton150Episodes数据集由Hugging Face社区的研究人员利用LeRobot框架构建，旨在解决机器人按压发光按钮这一精细动作的模仿学习问题。该数据集创建于2024年，包含110个示范片段、共计64557帧数据，通过安装在So-Follower机械臂上的多视角摄像头（腕部、前上、左上方）采集了30FPS的视觉与状态信息，其动作空间覆盖了六维关节位置与夹爪控制。作为开源社区推动机器人数据集标准化的重要尝试，该数据集为研究多视角融合下的精细操作策略提供了基准，尤其对探索视觉-运动耦合机制具有启发性价值。

当前挑战

该数据集首先应对了机器人操作领域中精细动作的示范难题——按压小型发光按钮要求毫厘级的末端精度与力度控制，而传统遥操作难以稳定复现此类行为，数据集通过多视角视觉记录和精确的状态追踪为模仿学习提供了高质量训练材料。在构建过程中，挑战体现在多模态数据的同步采集上：三个摄像头以30FPS录制AV1编码视频，需保证每帧的时间戳与机械臂关节状态的精确对齐，避免因硬件延迟或编码丢帧导致的观测-动作错位。此外，仅含单一任务与110个片段的数据规模限制了模型的泛化能力，如何在有限示范中提取跨情景的可迁移特征，以及如何利用合成数据或预训练模型缓解数据稀疏性问题，仍是该数据集面临的核心瓶颈。

常用场景

经典使用场景

在机器人操作与模仿学习领域，dataset_PressLitRedButton150Episodes 作为一项专注于按压发光红色按钮任务的精细化数据集，其核心用途在于训练机械臂完成高精度、低容错的单目标交互动作。该数据集采集了150个完整回合的演示数据，包含来自腕部、前上方及左侧等多个视角的高清视频流，同时记录六自由度关节状态与对应动作值。研究者可借助此数据集训练视觉-运动策略模型，让机器人从多模态观测中学会自主辨识目标物体、规划夹爪轨迹并执行精准施力操作，为复杂环境下的精细操控任务奠定数据基础。

解决学术问题

该数据集旨在解决机器人技能学习中“少样本泛化”与“细粒度操作”这两类核心学术难题。传统的机器人数据集往往覆盖宽泛任务却忽视单一动作的深度建模，而PressLitRedButton聚焦于按钮按压这一微观技能，提供了高密度、多视角、运动状态齐备的示范样本。它使得研究者能够深入探究动态视觉特征与机械臂关节动作之间的映射关系，有助于攻克机器人从演示中学习瞬态接触力控制、时序动作平滑以及视觉干扰下的稳健决策等基础性科学问题，进而推动模仿学习与强化学习在真实物理世界中的应用边界。

实际应用

在实际产业与生活场景中，该数据集训练的模型可被部署至工业装配、智能家居服务及医疗辅助等多元化领域。例如，在精密电子元件装配线上，机器人需准确按压微小按钮或开关；在老年护理环境中，服务机器人可学习按动呼叫铃或操作智能面板；在医疗手术辅助中，机械臂需完成仪器按键的轻触操作。基于PressLitRedButton数据集的策略不仅能够提升机器人在受控环境下的动作可靠性，还能结合域适应技术迁移至新外观、新材质的按钮目标，从而拓展自动化系统的操作灵活性。

数据集最近研究