naavox/clear_floor

Name: naavox/clear_floor
Creator: naavox
Published: 2026-05-01 11:53:33
License: 暂无描述

Hugging Face2026-05-01 更新2026-05-03 收录

下载链接：

https://hf-mirror.com/datasets/naavox/clear_floor

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集是使用LeRobot创建的，与机器人技术相关。数据集包含83个episodes，166784帧，1个任务。数据文件大小为100MB，视频文件大小为200MB，帧率为60fps。数据集结构包括动作、观测状态、来自不同摄像头的图像等特征。动作特征包括12个浮点数值，观测状态包括25个浮点数值，图像特征包括来自gripper_camera、anchor_camera_1和anchor_camera_2的视频数据。数据集还包含时间戳、帧索引、episode索引等信息。

This dataset was created using LeRobot and is related to robotics. It contains 83 episodes, 166784 frames, and 1 task. The data files size is 100MB, and the video files size is 200MB, with a frame rate of 60fps. The dataset structure includes features such as actions, observation states, and images from different cameras. The action features include 12 floating-point values, the observation state includes 25 floating-point values, and the image features include video data from gripper_camera, anchor_camera_1, and anchor_camera_2. The dataset also includes timestamps, frame indices, episode indices, and other information.

提供机构：

naavox

搜集汇总

数据集介绍

构建方式

clear_floor数据集基于LeRobot框架精心构建，通过遥操作技术采集真实机器人执行地面清理任务的示范数据。数据集共包含83个完整演示片段（episodes），累计记录166784帧高频率（60 FPS）的传感器与动作序列，所有数据按训练集划分，无验证或测试集。数据组织采用分块存储策略，以Parquet格式保存结构化数值特征，同时将三路视觉观测（夹爪摄像头及两台锚点摄像头）编码为AV1压缩视频，并与元数据文件（info.json）共同构成高效、可复现的数据管线。

使用方法

研究者可借助Hugging Face LeRobot工具库便捷地加载与使用该数据集。推荐通过LeRobot内置的可视化界面（Spaces）预览数据样本，直观检查演示片段中的图像观测与动作序列。在模型训练中，可依据Parquet文件中包含的episode_index与frame_index对数据进行时间对齐与轨迹切片，并灵活选取特定观测模态（如仅使用夹爪图像与关节状态）作为策略网络的输入。此外，由于数据集采用统一的LeRobot格式，可无缝对接模仿学习、离线强化学习等现有代码库，便于复现基准实验或开展跨任务迁移研究。

背景与挑战

背景概述

在机器人学习领域，从示教数据中学习复杂操作技能是推动自主智能体发展的关键路径。clear_floor数据集由Hugging Face社区通过LeRobot框架创建，旨在为机器人地板清理任务提供标准化的训练与评估基准。该数据集包含83个示范片段、总计166784帧观测数据，于2024年左右发布，采用Apache-2.0许可协议，核心研究问题聚焦于如何利用多模态感知信息（包括三视角视觉、关节状态与触觉反馈）实现机器人对“清扫地板”这一长时域、连续动作任务的模仿学习。由于其任务兼具空间覆盖性与实时决策要求，该数据集成为研究机器人精细操作、多模态融合与泛化迁移能力的重要资源。

当前挑战

该数据集所解决的领域问题在于：机器人自主完成扫地任务需要克服实时感知地面杂物分布、规划连续清扫轨迹以及应对动态环境变化的多重挑战，而现有数据多以单任务、短时域示范为主，难以支撑长序列动作的稳健学习。构建过程中，采集系统需同步驱动12维动作空间（包含夹爪速度与多锚点控制）与25维状态向量，并通过384×384与544×960分辨率的多视角摄像头捕获高帧率（60fps）视频流，同时嵌入激光测距与触觉压力信号，数据流管理及时间同步的复杂性极高。此外，超100MB的压缩视频文件与83个episodes的规模，也对数据存储、高效索引和异构模态对齐提出了严峻考验。

常用场景

经典使用场景

在机器人操作与模仿学习领域，clear_floor数据集为训练机器人完成地面清洁任务提供了宝贵的基准资源。该数据集包含83个演示片段，总计超过16万帧的高频时序数据，记录了名为“stringman”的机器人通过多视角摄像头（包括夹爪摄像头和两个锚点摄像头）感知环境，并执行12维动作指令以清理地面的完整流程。研究者可借助这些精细的视觉-运动耦合数据，训练机器人从示范中学习如何协调夹爪移动、腕部旋转与手指开合等动作，从而复现有效的清洁策略。其高频采样率（60 FPS）与多模态观测信息（如激光测距仪和指端压力），使得构建稳健的端到端模仿学习模型成为可能。

解决学术问题

该数据集的核心学术价值在于推动了机器人灵巧操作与自主导航交叉领域的研究。它专注于解决如何将高维视觉观测与低维动作序列进行有效对齐这一基础难题，尤其针对非结构化家庭环境下的地面清洁任务。通过提供包含力反馈、位置姿态及多种传感器数据的完整轨迹，clear_floor有助于探究示范学习中的因果推理问题，例如如何从杂乱场景中提取关键目标，并规划出平滑无碰撞的清扫路径。此外，该数据集为验证分层强化学习架构（如将动作分解为抓取与平移子任务）提供了标准化测试平台，对理解机器人技能泛化与迁移学习的机理具有深远意义。

实际应用

在实际应用层面，clear_floor数据集直接服务于智能家居与商业服务机器人领域。例如，可基于该数据集训练出的模型部署于家庭扫地机器人，使其通过学习人类演示中的清扫模式（如针对不同地面的摩擦力调整夹爪力度），自适应清理碎屑或平整地毯纤维。此外，该数据集中包含的夹爪速度与指端压力信息，可用于工业场景中的精密表面清洁，如电子元件的无痕除尘。物流仓储中，机器人操作员也可借鉴这些数据，实现高效分拣与货物区域的自主维护，从而减少人工干预并提升运营效率。

数据集最近研究