Conveyor-Based_Classification

Hugging Face2025-12-08 更新2025-12-09 收录

下载链接：

https://huggingface.co/datasets/ROI-su7/Conveyor-Based_Classification

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集由LeRobot创建，包含机器人技术相关的数据。数据集结构包括动作、观察（状态和图像）、时间戳和索引等特征，表明其用于涉及运动和视觉数据的机器人任务。数据集采用Apache 2.0许可，包含301个片段，总计171432帧，分为训练数据。

创建时间：

2025-12-05

原始信息汇总

数据集概述

基本信息

数据集名称: Conveyor-Based_Classification
发布者: ROI-su7
托管平台: Hugging Face
许可证: Apache-2.0
任务类别: 机器人学
相关标签: LeRobot

数据集描述

该数据集使用 LeRobot 创建。
主页和论文信息暂缺。

数据集结构

总体统计

总情节数: 301
总帧数: 171,432
总任务数: 2
数据块大小: 1000
数据文件总大小: 100 MB
视频文件总大小: 500 MB
帧率: 30 FPS
数据拆分: 全部数据（第0至301个情节）用于训练。

文件路径

数据文件路径模式: data/chunk-{chunk_index:03d}/file-{file_index:03d}.parquet
视频文件路径模式: videos/{video_key}/chunk-{chunk_index:03d}/file-{file_index:03d}.mp4

数据特征

数据集包含以下特征字段：

1. 动作

数据类型: float32
形状: [6]
描述: 代表机器人关节位置。
名称:
- shoulder_pan.pos
- shoulder_lift.pos
- elbow_flex.pos
- wrist_flex.pos
- wrist_roll.pos
- gripper.pos

2. 观测状态

数据类型: float32
形状: [6]
描述: 代表机器人关节位置（与动作特征相同）。
名称: 与“动作”特征相同。

3. 观测图像 - 手眼相机

数据类型: video
形状: [360, 640, 3] (高度，宽度，通道)
视频信息:
- 高度: 360 像素
- 宽度: 640 像素
- 编解码器: av1
- 像素格式: yuv420p
- 是否为深度图: 否
- 帧率: 30 FPS
- 通道数: 3
- 是否包含音频: 否

4. 观测图像 - 固定相机

数据类型: video
形状: [360, 640, 3] (高度，宽度，通道)
视频信息: 与“手眼相机”特征完全相同。

5. 其他元数据

时间戳: float32 类型，形状 [1]。
帧索引: int64 类型，形状 [1]。
情节索引: int64 类型，形状 [1]。
索引: int64 类型，形状 [1]。
任务索引: int64 类型，形状 [1]。

引用信息

BibTeX引用格式: 暂缺。

搜集汇总

数据集介绍

构建方式

在机器人操作领域，数据集的构建往往依赖于真实世界的物理交互记录。Conveyor-Based_Classification数据集通过LeRobot平台采集，涵盖了301个完整任务片段，总计超过17万帧数据。数据以分块形式存储于Parquet文件中，每块包含1000帧，确保了高效的数据管理与访问。采集过程中，机器人执行了两种不同的分类任务，其动作状态与观测数据被同步记录，形成了多模态的数据流。

使用方法

研究人员可利用该数据集进行机器人模仿学习、行为克隆及视觉运动策略等算法的训练与验证。数据以标准Parquet格式存储，支持通过HuggingFace数据集库直接加载。训练集涵盖全部301个片段，用户可依据帧索引或任务索引进行数据切片，提取动作、状态及图像序列。视频数据可通过指定路径解码，结合关节数据构建端到端的感知控制模型。

背景与挑战

背景概述

在机器人学习领域，模仿学习与强化学习的研究依赖于高质量、大规模的真实世界交互数据集。Conveyor-Based_Classification数据集由HuggingFace的LeRobot项目团队创建，旨在为基于传送带的物体分类任务提供机器人操作数据。该数据集采集自so101_follower型机器人，包含超过17万帧的多模态观测数据，涵盖关节状态、手眼相机与固定相机视频流，为研究机器人感知与决策的协同优化提供了宝贵资源。其构建依托开源机器人学习框架，体现了社区推动机器人泛化能力发展的共同愿景，对提升机器人在动态工业场景中的适应性具有重要参考价值。

当前挑战

该数据集致力于解决机器人视觉伺服与操作策略学习中的复杂挑战，尤其是在非结构化传送带环境中实现鲁棒的物体分类与抓取。核心难点在于如何从高维视觉与状态数据中提取有效特征，以应对光照变化、物体遮挡及运动模糊等干扰。数据构建过程同样面临诸多困难，包括多传感器时序同步、大规模视频数据的高效压缩存储，以及真实机器人操作中轨迹噪声的抑制。此外，数据标注的稀缺性与任务泛化需求的矛盾，进一步增加了利用该数据集训练稳健模型的复杂性。

常用场景

经典使用场景

在机器人操作与感知领域，Conveyor-Based_Classification数据集为传送带环境下的物体分类任务提供了丰富的多模态数据。该数据集通过记录机械臂在传送带旁执行抓取与分类操作的过程，整合了关节状态、视觉图像和时间序列信息，使其成为训练机器人视觉伺服控制与实时决策模型的理想资源。研究人员可利用这些数据开发算法，使机器人能够动态适应传送带上物体的位置和姿态变化，实现精准的物体识别与分拣。

解决学术问题

该数据集有效解决了机器人学中多模态感知与动作协同的若干核心问题。它通过提供同步的关节位置数据和双视角视觉流，支持研究者在复杂动态场景下探索状态估计、动作预测和视觉反馈控制等课题。数据集的结构化设计有助于克服传统仿真与真实世界之间的领域差距，为端到端强化学习与模仿学习算法提供了高质量的实验平台，推动了机器人自主操作能力的理论进展。

实际应用

在工业自动化与物流分拣系统中，Conveyor-Based_Classification数据集具有直接的应用价值。基于该数据集训练的模型可部署于实际生产线，实现传送带上物体的实时分类与抓取，提升分拣效率并降低人工成本。其多传感器融合特性使得机器人能够在光照变化、物体遮挡等非结构化环境中保持鲁棒性能，为智能制造和仓储物流的智能化升级提供了可靠的技术支撑。

数据集最近研究