sort_plastic

Hugging Face2025-12-14 更新2025-12-15 收录

下载链接：

https://huggingface.co/datasets/nalyda/sort_plastic

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集使用LeRobot创建，包含机器人操作相关的数据。具体包括50个片段，总计17263帧数据，涉及1个任务。数据以parquet格式存储，包含动作、观测状态（如关节位置）、顶部和侧面视角的图像视频（分辨率480x640，30fps）等特征。视频文件采用av1编码，无音频。数据集结构详细，但未明确说明具体应用场景或研究目的。

This dataset was created using LeRobot and contains data related to robotic manipulation. It specifically includes 50 segments, totaling 17,263 frames, covering one single task. The data is stored in Parquet format and includes features such as actions, observation states (e.g., joint positions), and image videos from top and side viewpoints with a resolution of 480x640 at 30fps. The video files are encoded with AV1 and have no audio. The dataset has a detailed structure, but its specific application scenarios and research purposes are not explicitly specified.

创建时间：

2025-12-14

原始信息汇总

数据集概述

基本信息

数据集名称： sort_plastic
托管平台： Hugging Face
创建工具： 使用 LeRobot 创建
许可证： Apache-2.0
任务类别： 机器人学
标签： LeRobot

数据集规模与结构

总情节数： 50
总帧数： 17263
总任务数： 1
数据块大小： 1000
数据文件总大小： 100 MB
视频文件总大小： 500 MB
帧率： 30 FPS
数据分割： 全部数据用于训练（train: 0:50）
代码库版本： v3.0
机器人类型： so101_follower

数据文件与路径

数据文件格式： Parquet
数据文件路径模式： data/chunk-{chunk_index:03d}/file-{file_index:03d}.parquet
视频文件路径模式： videos/{video_key}/chunk-{chunk_index:03d}/file-{file_index:03d}.mp4

数据特征

动作

数据类型： float32
形状： [6]
特征名称：
- shoulder_pan.pos
- shoulder_lift.pos
- elbow_flex.pos
- wrist_flex.pos
- wrist_roll.pos
- gripper.pos

观测状态

数据类型： float32
形状： [6]
特征名称：
- shoulder_pan.pos
- shoulder_lift.pos
- elbow_flex.pos
- wrist_flex.pos
- wrist_roll.pos
- gripper.pos

观测图像（顶部视角）

数据类型： video
形状： [480, 640, 3] (高度, 宽度, 通道)
视频信息：
- 高度: 480
- 宽度: 640
- 编解码器: av1
- 像素格式: yuv420p
- 是否为深度图: false
- 帧率: 30
- 通道数: 3
- 包含音频: false

观测图像（侧面视角）

数据类型： video
形状： [480, 640, 3] (高度, 宽度, 通道)
视频信息：
- 高度: 480
- 宽度: 640
- 编解码器: av1
- 像素格式: yuv420p
- 是否为深度图: false
- 帧率: 30
- 通道数: 3
- 包含音频: false

元数据

时间戳： 数据类型 float32，形状 [1]
帧索引： 数据类型 int64，形状 [1]
情节索引： 数据类型 int64，形状 [1]
索引： 数据类型 int64，形状 [1]
任务索引： 数据类型 int64，形状 [1]

附加说明

主页： 信息缺失
论文： 信息缺失
引用格式： 信息缺失

搜集汇总

数据集介绍

构建方式

在机器人操作任务的数据集构建领域，sort_plastic数据集依托LeRobot平台精心构建而成。该数据集通过so101_follower型机器人执行单一任务，系统采集了50条完整操作序列，共计17263帧数据。数据以分块形式存储于Parquet文件中，每块包含1000帧，同时配有高帧率视频记录，从顶部和侧面双视角捕捉机器人执行塑料分拣任务时的视觉信息与关节状态，确保了数据在时序与空间维度上的连贯性与丰富性。

特点

该数据集在机器人学习领域展现出鲜明的多模态特性，其核心特征在于同步整合了机器人的动作指令、关节状态观测以及双视角视觉流。动作与状态数据均以六维浮点向量精确表征肩部、肘部、腕部及夹爪的位置信息，而视觉数据则以每秒30帧、分辨率达640x480的彩色视频形式提供，采用先进的AV1编码格式。数据集结构清晰，通过帧索引、片段索引等元数据实现了高效的数据组织与检索，为模仿学习与强化学习算法提供了高维度的时空对齐样本。

使用方法

为有效利用该数据集进行机器人技能学习研究，使用者可依据其标准化的数据路径加载训练集。数据以分块Parquet文件形式组织，便于流式读取与批量处理。研究者可并行解析动作序列、关节状态以及对应的双视角视频帧，构建端到端的训练管道。该数据集特别适用于训练视觉运动策略模型，通过观测历史状态与图像序列来预测后续动作，亦可用于行为克隆或离线强化学习等范式，以提升机器人在复杂分拣任务中的自主操作能力。

背景与挑战

背景概述

在机器人学习领域，高质量、大规模的真实世界交互数据对于推动模仿学习与强化学习算法的进步至关重要。sort_plastic数据集由LeRobot项目团队构建，旨在为机器人操作任务提供丰富的多模态演示数据。该数据集采集自so101_follower型机器人平台，包含50个完整操作序列，共计超过17000帧同步记录的状态、动作及双视角视觉信息，其核心研究问题聚焦于如何利用真实环境下的机器人演示数据，提升模型在复杂物体操作任务中的泛化能力与鲁棒性。尽管相关论文与主页信息暂未公开，但该数据集依托开源机器人学习框架LeRobot，体现了社区在推动数据驱动机器人技术发展方面的持续努力，为后续研究提供了宝贵的真实世界交互基准。

当前挑战

sort_plastic数据集致力于解决机器人操作任务中模仿学习与策略泛化的核心挑战，其具体问题在于如何让机器人从有限的演示中学会对塑料类物体进行可靠的分拣与操控。这一领域长期面临动作序列长程依赖建模、多模态感知信息对齐以及真实环境动态变化适应等难题。在数据集构建过程中，挑战同样显著：需要精确同步机械臂关节状态、夹爪动作与双路高清视频流，确保时序一致性；同时，大规模真实机器人数据采集成本高昂，涉及硬件控制、数据存储与标注流程的可靠性设计；此外，数据还需具备足够的多样性与覆盖度，以支撑模型应对未见过的物体姿态与环境干扰。

常用场景

经典使用场景

在机器人操作领域，sort_plastic数据集为机械臂执行物体分拣任务提供了丰富的多模态演示数据。该数据集通过记录六自由度机械臂在分拣塑料物体过程中的关节位置、夹爪状态以及顶部和侧面的视觉观测，构建了从感知到动作的完整轨迹。研究人员能够利用这些数据训练模仿学习或强化学习模型，使机器人学会在复杂环境中识别、抓取和分类塑料物品，从而模拟现实世界中的自动化分拣操作。

解决学术问题

该数据集有效解决了机器人操作中样本效率低下和泛化能力不足的学术难题。通过提供大量真实世界的演示轨迹，它降低了从零开始训练策略所需的环境交互成本，并促进了跨任务的知识迁移。其多模态特征融合机制为研究视觉-动作对齐、状态表示学习以及长期序列预测提供了基准，推动了端到端机器人控制方法的理论进展，尤其在少样本学习和领域适应方面具有深远影响。

衍生相关工作

围绕sort_plastic数据集，已衍生出一系列经典研究工作。例如，基于其多视角视频和动作序列，研究者开发了先进的视觉运动策略网络，实现了更鲁棒的抓取姿态预测。同时，该数据集也被用于评估离线强化学习算法在机器人操作中的性能，催生了多种模型基与无模型结合的学习框架。这些工作不仅拓展了数据集中隐含的任务泛化能力，也为后续更大规模的机器人数据集构建提供了方法论参考。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集