sort_sharp

Hugging Face2026-02-17 更新2026-02-18 收录

下载链接：

https://huggingface.co/datasets/kd-forge/sort_sharp

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集由 LeRobot 创建，专注于机器人技术领域。数据集包含 185 个 episodes，总计 131436 帧，数据文件大小为 10000 MB，视频文件大小为 50000 MB。数据以 parquet 格式存储，帧率为 30 fps。数据集的特征包括动作（action）和观察状态（observation.state），其中动作和状态均包含 12 个关节的位置信息。此外，数据集还提供了多个视角的图像观察（observation.images），每个图像的分辨率为 480x640，编码格式为 av1。其他特征包括时间戳（timestamp）、帧索引（frame_index）、episode 索引（episode_index）、索引（index）和任务索引（task_index）。该数据集适用于机器人控制、行为模仿等任务。

创建时间：

2026-02-16

搜集汇总

数据集介绍

构建方式

在机器人操作领域，高质量的数据集对于训练智能体执行复杂任务至关重要。sort_sharp数据集依托LeRobot平台构建，通过记录双手机器人执行单一任务的过程，采集了206个完整交互片段，总计超过14.5万帧数据。数据以分块形式存储于Parquet文件中，每块包含1000帧，同时配有高帧率视频记录，确保了时序动作与视觉观测的同步对齐。

特点

该数据集在机器人学习领域展现出显著的多模态特性，不仅包含12维的双臂关节位置作为动作与状态观测，还整合了来自四个不同视角的彩色视频流，每路视频分辨率达640x480，帧率为30fps。数据结构层次分明，通过索引字段可精确追溯每帧数据所属的片段、任务及时间戳，为模仿学习与强化学习算法提供了丰富的时空上下文信息。

使用方法

研究者可利用该数据集进行机器人策略学习与行为分析。数据按训练集划分，可直接加载Parquet格式文件以获取动作、状态及图像序列；视频文件则独立存储，支持对照分析。使用时应依据帧索引与片段索引重构任务轨迹，结合多视角视觉输入与关节状态，训练端到端的控制模型或进行行为克隆验证。

背景与挑战

背景概述

在机器人学习领域，模仿学习与强化学习的研究亟需高质量、大规模的真实世界交互数据作为支撑。sort_sharp数据集应运而生，其由HuggingFace的LeRobot项目团队创建，旨在为双臂机器人（bi_so_follower）的灵巧操作任务提供丰富的多模态演示数据。该数据集收录了206个完整交互片段，涵盖超过14万帧的同步视频与状态动作记录，核心研究问题聚焦于如何利用视觉与本体感知信息，训练机器人执行复杂的双手协调任务，从而推动具身智能在真实环境中的泛化能力与适应性发展。

当前挑战

sort_sharp数据集致力于解决机器人灵巧操作中的多模态感知与决策挑战，其核心在于如何从高维视觉输入与连续动作空间中学习有效的策略。构建过程中，数据采集面临严峻考验，包括多摄像头视频流的高效同步与压缩存储、双臂机器人关节状态的高精度实时记录，以及大规模数据（视频文件达50GB）的规范化整理与高效读取。此外，确保演示数据在任务维度上的多样性与一致性，避免偏差并支持稳健的模仿学习，亦是数据集构建中的关键难题。

常用场景

经典使用场景

在机器人操作领域，sort_sharp数据集以其丰富的多视角视觉观测与双手机械臂关节动作记录，为模仿学习算法的训练与验证提供了经典场景。该数据集通过捕捉真实世界中的物体分拣任务，使研究者能够构建端到端的策略模型，学习从视觉输入到机械臂动作的映射关系，进而推动机器人自主操作能力的发展。

解决学术问题

该数据集有效应对了机器人学中模仿学习的数据稀缺与泛化难题，通过提供大规模、高质量的真实操作轨迹，支持了从视觉到动作的监督学习研究。它助力于解决高维观察空间下的策略优化、跨场景任务迁移以及多模态感知融合等核心学术问题，为具身智能的算法评估奠定了实证基础。

衍生相关工作

围绕sort_sharp数据集，已衍生出一系列专注于视觉运动策略学习的经典工作。这些研究通常利用其多视角视频与动作序列，开发基于深度神经网络的行为克隆、逆强化学习或视觉预测模型，并在机器人操作基准测试中验证算法性能，进一步促进了开源机器人学习生态的繁荣与算法比较的标准化。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集