rishgang22/LH_toy_sort
收藏Hugging Face2026-04-25 更新2026-04-26 收录
下载链接:
https://hf-mirror.com/datasets/rishgang22/LH_toy_sort
下载链接
链接失效反馈官方服务:
资源简介:
该数据集由LeRobot创建,属于机器人领域。数据集包含14个片段,27552帧,总数据文件大小为100MB,视频文件大小为200MB。数据格式为parquet和mp4。数据集结构包括动作(6个关节位置)、观察状态(6个关节位置)、前视和俯视图像(480x640分辨率,30fps)、时间戳、帧索引、片段索引等特征。数据集许可证为apache-2.0。
This dataset was created using LeRobot and belongs to the robotics domain. It contains 14 episodes, 27552 frames, with a total data file size of 100MB and video file size of 200MB. The data formats are parquet and mp4. The dataset structure includes features such as actions (6 joint positions), observation states (6 joint positions), front and overhead images (480x640 resolution, 30fps), timestamps, frame indices, episode indices, etc. The dataset is licensed under apache-2.0.
提供机构:
rishgang22
搜集汇总
数据集介绍

构建方式
LH_toy_sort数据集基于LeRobot框架构建,专为机器人操作任务设计。该数据集通过真实机器人平台(so_follower类型)采集,共包含14个示范轨迹,总计27552帧数据,涵盖单一任务场景。数据存储采用高效的Parquet格式,分为1000帧大小的多个数据块,并同步录制了分辨率为480×640、帧率为30fps的前方和俯视双视角视频,以AV1编码进行压缩保存。数据集的训练集划分包含了全部14个轨迹,无验证或测试集,确保数据完整性。
使用方法
使用者可通过LeRobot库直接加载该数据集,其默认配置指向`data/*/*.parquet`路径下的全部数据。加载后,数据将按字典结构提供动作、状态与图像帧序列,支持构建模仿学习或强化学习环境。为便于观察,Hugging Face平台提供了可视化界面(Spaces),可直接在浏览器中预览轨迹。鉴于数据集仅含一个任务且规模有限,建议用于算法调试、特征提取测试或作为多数据集融合的组成部分。
背景与挑战
背景概述
在机器人操作领域,模仿学习作为一种从人类示教中获取技能的有效范式,近年来受到广泛关注。LH_toy_sort数据集由研究团队基于LeRobot框架构建,发布于HuggingFace平台,旨在为机器人排序任务提供标准化的多模态训练数据。该数据集围绕一款名为“so_follower”的机器人平台,记录了14个完整操作回合、总计27552帧的高频(30 FPS)示教序列,涵盖6维关节空间的动作与状态信息,以及来自前视和俯视两个视角的640×480分辨率视频流。通过精细化的数据采集与标注,该数据集聚焦于玩具分类这一基本操作技能,为机器人运动规划与视觉伺服控制的研究提供了具有代表性的benchmark,对推动灵巧操作领域中数据驱动的学习范式具有重要意义。
当前挑战
在领域问题层面,LH_toy_sort数据集致力于应对机器人精细操作中动作泛化性与鲁棒性不足的挑战。玩具分类任务要求机械臂在复杂视觉场景下完成精准抓取与放归,其面临的难点包括:非结构化环境中目标物体姿态的多样性、关节空间与图像空间之间的非线性映射、以及从有限示教数据中提取可迁移操作模式的泛化瓶颈。在构建过程中,数据集制作者亦遭遇诸多技术难关:如何在单任务下通过仅14条演示轨迹捕获完整操作变异性,如何保证30帧/秒的高频采样下多模态数据(6自由度关节状态与双视角视频)的时空对齐精度,以及如何在Apache-2.0许可下规范数据格式与元信息结构以促进社区复用。这些挑战不仅考量了采集系统的同步性能,也对示教策略的覆盖度提出了严苛要求。
常用场景
经典使用场景
在机器人操作与模仿学习的交叉领域中,LH_toy_sort数据集为研究物体排序与分类任务提供了高质量的演示数据。该数据集通过LeRobot框架采集,包含14个完整回合的演示,记录了单臂机器人执行玩具排序操作时的动作序列、关节状态与多视角视觉观测。其典型使用场景是作为模仿学习的训练资源,研究者可利用其中连续的动作序列与高帧率视频(30 FPS),使机器人从人类或预设演示中习得精确的抓取、移动与释放策略,进而验证模仿学习算法在精细操作任务中的迁移能力。
解决学术问题
LH_toy_sort数据集的核心贡献在于填补了机器人排序任务中结构化演示数据的缺失,解决了多模态数据对齐与任务泛化性评估的问题。学术研究中,该数据允许研究者探索状态-动作映射的鲁棒性,例如基于视觉观测预测六自由度关节控制指令,并评估不同模仿学习范式(如行为克隆逆强化学习)在有限演示下的样本效率。其标准化的数据格式(包含动作、状态、图像与时间戳)还简化了跨算法对比的预处理流程,推动了从单一演示到多任务泛化的理论突破。
实际应用
在实际应用中,LH_toy_sort数据集可作为工业分拣与仓储物流场景的基准测试平台。例如,机器人工程师可利用其中演示数据训练机械臂完成玩具种类识别与分类放置任务,并将学得的策略迁移至类似商品的自动化分拣流水线。此外,数据集的多视角录像(前置与俯视摄像头)为视觉伺服控制与障碍物规避算法的研发提供了真实环境下的测试用例,助力低成本机器人系统在中小型工厂中实现柔性化生产。
数据集最近研究
最新研究方向
在机器人学习与操控领域,LH_toy_sort数据集专为基于视觉的灵巧操作任务设计,聚焦于物体分拣这一基础但关键的技能。当前前沿研究正借助此数据集,探索如何利用高帧率、多视角的视觉观测(如前向与俯视摄像头)与精确的关节状态序列,在少量示范(仅14个回合)的条件下,通过模仿学习或离线强化学习算法,高效习得可泛化的复杂操作策略。该数据集与LeRobot生态的紧密集成,也推动了低成本、可复现的机器人学习基准的建立,对于加速具身智能体在非结构化环境中的自主决策能力具有重要实践意义。
以上内容由遇见数据集搜集并总结生成



