so100_pick_and_place_eleves_si_janvier2026

Hugging Face2026-01-27 更新2026-01-28 收录

下载链接：

https://huggingface.co/datasets/tomduf70/so100_pick_and_place_eleves_si_janvier2026

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集是使用LeRobot创建的，专为机器人学应用设计，特别是针对so100_follower机器人类型。数据集包含31个episodes，总计8674帧，涉及1个任务。数据以parquet文件格式存储，总数据文件大小为100MB，视频文件大小为200MB，帧率为15fps。数据集的结构包括动作数据、观察状态、顶部和侧面图像观察、时间戳、帧索引、episode索引、索引和任务索引等特征。动作和观察状态数据均为float32类型，包含6个关节位置信息。图像观察为视频格式，分辨率为480x640，3通道，使用av1编解码器。数据集适用于机器人控制、行为学习等任务。

创建时间：

2026-01-21

原始信息汇总

数据集概述

基本信息

数据集名称: tomduf70/so100_pick_and_place_eleves_si_janvier2026
创建工具: LeRobot (https://github.com/huggingface/lerobot)
许可证: Apache-2.0
任务类别: 机器人学

数据集规模与结构

总情节数: 34
总帧数: 9682
总任务数: 1
数据文件大小: 100 MB
视频文件大小: 200 MB
帧率: 15 FPS
数据块大小: 1000
数据分割: 训练集 (0:34)

数据文件路径

数据文件: data/chunk-{chunk_index:03d}/file-{file_index:03d}.parquet
视频文件: videos/{video_key}/chunk-{chunk_index:03d}/file-{file_index:03d}.mp4

数据特征

动作空间

名称: action
数据类型: float32
形状: [6]
维度名称:
- shoulder_pan.pos
- shoulder_lift.pos
- elbow_flex.pos
- wrist_flex.pos
- wrist_roll.pos
- gripper.pos

状态观测

名称: observation.state
数据类型: float32
形状: [6]
维度名称:
- shoulder_pan.pos
- shoulder_lift.pos
- elbow_flex.pos
- wrist_flex.pos
- wrist_roll.pos
- gripper.pos

图像观测 - 顶部摄像头

名称: observation.images.top
数据类型: video
形状: [480, 640, 3]
维度名称:
- height
- width
- channels
视频信息:
- 高度: 480
- 宽度: 640
- 编解码器: av1
- 像素格式: yuv420p
- 是否为深度图: false
- 帧率: 15
- 通道数: 3
- 包含音频: false

图像观测 - 侧面摄像头

名称: observation.images.side
数据类型: video
形状: [480, 640, 3]
维度名称:
- height
- width
- channels
视频信息:
- 高度: 480
- 宽度: 640
- 编解码器: av1
- 像素格式: yuv420p
- 是否为深度图: false
- 帧率: 15
- 通道数: 3
- 包含音频: false

元数据特征

时间戳: timestamp (float32, 形状[1])
帧索引: frame_index (int64, 形状[1])
情节索引: episode_index (int64, 形状[1])
索引: index (int64, 形状[1])
任务索引: task_index (int64, 形状[1])

技术信息

代码库版本: v3.0
机器人类型: so100_follower

缺失信息

主页: 未提供
论文: 未提供
引用格式: 未提供

搜集汇总

数据集介绍

构建方式

在机器人操作领域，数据集的构建往往依赖于实际物理系统的交互记录。该数据集通过LeRobot平台，利用so100_follower型机器人执行拾取与放置任务，采集了34个完整操作序列，总计9682帧数据。数据以分块形式存储于Parquet文件中，每块包含1000帧，同时配有从顶部和侧面视角拍摄的视频流，帧率为15fps，视频编码采用AV1格式，确保了数据的高效压缩与存储。

特点

该数据集的特点在于其多模态数据的整合，不仅包含机器人六自由度关节的位置状态与动作指令，还融合了双视角视觉观测信息。每个数据帧均附带精确的时间戳、帧索引及任务索引，支持对操作序列的细粒度分析。数据以结构化特征形式组织，便于机器学习模型直接读取与处理，为机器人模仿学习与策略优化提供了丰富的训练素材。

使用方法

使用该数据集时，研究人员可通过加载Parquet文件访问机器人状态、动作及视觉观测数据。数据集已预设训练集划分，涵盖全部34个操作序列，适合用于机器人控制算法的训练与验证。结合配套视频文件，用户能够直观理解机器人操作场景，进而开发基于视觉的端到端控制模型或进行行为克隆等研究。

背景与挑战

背景概述

在机器人操作领域，模仿学习与强化学习正成为推动自主系统发展的核心范式。so100_pick_and_place_eleves_si_janvier2026数据集由HuggingFace的LeRobot项目于2026年1月创建，专注于SO100型跟随机器人的拾取与放置任务。该数据集旨在为机器人技能学习提供高质量、多模态的演示数据，涵盖关节状态、视觉观察与动作指令，以支持端到端策略的仿真与训练。其构建依托开源机器人社区，体现了数据驱动方法在解决复杂操作问题上的潜力，有望加速现实场景中灵巧操作算法的研发与评估。

当前挑战

该数据集致力于解决机器人拾放操作中的策略泛化与样本效率挑战，其核心在于如何从有限演示中学习鲁棒且可迁移的控制策略。构建过程中面临多重困难：数据采集需协调高维动作空间与多视角视觉流，确保时序对齐与传感器同步；演示的多样性与任务覆盖度受硬件成本与安全约束限制；此外，大规模多模态数据的存储、压缩与高效检索亦对工程实现提出严峻考验，这些因素共同制约了数据集的规模与质量提升。

常用场景

经典使用场景

在机器人操作领域，so100_pick_and_place_eleves_si_janvier2026数据集为模仿学习与强化学习算法提供了宝贵的实验平台。该数据集记录了SO100机械臂执行拾放任务的完整轨迹，包含关节状态、动作指令及多视角视觉观测，使得研究者能够基于真实机器人交互数据训练策略模型。其经典使用场景集中于端到端机器人控制，通过融合视觉与状态信息，模型学习从原始感知到动作输出的映射关系，为自动化操作任务奠定数据基础。

解决学术问题

该数据集有效应对了机器人学中样本效率低下与仿真到现实迁移的挑战。通过提供真实世界的机械臂操作数据，它支持离线强化学习与行为克隆方法的验证，减少了在物理系统上直接探索的风险与成本。其多模态观测结构促进了跨模态表示学习的研究，帮助解决高维感知下的策略泛化问题，对推动数据驱动的机器人控制理论具有显著意义。

衍生相关工作

围绕该数据集，已衍生出多项机器人学习领域的经典研究。例如，结合LeRobot框架的工作探索了高效的数据集管理与分布式训练流程；基于其多视角视频的算法改进了视觉运动策略的鲁棒性。这些研究进一步推动了开源机器人数据生态的发展，为后续大规模操作数据集的构建与标准化提供了重要参考。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集