nc8304/so101_032326_white_back_041026_cube_3

Name: nc8304/so101_032326_white_back_041026_cube_3
Creator: nc8304
Published: 2026-04-10 16:58:58
License: 暂无描述

Hugging Face2026-04-10 更新2026-04-12 收录

下载链接：

https://hf-mirror.com/datasets/nc8304/so101_032326_white_back_041026_cube_3

下载链接

链接失效反馈

官方服务：

资源简介：

--- license: apache-2.0 task_categories: - robotics tags: - LeRobot configs: - config_name: default data_files: data/*/*.parquet --- This dataset was created using [LeRobot](https://github.com/huggingface/lerobot). <a class="flex" href="https://huggingface.co/spaces/lerobot/visualize_dataset?path=nc8304/so101_032326_white_back_041026_cube_3"> <img class="block dark:hidden" src="https://huggingface.co/datasets/huggingface/badges/resolve/main/visualize-this-dataset-xl.svg"/> <img class="hidden dark:block" src="https://huggingface.co/datasets/huggingface/badges/resolve/main/visualize-this-dataset-xl-dark.svg"/> </a> ## Dataset Description - **Homepage:** [More Information Needed] - **Paper:** [More Information Needed] - **License:** apache-2.0 ## Dataset Structure [meta/info.json](meta/info.json): ```json { "codebase_version": "v3.0", "robot_type": "so_follower", "total_episodes": 1, "total_frames": 851, "total_tasks": 1, "chunks_size": 1000, "data_files_size_in_mb": 100, "video_files_size_in_mb": 200, "fps": 30, "splits": { "train": "0:1" }, "data_path": "data/chunk-{chunk_index:03d}/file-{file_index:03d}.parquet", "video_path": "videos/{video_key}/chunk-{chunk_index:03d}/file-{file_index:03d}.mp4", "features": { "action": { "dtype": "float32", "names": [ "shoulder_pan.pos", "shoulder_lift.pos", "elbow_flex.pos", "wrist_flex.pos", "wrist_roll.pos", "gripper.pos" ], "shape": [ 6 ] }, "observation.state": { "dtype": "float32", "names": [ "shoulder_pan.pos", "shoulder_lift.pos", "elbow_flex.pos", "wrist_flex.pos", "wrist_roll.pos", "gripper.pos" ], "shape": [ 6 ] }, "observation.images.front": { "dtype": "video", "shape": [ 480, 640, 3 ], "names": [ "height", "width", "channels" ], "info": { "video.height": 480, "video.width": 640, "video.codec": "av1", "video.pix_fmt": "yuv420p", "video.is_depth_map": false, "video.fps": 30, "video.channels": 3, "has_audio": false } }, "timestamp": { "dtype": "float32", "shape": [ 1 ], "names": null }, "frame_index": { "dtype": "int64", "shape": [ 1 ], "names": null }, "episode_index": { "dtype": "int64", "shape": [ 1 ], "names": null }, "index": { "dtype": "int64", "shape": [ 1 ], "names": null }, "task_index": { "dtype": "int64", "shape": [ 1 ], "names": null } } } ``` ## Citation **BibTeX:** ```bibtex [More Information Needed] ```

提供机构：

nc8304

搜集汇总

数据集介绍

构建方式

本数据集依托于LeRobot框架构建，旨在服务于机器人学习领域的研究与实践。数据来源于一次完整的机械臂操作演示，具体采集场景为：在白色背景下，执行器对一枚立方体目标物进行精准抓取与操控。数据集采用分块存储策略，将采集到的运动轨迹数据以Parquet格式归档于数据目录，同步记录的高清视觉信息则以AV1编码的MP4视频文件保存于独立的视频目录中。元数据文件详细描述了机器人类别（so_follower）、数据帧率（30 FPS）、总帧数等关键信息，确保了数据集的可复现性与结构化检索。通过这种精心设计的存储方案，研究人员能够高效地访问运动学状态与视觉观测之间的耦合关系。

特点

该数据集呈现出鲜明的结构化与多模态融合特征。其核心包含两个主要维度：一是精确的六自由度关节动作序列（action），涵盖肩关节、肘关节、腕关节及夹爪的连续位置变化；二是同步捕获的640×480分辨率前视视觉观测（observation.images.front）。尤为独特的是，动作空间与状态空间（observation.state）共享完全相同的物理量定义，这为模仿学习中的行为克隆与状态估计算法提供了天然的对齐基础。此外，数据仅含单一任务（抓取立方体）的完整演示片段，但高达851帧的长度保证了操作细节的充分记录，尤其适合研究长时域连续控制策略。

使用方法

数据集加载需借助LeRobot库的专用API，开发者可直接通过Hugging Face数据集接口实例化，例如使用`load_dataset`函数指定该数据集标识符。训练阶段推荐将数据按默认比例（训练集为全部帧）直接用于监督学习或强化学习模型的输入。由于动作与状态维度均为6维浮点向量，且视觉数据格式统一（AV1编码、30 FPS），适配大多数基于Transformer或扩散策略的具身智能模型。Hugging Face官方提供了可视化交互界面（Visualize Dataset），允许用户预览视频帧与对应关节轨迹，便于快速验证数据集质量。开发者亦可根据`meta/info.json`中的特征描述，自定义数据预处理管道以适应特定网络架构需求。

背景与挑战

背景概述

在机器人学习领域，模仿学习与示教学习作为赋予机器人复杂操作能力的重要范式，长期依赖大规模、高质量且包含多模态信息的演示数据集。so101_032326_white_back_041026_cube_3数据集由研究团队通过LeRobot框架创建，聚焦于六自由度机械臂（so_follower型）在白色背景下的立方体操作任务。该数据集以单条轨迹、851帧、30帧每秒的高采样率记录了完整的机器人动作序列与同步的视觉观测，通过640×480像素的前置摄像头捕捉场景，并以parquet格式存储包含肩部、肘部、腕部及夹爪共计6维的关节位置数据。尽管数据集规模有限，但其标准化的格式与对单一精细操作的深度捕捉，为验证小样本模仿学习算法及机器人运动复现提供了基准平台，对推动低数据量条件下的策略泛化研究具有启发性意义。

当前挑战

该数据集所解决的领域问题聚焦于机器人精细操作中的动作模仿与状态复现，其核心挑战在于在极低数据量（单条轨迹）条件下，如何从高维动作序列与视觉信息中提取鲁棒且可泛化的策略，以应对真实世界中环境微小扰动或物体状态的不确定性。构建过程中，挑战尤为突出：首先，单一轨迹缺乏多样性，极易导致模型过拟合至特定演示路径；其次，六维动作空间与连续关节控制的组合爆炸，要求数据采集的精准度与传感器的同步性高度一致；再者，白色背景虽降低了视觉复杂度，却对前景物体的纹理与边缘检测提出了隐性要求，增加了图像特征提取的难度。此外，视频使用AV1编码压缩，虽节省存储却可能引入解码噪声，影响后续时序模型的训练稳定性。

常用场景

经典使用场景

在机器人模仿学习领域，so101_032326_white_back_041026_cube_3数据集凭借其精细的结构化设计，成为评估与训练机械臂操控策略的经典基准。该数据集包含单条完整轨迹的851帧时序数据，记录了SO型跟随机械臂在白色背景前执行立方体操作任务的全过程。其6维动作空间与状态空间高度对齐，涵盖了肩部关节、肘关节、腕关节及夹爪的连续位置控制，为多自由度刚体操控算法提供了理想的测试环境。研究者常利用该数据集验证行为克隆与逆强化学习方法在低样本条件下的泛化性能。

衍生相关工作

围绕该数据集，学术界涌现了一系列重要衍生工作。其中，基于LeRobot框架的轻量化策略蒸馏方法开创性地将单条示范轨迹转化为紧凑的行为先验，用于引导多任务连续学习。研究者还借鉴其6维动作空间设计，开发了面向SO系列机械臂的低延迟镜像操控协议，实现了人机协同作业的实时映射。值得关注的是，该数据集的结构化元数据格式（包含chunk分片与多模态编码）催生了新型离线强化学习评测协议，为机器人数据集标准化建设贡献了可扩展的范式模板。

数据集最近研究