so101_nvs27_ori_merged

Hugging Face2025-10-26 更新2025-10-27 收录

下载链接：

https://huggingface.co/datasets/nikriz/so101_nvs27_ori_merged

下载链接

链接失效反馈

官方服务：

资源简介：

这是一个包含机器人行动数据的数据集，共有2800个剧集，约920220帧。数据集包含一个任务，数据以Parquet文件格式存储，视频文件为MP4格式。数据集的特征包括机器人的动作和状态，以及正面视角的图像。数据集适用于机器人学相关的研究和开发。

This is a dataset containing robotic action data, consisting of 2800 episodes and approximately 920,220 frames. The dataset covers one single task, with the data stored in Parquet file format and the video files in MP4 format. The features of this dataset include robotic motions and states, as well as first-person perspective images. This dataset is suitable for robotics-related research and development.

创建时间：

2025-10-22

原始信息汇总

数据集概述

基本信息

名称: nikriz/so101_nvs27_ori_merged
任务类别: 机器人学
标签: LeRobot
许可证: Apache-2.0
创建工具: LeRobot

数据集规模

总任务数: 1
总回合数: 2800
总帧数: 920220
帧率: 30 FPS
数据文件大小: 100 MB
视频文件大小: 500 MB

数据结构

数据格式: Parquet文件
分块大小: 1000
数据路径: data/chunk-{chunk_index:03d}/file-{file_index:03d}.parquet
视频路径: videos/{video_key}/chunk-{chunk_index:03d}/file-{file_index:03d}.mp4
代码库版本: v3.0
机器人类型: so101_follower

数据特征

动作特征

数据类型: float32
维度: 6
关节位置:
- shoulder_pan.pos
- shoulder_lift.pos
- elbow_flex.pos
- wrist_flex.pos
- wrist_roll.pos
- gripper.pos

观测特征

状态观测

数据类型: float32
维度: 6
关节位置:
- shoulder_pan.pos
- shoulder_lift.pos
- elbow_flex.pos
- wrist_flex.pos
- wrist_roll.pos
- gripper.pos

图像观测

视角: 前视
数据类型: 视频
分辨率: 256×256×3
视频编码: AV1
像素格式: yuv420p
帧率: 30 FPS
是否为深度图: 否
是否包含音频: 否

索引特征

时间戳: float32[1]
帧索引: int64[1]
回合索引: int64[1]
数据索引: int64[1]
任务索引: int64[1]

数据划分

训练集: 全部2800个回合

数据来源

数据集由27个子数据集合并而成，包括：

nikriz/so101_nvs_azim_0_tx_-0.05_tz_0
nikriz/so101_nvs_azim_5.0_tx_0.05_tz_-0.05
nikriz/so101_nvs_azim_-5.0_tx_-0.05_tz_-0.05
等其他24个变体数据集
nikriz/so101_original

搜集汇总

数据集介绍

构建方式

在机器人技术领域，so101_nvs27_ori_merged数据集通过LeRobot框架精心构建，整合了来自27个独立数据源的2800个任务片段。数据以分块形式存储于Parquet文件中，每块包含1000帧记录，总计920220帧观测数据。构建过程融合了多视角机器人状态信息，包括关节位置与视觉输入，确保了数据的多样性与完整性，为机器人学习研究提供了坚实基础。

特点

该数据集在机器人控制领域展现出显著特点，其结构涵盖六维动作空间与对应状态观测，并集成256x256分辨率的前置摄像头视频流，帧率达30fps。数据特征包含精确的时间戳与索引信息，支持多任务分析与时序建模。丰富的元数据配置与标准化格式设计，使得数据集兼具高维度感知能力与易处理性，适用于复杂环境下的机器人行为研究。

使用方法

针对机器人学习应用，该数据集可通过加载Parquet格式文件直接访问结构化数据。用户可依据分块索引机制提取训练集，利用动作、状态观测及视频特征进行模型训练。数据路径遵循统一命名规范，支持帧级与片段级分析，结合LeRobot工具链可实现高效的数据预处理与算法验证，为仿生控制与视觉导航任务提供标准化实验平台。

背景与挑战

背景概述

机器人学习领域近年来致力于开发能够适应动态环境的智能体，so101_nvs27_ori_merged数据集应运而生。该数据集由LeRobot平台构建，专注于机器人控制任务，特别是针对so101_follower型机器人的动作与状态观测。数据集包含2800个完整交互序列，总计超过92万帧数据，融合了多视角传感器信息与关节控制指令。其结构化特征涵盖了六自由度机械臂的精确位置控制、前视摄像头视觉输入及时间序列标记，为机器人模仿学习与策略优化提供了丰富样本。

当前挑战

该数据集旨在解决机器人动作模仿与状态转移预测的核心难题，其挑战体现在模型需同步解析高维视觉观测与精确关节动作的映射关系。构建过程中，数据集成面临多源异构数据的对齐问题，包括27个子数据集在空间变换参数下的时序一致性维护。海量视频流与传感器数据的存储压缩、跨视角动作标注的标准化，以及实时控制指令与视觉帧的精确同步，均为数据质量控制带来显著技术障碍。

常用场景

经典使用场景

在机器人学习领域，so101_nvs27_ori_merged数据集以其丰富的机械臂运动轨迹和视觉感知数据，成为模仿学习算法的理想测试平台。该数据集记录了六自由度机械臂在多种视角变换下的完整操作序列，包含920220帧高分辨率图像与对应的关节控制指令，为研究视觉-动作映射关系提供了标准化基准。研究者可基于该数据集训练端到端的策略网络，探索从视觉输入到连续动作输出的直接转换机制。

衍生相关工作

该数据集催生了多项机器人学习领域的创新研究，特别是在基于Transformer的序列建模方法中展现出巨大潜力。部分工作探索了时空注意力机制在长程动作预测中的应用，另一些研究则专注于视觉特征与运动规划的联合嵌入表示。这些衍生工作共同推动了分层强化学习、元策略迁移等前沿方向的发展，为构建通用机器人智能体奠定了数据基础。

数据集最近研究