newii_lift_cc

Hugging Face2025-05-23 更新2025-05-24 收录

下载链接：

https://huggingface.co/datasets/andlyu/newii_lift_cc

下载链接

链接失效反馈

官方服务：

资源简介：

这是一个使用LeRobot工具创建的数据集，包含了一个机器人（so100型）执行任务的视频和相关信息。数据集共有100个剧集，20849帧，400个视频文件，1个任务，1个片段，片段大小为1000。数据集分为训练集，没有提及测试集。数据集中的视频分辨率为480x640，每秒30帧，采用av1编码，没有音频。每个视频文件都包含机器人的行动、状态、以及不同视角的图像信息。

创建时间：

2025-05-23

原始信息汇总

数据集概述

基本信息

名称: newii_lift_cc
许可证: Apache-2.0
任务类别: 机器人学 (robotics)
标签: LeRobot, so100, tutorial

数据集描述

创建工具: LeRobot
主页: 未提供
论文: 未提供

数据集结构

配置名称: default
数据文件: data//.parquet
元数据文件: meta/info.json

元数据详情

代码库版本: v2.1
机器人类型: so100
总集数: 100
总帧数: 20849
总任务数: 1
总视频数: 400
总块数: 1
块大小: 1000
帧率: 30 fps
分割:
- 训练集: 0:100

数据路径

数据路径模板: data/chunk-{episode_chunk:03d}/episode_{episode_index:06d}.parquet
视频路径模板: videos/chunk-{episode_chunk:03d}/{video_key}/episode_{episode_index:06d}.mp4

特征

动作 (action):
- 数据类型: float32
- 形状: [6]
- 名称: main_shoulder_pan, main_shoulder_lift, main_elbow_flex, main_wrist_flex, main_wrist_roll, main_gripper
观测状态 (observation.state):
- 数据类型: float32
- 形状: [6]
- 名称: 同动作特征
观测图像 (observation.images):
- base, base_right, arm, gripper:
  - 数据类型: video
  - 形状: [480, 640, 3]
  - 名称: height, width, channels
  - 视频信息:
    - 帧率: 30.0
    - 分辨率: 480x640
    - 通道数: 3
    - 编码: av1
    - 像素格式: yuv420p
    - 深度图: false
    - 音频: false
其他特征:
- timestamp: float32, [1]
- frame_index: int64, [1]
- episode_index: int64, [1]
- index: int64, [1]
- task_index: int64, [1]

引用

BibTeX: 未提供

搜集汇总

数据集介绍

构建方式

在机器人技术领域，newii_lift_cc数据集通过LeRobot平台精心构建，采用先进的机器人操作数据采集方法。该数据集包含100个完整操作片段，总计20849帧数据，以30fps的高帧率记录，确保动作捕捉的流畅性和精确性。数据以分块形式存储，每个分块包含1000帧，采用parquet格式高效压缩，便于大规模数据处理和分析。

特点

newii_lift_cc数据集以其多维度的数据采集能力脱颖而出，不仅包含6自由度机械臂的精确动作数据，还整合了多视角视觉信息。数据集提供四种不同角度的视频流（基础视角、右侧视角、机械臂视角和夹爪视角），分辨率均为480x640，采用AV1编解码器压缩。动作和状态数据均以float32精度记录，确保机器学习模型训练的准确性。

使用方法

该数据集专为机器人操作算法的训练与验证设计，用户可通过解析parquet文件获取结构化数据。每帧数据包含时间戳、帧索引和任务索引等元信息，便于时序分析和任务划分。视频数据与动作数据严格同步，研究者可构建端到端的模仿学习或强化学习模型。数据集采用Apache 2.0许可，允许广泛的学术和商业用途。

背景与挑战

背景概述

newii_lift_cc数据集是由LeRobot项目团队构建的机器人操作数据集，专注于机械臂控制与视觉感知的协同研究。该数据集基于so100型机器人平台，收录了100个完整操作片段，涵盖20849帧高精度时序数据与400段同步视频，旨在为机器人动作规划与多模态感知提供基准数据。通过记录六自由度机械臂的关节状态、多视角视觉信息及夹持器反馈，该数据集为模仿学习与强化学习算法验证提供了丰富的实验环境。

当前挑战

该数据集面临的核心挑战在于解决复杂操作任务中动作-视觉的时空对齐问题，需确保多传感器数据在毫秒级时间戳下的精确同步。构建过程中需克服高维度连续动作空间的数据采集难题，包括机械臂运动轨迹平滑性保持、多摄像头视角标定一致性，以及动态环境下视频帧与关节状态数据的无损压缩存储。此外，缺乏公开的论文引用与详细构建文档，也增加了数据可复现性验证的难度。

常用场景

经典使用场景

在机器人控制与学习领域，newii_lift_cc数据集以其丰富的多视角视频数据和关节状态记录，成为研究机械臂抓取与搬运任务的经典基准。该数据集通过捕捉机械臂执行任务时的六自由度关节角度变化及同步的多摄像头视觉信息，为模仿学习与强化学习算法提供了高保真的训练环境。研究人员可基于该数据集构建从视觉输入到动作输出的端到端映射模型，探索复杂场景下的机械臂控制策略。

解决学术问题

该数据集有效解决了机器人领域样本效率低下、真实世界数据稀缺的核心问题。通过提供包含20849帧的标准化动作-状态-视觉配对数据，显著降低了机器人策略学习的试错成本。其六轴关节空间动作标注与多模态观测数据的对齐特性，为研究视觉-动作表征一致性、跨模态迁移学习等前沿课题提供了理想实验平台，推动了具身智能在真实物理系统中的落地进程。

衍生相关工作

基于该数据集的特性，已催生出多项机器人学习领域的创新研究。部分工作聚焦于从多视角视频中提取三维操作特征，提升机械臂的物体定位精度；另有研究利用其时序动作序列开发新型模仿学习架构。LeRobot团队进一步扩展了该数据集的边界，构建了包含更多任务类型的基准测试套件，持续推动机器人学习算法的性能边界。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集