licenta_dataset2

Hugging Face2026-04-02 更新2026-04-03 收录

下载链接：

https://huggingface.co/datasets/nitucatalin/licenta_dataset2

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集是使用LeRobot框架创建的，专注于机器人技术领域。数据集包含10个完整的情节，总计4508帧，涉及1个任务。数据以parquet格式存储，总数据文件大小为100MB，视频文件大小为200MB。数据集包含多个特征字段，包括动作（6个浮点型参数）、观察状态（6个浮点型参数）、来自前部和顶部摄像头的图像观察（480x640x3的视频数据）、时间戳、帧索引、情节索引等。所有数据的采集频率为30帧每秒。该数据集适用于机器人控制、行为学习等研究任务。数据集采用Apache-2.0许可证。

创建时间：

2026-04-01

原始信息汇总

数据集概述

基本信息

数据集名称: licenta_dataset2
发布者: nitucatalin
许可证: Apache 2.0
任务类别: 机器人学
相关标签: LeRobot

数据集来源

该数据集使用 LeRobot 创建。

数据集结构

数据格式: Parquet 文件
数据文件路径模式: data/chunk-{chunk_index:03d}/file-{file_index:03d}.parquet
视频文件路径模式: videos/{video_key}/chunk-{chunk_index:03d}/file-{file_index:03d}.mp4
数据分块大小: 1000 帧
总数据文件大小: 100 MB
总视频文件大小: 200 MB

数据统计

总情节数: 10
总帧数: 4508
总任务数: 1
帧率: 30 FPS
数据划分: 训练集 (0:10)

数据特征

动作

数据类型: float32
形状: [6]
特征名称: shoulder_pan.pos, shoulder_lift.pos, elbow_flex.pos, wrist_flex.pos, wrist_roll.pos, gripper.pos
帧率: 30 FPS

观测状态

数据类型: float32
形状: [6]
特征名称: shoulder_pan.pos, shoulder_lift.pos, elbow_flex.pos, wrist_flex.pos, wrist_roll.pos, gripper.pos
帧率: 30 FPS

观测图像（前视）

数据类型: 视频
形状: [480, 640, 3] (高度, 宽度, 通道)
视频信息:
- 高度: 480
- 宽度: 640
- 编解码器: av1
- 像素格式: yuv420p
- 是否为深度图: false
- 帧率: 30 FPS
- 通道数: 3
- 包含音频: false

观测图像（顶视）

数据类型: 视频
形状: [480, 640, 3] (高度, 宽度, 通道)
视频信息:
- 高度: 480
- 宽度: 640
- 编解码器: av1
- 像素格式: yuv420p
- 是否为深度图: false
- 帧率: 30 FPS
- 通道数: 3
- 包含音频: false

元数据

时间戳: float32, 形状 [1], 帧率 30 FPS
帧索引: int64, 形状 [1], 帧率 30 FPS
情节索引: int64, 形状 [1], 帧率 30 FPS
索引: int64, 形状 [1], 帧率 30 FPS
任务索引: int64, 形状 [1], 帧率 30 FPS

技术信息

代码库版本: v3.0
机器人类型: omx_follower

缺失信息

主页: 未提供
论文: 未提供
引用 BibTeX: 未提供

搜集汇总

数据集介绍

构建方式

在机器人学习领域，高质量的数据集是推动算法发展的基石。licenta_dataset2依托LeRobot平台构建，通过omx_follower型机器人采集了10个完整任务片段，总计4508帧数据。数据以每秒30帧的速率记录，采用分块存储策略，每块包含1000帧，并以Parquet格式高效组织，确保了数据的结构化和可扩展性。

特点

该数据集展现了多模态融合的鲜明特色，不仅包含六维关节位置的动作与状态向量，还整合了前视与顶视双路RGB视频流，分辨率均为640x480。数据以30帧每秒同步采集，时间戳与帧索引精确对齐，为模仿学习与行为克隆研究提供了时空一致的观测-动作对。其轻量化的存储设计，兼顾了数据规模与访问效率。

使用方法

研究者可利用该数据集进行机器人策略学习与视觉感知模型的训练。数据以标准Parquet文件存储，可通过LeRobot工具链便捷加载。数据集已预分为训练集，涵盖全部10个任务片段，支持直接从视频流或特征向量中提取观测信息，并与对应的机器人动作联合建模，适用于端到端控制或分层强化学习等范式。

背景与挑战

背景概述

在机器人学习领域，模仿学习与强化学习的研究依赖于高质量、多模态的真实世界交互数据。licenta_dataset2 数据集应运而生，它由 LeRobot 开源框架支持构建，专注于收集六自由度机械臂（omx_follower 类型）在物理环境中的操作数据。该数据集包含 10 个完整交互片段，总计 4508 帧，以 30 帧每秒的速率同步记录机械臂关节状态、前视与顶视图像等多维度观测信息。其核心研究问题在于为机器人策略学习提供可复现、结构化的训练资源，旨在推动机器人从感知到动作的端到端学习模型发展，尤其在复杂操作任务的泛化能力方面具有潜在影响力。

当前挑战

该数据集致力于解决机器人操作任务中模仿学习与强化学习的样本效率挑战，即如何从有限真实交互数据中学习鲁棒且泛化的控制策略。具体而言，挑战体现在多模态数据的高效对齐与融合，例如关节状态与视觉观测的时空同步，以及动作空间的连续高维表示学习。在构建过程中，挑战主要源于真实物理环境的不可控性，包括传感器噪声、光照变化以及机械臂执行误差，这些因素导致数据收集的稳定性和一致性难以保证。此外，大规模视频数据的压缩存储与快速读取，以及多视角图像信息的有效编码，亦是数据集构建中需克服的技术难题。

常用场景

经典使用场景

在机器人学领域，licenta_dataset2作为LeRobot框架下的数据集，其经典使用场景聚焦于机械臂控制任务的模仿学习与行为克隆。该数据集通过记录omx_follower机器人在执行任务过程中的关节位置、图像观测及时间戳等多模态数据，为研究者提供了丰富的轨迹样本。这些数据能够直接用于训练端到端的策略模型，使机器人能够从人类演示中学习复杂的操作技能，例如物体抓取或环境导航，从而推动机器人自主决策能力的发展。

实际应用

在实际应用层面，licenta_dataset2可服务于工业自动化与智能服务机器人的开发。基于其记录的机械臂操作轨迹，工程师能够优化生产线上的抓取与装配流程，提升作业精度与效率。同时，数据集中的多视角视频数据可用于训练视觉感知系统，增强机器人在动态环境中的场景理解能力，为仓储物流、家庭助理等场景的机器人部署提供可靠的数据支撑。

衍生相关工作

围绕该数据集，已衍生出多项经典研究工作，主要集中在机器人行为克隆与多模态学习框架的构建。例如，利用LeRobot平台的研究者开发了基于Transformer的轨迹预测模型，实现了从视觉输入到关节控制的直接映射。此外，结合深度强化学习算法，该数据集被用于验证离线策略优化方法在真实机器人任务中的有效性，为后续大规模机器人数据集的构建与标准化提供了重要参考。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集