language_table_train_100000_105000_augmented

Hugging Face2025-11-14 更新2025-11-15 收录

下载链接：

https://huggingface.co/datasets/oxe-aug/language_table_train_100000_105000_augmented

下载链接

链接失效反馈

官方服务：

资源简介：

language_table_train_100000_105000_augmented是一个机器人增强数据集，包含了google_robot, images, jaco, kinova3等多种机器人类型。数据集提供了增强后的图像、机器人末端执行器的位置和误差、关节角度等信息，适用于机器人学习和研究。

创建时间：

2025-11-09

原始信息汇总

language_table_train_100000_105000_augmented 数据集概述

基本信息

许可证: CC-BY-4.0
代码库版本: v3.0
帧率: 10 FPS
总片段数: 5,000
总帧数: 80,136
数据分割: train (0:5000)

机器人类型

google_robot
images
jaco
kinova3
kuka_iiwa
panda
sawyer
ur5e

数据布局

数据文件路径: data/chunk-{chunk_index:03d}/file-{file_index:03d}.parquet
视频文件路径: videos/{video_key}/chunk-{chunk_index:03d}/file-{file_index:03d}.mp4

特征字段

图像特征

observation.images.google_robot: 增强的google_robot机器人图像 (360×640×3)
observation.images.image: 原始数据集中的源机器人图像 (360×640×3)
observation.images.jaco: 增强的jaco机器人图像 (360×640×3)
observation.images.kinova3: 增强的kinova3机器人图像 (360×640×3)
observation.images.kuka_iiwa: 增强的kuka_iiwa机器人图像 (360×640×3)
observation.images.panda: 增强的panda机器人图像 (360×640×3)
observation.images.sawyer: 增强的sawyer机器人图像 (360×640×3)
observation.images.ur5e: 增强的ur5e机器人图像 (360×640×3)

索引特征

episode_index: 当前片段在数据集中的索引
frame_index: 当前帧在片段中的索引
index: 整个数据集中的全局帧索引
task_index: 高层级任务的整数ID

语言特征

natural_language_instruction: 描述任务的自然语言指令 (512维)

机器人状态特征

observation.ee_pose: 源机器人的末端执行器位置 (7维)
observation.joints: 源机器人的关节角度 (8维)
observation.state: 源机器人RLDS数据集中的状态字段副本 (2维)

各机器人专用特征

每个机器人类型包含以下特征：

base_orientation: 绕Z轴逆时针旋转角度
base_position: 基础平移位置 (3维)
ee_error: 增强机器人与原始机器人之间的末端执行器差异 (7维)
ee_pose: 末端执行器位置 (7维)
joints: 关节位置 (7或8维)

时间特征

timestamp: 当前帧在片段中的时间戳 (秒)

相关资源

网站: https://oxe-auge.github.io/
项目仓库: https://github.com/GuanhuaJi/oxe-auge
论文: https://arxiv.org/abs/2210.06407

搜集汇总

数据集介绍

构建方式

在机器人学习领域，数据增强技术对于提升模型的泛化能力至关重要。language_table_train_100000_105000_augmented数据集基于OXE-AugE框架构建，通过代码库版本v3.0对原始交互语言任务数据进行系统性增强。该数据集整合了来自google_robot、jaco、kinova3等八种机器人平台的5000个任务片段，以10帧每秒的速率采集了80136帧数据。构建过程中，采用轨迹映射和姿态转换方法，为每种机器人生成增强图像和关节状态，同时保留原始机器人的末端执行器位置和自然语言指令，确保数据在跨机器人迁移学习中的一致性与可用性。

特点

该数据集在机器人视觉与语言任务研究中展现出显著的多模态特性。其核心特征包括八种机器人平台的360×640像素增强图像序列，每种机器人都配有完整的关节角度、末端执行器姿态及基座变换参数。数据集还提供了自然语言指令的嵌入向量，维度为512，用于描述具体任务目标。独特的跨机器人误差字段记录了增强机器人与原始机器人末端执行器的位姿差异，支持精确的轨迹对齐分析。数据以Parquet格式分块存储，便于高效访问与处理，为大规模机器人策略学习提供了丰富的多视角观测空间。

使用方法

在机器人策略学习应用中，该数据集可通过标准数据加载流程进行调用。用户需按照data/chunk-{chunk_index:03d}/file-{file_index:03d}.parquet路径模式读取训练分割数据，配套视频文件存储于videos/{video_key}/目录下。研究实践中，可并行提取多机器人平台的图像观测与状态信息，结合自然语言指令构建端到端的学习模型。数据集支持跨机器人模仿学习任务，通过对比原始与增强机器人的末端执行器误差，可评估策略在不同机器人之间的迁移效果。建议遵循OXE-AugE项目的引用规范，在研究中同时引用原始数据集与本增强数据集。

背景与挑战

背景概述

在机器人学习领域，跨本体策略迁移已成为提升模型泛化能力的关键研究方向。language_table_train_100000_105000_augmented数据集作为OXE-AugE项目的重要组成部分，由Guanhua Ji等研究者于2025年构建，其核心目标在于解决不同机械臂平台间的动作策略迁移难题。该数据集基于2022年发布的Interactive Language研究框架，通过多机器人轨迹数据增强技术，将原始语言指令驱动的交互任务扩展至八种主流机器人平台，为跨本体模仿学习提供了大规模标准化数据支撑。

当前挑战

该数据集致力于攻克跨本体策略学习中的领域适应挑战，具体表现为异构机器人间的运动学参数差异导致末端执行器轨迹映射失真。在构建过程中，需克服多源传感器数据时空对齐的复杂性，包括不同机器人基坐标系转换的数值稳定性维护，以及保证增强后轨迹在物理约束下的可达性验证。此外，自然语言指令与多模态观测数据的语义一致性保持，亦构成数据质量控制的重要维度。

常用场景

经典使用场景

在机器人学习领域，language_table_train_100000_105000_augmented数据集为跨本体策略学习提供了关键支持。其核心应用场景在于训练机器人通过自然语言指令执行复杂任务，例如物体抓取与放置。该数据集通过增强技术模拟多种机器人平台的动作轨迹，使得模型能够在不同机械结构间迁移学习，显著提升了策略的泛化能力。

解决学术问题

该数据集有效解决了机器人学习中的跨本体泛化难题。通过提供八种异构机器人的标准化动作轨迹与语言指令对齐数据，研究者能够系统探索策略迁移的底层机制。其增强后的末端执行器误差标注为机器人位姿控制研究提供了量化基准，推动了具身智能领域从单一平台到多平台协同的理论突破。

衍生相关工作

该数据集催生了系列跨模态机器人学习研究。OXE-AugE项目基于此构建了大规模增强学习框架，启发了如RoboNet等跨平台策略迁移工作。在语言引导的机器人操作任务中，衍生出多模态Transformer架构的创新应用，为具身智能领域的预训练模型发展奠定了数据基础。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集