language_table_train_109000_110000_augmented

Hugging Face2025-11-14 更新2025-11-15 收录

下载链接：

https://huggingface.co/datasets/oxe-aug/language_table_train_109000_110000_augmented

下载链接

链接失效反馈

官方服务：

资源简介：

language_table_train_109000_110000_augmented是一个基于OXE数据集的增强版机器人数据集，包含google_robot, images, jaco等多种机器人的数据，总共1000个剧集，16048帧，用于扩展机器人跨身体策略学习的数据集规模。

language_table_train_109000_110000_augmented is an enhanced robotic dataset based on the OXE dataset. It contains data from multiple robotic platforms and modalities including google_robot, images, jaco, etc., with a total of 1000 episodes and 16048 frames. This dataset is designed to expand the dataset scale for robotic cross-embodiment policy learning.

创建时间：

2025-11-09

原始信息汇总

language_table_train_109000_110000_augmented 数据集概述

基本信息

数据集名称: language_table_train_109000_110000_augmented
许可证: CC-BY-4.0
代码库版本: v3.0
任务类别: 机器人技术
标签: 机器人技术、lerobot、oxe-auge、数据集

数据集统计

机器人类型: google_robot、images、jaco、kinova3、kuka_iiwa、panda、sawyer、ur5e
帧率: 10 FPS
总片段数: 1,000
总帧数: 16,048
总视频数: 未提供
数据分割:
- 训练集: 0-1000

数据布局

数据路径: data/chunk-{chunk_index:03d}/file-{file_index:03d}.parquet
视频路径: videos/{video_key}/chunk-{chunk_index:03d}/file-{file_index:03d}.mp4

特征结构

图像特征

observation.images.google_robot: 增强的google_robot机器人图像 (360×640×3)
observation.images.image: 原始数据集中源机器人的图像 (360×640×3)
observation.images.jaco: 增强的jaco机器人图像 (360×640×3)
observation.images.kinova3: 增强的kinova3机器人图像 (360×640×3)
observation.images.kuka_iiwa: 增强的kuka_iiwa机器人图像 (360×640×3)
observation.images.panda: 增强的panda机器人图像 (360×640×3)
observation.images.sawyer: 增强的sawyer机器人图像 (360×640×3)
observation.images.ur5e: 增强的ur5e机器人图像 (360×640×3)

索引特征

episode_index: 当前片段在数据集中的索引 (int64)
frame_index: 当前帧在其片段中的索引 (int64)
index: 整个数据集的全局帧索引 (int64)
task_index: 高级任务的整数ID (int64)
timestamp: 当前帧在片段中的时间戳 (float32)

语言指令

natural_language_instruction: 描述任务的自然语言指令 (int32, 512)

机器人状态特征

observation.ee_pose: 源机器人的末端执行器位置 (float32, 7)
observation.joints: 源机器人的关节角度 (float32, 8)
observation.state: 源机器人RLDS数据集中状态字段的副本 (float32, 2)

各机器人特定特征

每个机器人类型包含以下特征：

base_orientation: 绕z轴逆时针旋转角度 (float32, 1)
base_position: 基础平移位置 (float32, 3)
ee_error: 增强机器人与原始机器人之间的末端执行器差异 (float32, 7)
ee_pose: 机器人的末端执行器位置 (float32, 7)
joints: 机器人的关节位置 (float32, 7或8)

引用政策

使用OXE-AugE数据集时，请同时引用我们的数据集和上游数据集。

搜集汇总

数据集介绍

构建方式

在机器人学习领域，数据增强技术对于提升模型泛化能力至关重要。language_table_train_109000_110000_augmented数据集基于OXE-AugE框架构建，通过对原始交互语言任务数据进行多机器人形态的仿真增强。该数据集采用v3.0代码库版本，将原始机器人轨迹通过坐标变换和姿态映射，生成包括Google Robot、Jaco、Kinova3等八种机器人平台的同步观测数据。数据以10Hz频率采样，包含1000个任务片段共计16048帧，所有增强数据均以Parquet格式分块存储，确保轨迹可达性与视觉合理性。

使用方法

研究人员可通过HuggingFace数据集库直接加载该数据集，默认配置包含完整的训练分割。数据采用分块存储结构，可通过标准Parquet读取接口访问。典型应用场景包括跨机器人策略迁移学习、视觉语言导航模型训练、以及多机器人系统仿真验证。使用时应同时引用原始交互语言论文和OXE-AugE数据集论文，遵循CC-BY-4.0许可协议。数据集配套提供视频序列存储路径，支持机器人操作任务的端到端复现与研究。

背景与挑战

背景概述

在机器人学习领域，跨本体策略泛化已成为推动智能体适应多样化物理环境的核心研究方向。language_table_train_109000_110000_augmented数据集作为OXE-AugE项目的重要组成部分，由Guanhua Ji等研究人员于2025年基于Open X-Embodiment（OXE）框架构建。该数据集通过集成Google Robot、Jaco等八种异构机器人平台的多模态数据，致力于解决自然语言指令到机器人动作的跨本体映射问题，其独特的轨迹增强机制为机器人策略学习提供了前所未有的泛化能力，显著推进了具身智能在复杂场景中的适应性研究。

当前挑战

跨本体机器人学习面临的核心挑战在于如何克服不同机械结构间的动力学差异，实现语言指令到动作的空间对齐。该数据集构建过程中需解决多源机器人轨迹的物理可行性验证问题，包括末端执行器位姿误差补偿、关节运动学约束建模等关键技术难点。同时，数据增强时需维持原始任务语义的一致性，避免因坐标系转换或运动学映射偏差导致指令执行失真，这些挑战共同构成了跨本体策略迁移研究的关键瓶颈。

常用场景

经典使用场景

在机器人学习领域，该数据集通过多机器人视觉与语言指令的协同记录，为跨 embodiment 策略学习提供了标准化实验平台。其核心价值在于整合了八种主流机器人平台的增强图像数据与自然语言指令，使研究者能够系统评估不同机械结构对任务理解的影响。每一帧数据均包含原始机器人与增强后机器人的姿态对比，为模型泛化能力研究奠定了数据基础。

解决学术问题

该数据集有效解决了机器人学习中的跨平台迁移难题，通过精确记录的末端执行器误差与关节角度数据，为表征对齐研究提供了量化依据。其多模态特性显著推进了视觉-语言-动作三元耦合机制的理论探索，使研究者能够深入分析不同机器人形态下的任务语义理解一致性。标准化数据格式进一步消除了因传感器差异导致的学习偏差，为构建通用机器人策略开辟了新路径。

实际应用

在工业自动化场景中，该数据集支撑了机器人快速适配产线改造的实践需求。通过预训练基于该数据集的策略模型，新部署的机械臂可直接理解自然语言指令执行分拣、装配等任务，大幅降低系统重配置成本。物流仓储领域则利用其多机器人协同数据优化包裹分拣流程，实现从单一任务执行到柔性生产系统的技术跨越。

数据集最近研究