causality-two-room-modal

Hugging Face2026-04-13 更新2026-04-14 收录

下载链接：

https://huggingface.co/datasets/robomotic/causality-two-room-modal

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集名为'robomotic/causality-two-room-modal'，专为因果世界模型实验设计，包含在`swm/GlitchedHueTwoRoom-v1`环境中收集的轨迹数据。数据集以HDF5格式存储，包含观测数据、动作、奖励、片段索引、变异值以及像素渲染帧。数据生成过程通过特定脚本完成，共包含10000个片段，总计609139帧，像素形状为(609139, 224, 224, 3)，文件大小为9.05 GB。数据集中第二个背景色调为绿色（非红色），以确保与红色代理在像素观测中的强烈对比。该数据集适用于强化学习和机器人技术相关任务。

创建时间：

2026-04-12

原始信息汇总

数据集概述：robomotic/causality-two-room-modal

数据集基本信息

名称：Causality Two Room (Glitched Hue)
托管平台：Hugging Face
唯一标识：robomotic/causality-two-room-modal
许可证：MIT
任务类别：强化学习、机器人学
语言：英语
数据规模：10K < n < 100K
文件大小：9.05 GB

数据集内容与结构

核心数据文件：glitched_hue_tworoom.h5（HDF5格式）
包含数据：
- 轨迹数据
- 渲染帧
- 观测值
- 动作
- 奖励
- 回合索引
- 变体值
- 像素渲染

数据生成信息

生成环境：swm/GlitchedHueTwoRoom-v1
用途：用于因果世界模型实验
生成脚本：scripts/data/collect_glitched_hue.py
配置文件：scripts/data/config/glitched_hue.yaml
生成命令：python scripts/data/collect_glitched_hue.py num_traj=10000 seed=3072 world.num_envs=10
生成详情：
- 总回合数：10000
- 总帧数：609139
- 像素图像形状：(609139, 224, 224, 3)
- 传送事件数：1568
上传时间（UTC）：2026-04-13 14:20:51

重要说明

第二个背景色调为绿色（而非红色），旨在与像素观测中的红色智能体保持强烈对比。

搜集汇总

数据集介绍

构建方式

在强化学习与机器人学交叉领域，causality-two-room-modal数据集通过精心设计的脚本与配置流程生成。该数据集利用`swm/GlitchedHueTwoRoom-v1`仿真环境，执行了大规模轨迹采集任务。生成过程基于`collect_glitched_hue.py`脚本与`glitched_hue.yaml`配置文件，通过并行化环境设置高效采集了10000条完整轨迹，共计609139帧图像数据。采集过程中记录了智能体的观测状态、动作指令、奖励信号及事件索引，并以HDF5格式整合存储，确保了数据结构的完整性与可扩展性。

特点

该数据集的核心特征在于其针对因果世界模型研究而设计的模态多样性。数据集中不仅包含智能体的低维状态观测与动作序列，还提供了高维像素渲染图像，每帧图像分辨率达到224x224且具备RGB三通道，为视觉表征学习提供了丰富素材。特别值得注意的是，环境背景色调经过特殊设计，采用绿色作为第二色调以增强与红色智能体的视觉对比度，从而优化了像素观测的辨识度。此外，数据集中明确标注了1568次传送事件，为研究环境中的因果干预与动态变化提供了关键标注信息。

使用方法

研究人员可借助该数据集开展因果推理与世界模型的前沿探索。数据集以HDF5格式封装，可直接通过标准数据加载工具读取，其结构清晰地划分为观测、动作、奖励及渲染图像等多个模态。在使用过程中，用户可依据episode索引重构完整轨迹序列，并结合变异参数分析不同环境条件下的智能体行为。该数据集尤其适用于训练能够预测环境动态的生成模型，或用于评估模型在存在突发事件（如传送）时的因果推理能力。相关代码示例与完整文档可在关联的GitHub仓库中获取，便于快速集成至现有研究流程。

背景与挑战

背景概述

在强化学习与机器人学领域，构建能够理解环境因果关系的世界模型是推动智能体实现高效决策与泛化能力的关键。causality-two-room-modal数据集由robomotic团队于2026年创建，旨在通过`swm/GlitchedHueTwoRoom-v1`仿真环境收集轨迹数据，以支持因果世界模型的实验研究。该数据集包含大量观测、动作、奖励及像素渲染序列，其核心研究问题聚焦于探索智能体在动态变化环境中如何识别并利用因果结构，从而提升模型对复杂交互的推理能力。这一工作为推进可解释强化学习与自主机器人系统的发展提供了重要的数据基础。

当前挑战

该数据集致力于解决因果世界建模中的核心挑战，即如何从高维视觉输入中分离并表征环境中的因果机制，使智能体能够应对未见过的状态变化。具体而言，数据构建过程面临多重困难：在仿真环境中精确控制色调突变以引入因果干扰，同时保持像素观测中智能体与背景的显著对比度；处理大规模轨迹数据时需平衡存储效率与信息完整性，确保包含关键事件如传送状态的标注；此外，生成过程的计算开销与数据一致性要求也对采集脚本与配置设计提出了较高标准。

常用场景

经典使用场景

在强化学习与机器人学领域，因果世界模型的研究旨在理解智能体与环境交互中的因果关系。causality-two-room-modal数据集通过包含轨迹数据、动作序列及像素渲染帧，为构建和验证因果世界模型提供了关键实验平台。其经典使用场景涉及训练智能体在具有颜色突变（如背景色调异常）的模拟环境中进行导航与决策，以探究智能体如何从高维视觉输入中推断潜在因果结构，进而提升模型在复杂动态环境中的泛化能力。

实际应用

在实际应用中，causality-two-room-modal数据集可服务于自主机器人导航、工业自动化及模拟训练系统的开发。其包含的像素级环境渲染与动作轨迹能够用于训练视觉驱动的控制策略，帮助机器人在动态或视觉干扰条件下保持稳定操作。此外，该数据集支持构建安全测试环境，评估智能体在异常场景中的鲁棒性，为自动驾驶、仓储机器人等领域的算法优化提供验证基础。

衍生相关工作

围绕该数据集衍生的经典工作主要集中在因果表示学习与模型基强化学习方向。例如，基于其轨迹数据的研究探索了如何利用变分推理分离环境中的因果因子，或开发分层世界模型以处理视觉突变。相关成果已应用于改进离线强化学习算法、增强模型对分布外泛化的能力，并促进了开源项目如stable-worldmodel的发展，为后续因果机器学习社区的实验与创新提供了重要参考。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集