dcs_mujoco_with_masks

Hugging Face2026-04-15 更新2026-04-16 收录

下载链接：

https://huggingface.co/datasets/hamza-adnan/dcs_mujoco_with_masks

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集包含多个配置，涉及猎豹奔跑（cheetah_run）、蝗虫跳跃（hopper_hop）、人形行走（humanoid_walk）和步行者奔跑（walker_run）等动作，以及它们的低干扰变体（distractor_low）。每个配置的数据结构一致，包含以下字段：观察（图像）、状态（float64列表）、掩码（图像）、动作（float64列表）、奖励（float64）、终止标志（布尔值）、截断标志（布尔值）和预测掩码（图像）。数据集分为训练集和测试集（部分配置仅有测试集），并提供了每个分片的字节数和示例数。此外，还包含了下载大小和数据集大小的信息。

创建时间：

2026-04-12

原始信息汇总

数据集概述

数据集基本信息

数据集名称: dcs_mujoco_with_masks
来源地址: https://huggingface.co/datasets/hamza-adnan/dcs_mujoco_with_masks
数据集配置数量: 7个

数据集配置详情

配置1: cheetah_run

特征:
- observation (图像)
- state (浮点数列表)
- mask (图像)
- action (浮点数列表)
- reward (浮点数)
- terminated (布尔值)
- truncated (布尔值)
- pred_mask (图像)
数据划分:
- 测试集: 1,000,000个样本，占用空间6,231,998,249字节
- 训练集: 9,000,000个样本，占用空间56,091,257,848字节
数据文件:
- 测试集路径: cheetah_run/test-*
- 训练集路径: cheetah_run/train-*
下载大小: 62,291,976,721字节
数据集总大小: 62,323,256,097字节

配置2: cheetah_run_distractor_low

特征:
- observation (图像)
- state (浮点数列表)
- mask (图像)
- action (浮点数列表)
- reward (浮点数)
- terminated (布尔值)
- truncated (布尔值)
- pred_mask (图像)
数据划分:
- 测试集: 1,000,000个样本，占用空间8,333,694,168字节
数据文件:
- 测试集路径: cheetah_run_distractor_low/test-*
下载大小: 8,330,826,425字节
数据集总大小: 8,333,694,168字节

配置3: hopper_hop

特征:
- observation (图像)
- state (浮点数列表)
- mask (图像)
- action (浮点数列表)
- reward (浮点数)
- terminated (布尔值)
- truncated (布尔值)
- pred_mask (图像)
数据划分:
- 测试集: 1,000,000个样本，占用空间5,989,579,726字节
- 训练集: 9,000,000个样本，占用空间53,912,272,735字节
数据文件:
- 测试集路径: hopper_hop/test-*
- 训练集路径: hopper_hop/train-*
下载大小: 59,815,951,423字节
数据集总大小: 59,901,852,461字节

配置4: hopper_hop_distractor_low

特征:
- observation (图像)
- state (浮点数列表)
- mask (图像)
- action (浮点数列表)
- reward (浮点数)
- terminated (布尔值)
- truncated (布尔值)
- pred_mask (图像)
数据划分:
- 测试集: 1,000,000个样本，占用空间8,118,308,015字节
数据文件:
- 测试集路径: hopper_hop_distractor_low/test-*
下载大小: 8,109,993,478字节
数据集总大小: 8,118,308,015字节

配置5: humanoid_walk

特征:
- observation (图像)
- state (浮点数列表)
- mask (图像)
- action (浮点数列表)
- reward (浮点数)
- terminated (布尔值)
- truncated (布尔值)
- pred_mask (图像)
数据划分:
- 测试集: 1,000,000个样本，占用空间5,645,775,118字节
数据文件:
- 测试集路径: humanoid_walk/test-*
下载大小: 5,646,783,744字节
数据集总大小: 5,645,775,118字节

配置6: humanoid_walk_distractor_low

特征:
- observation (图像)
- state (浮点数列表)
- mask (图像)
- action (浮点数列表)
- reward (浮点数)
- terminated (布尔值)
- truncated (布尔值)
- pred_mask (图像)
数据划分:
- 测试集: 1,000,000个样本，占用空间7,870,301,088字节
数据文件:
- 测试集路径: humanoid_walk_distractor_low/test-*
下载大小: 7,871,228,431字节
数据集总大小: 7,870,301,088字节

配置7: walker_run

特征:
- observation (图像)
- state (浮点数列表)
- mask (图像)
- action (浮点数列表)
- reward (浮点数)
- terminated (布尔值)
- truncated (布尔值)
- pred_mask (图像)
数据划分:
- 测试集: 1,000,000个样本，占用空间6,092,981,018字节
数据文件:
- 测试集路径: walker_run/test-*
下载大小: 6,090,015,082字节
数据集总大小: 6,092,981,018字节

数据集特征总结

所有配置均包含以下8个特征：

observation: 图像类型
state: 浮点数列表类型
mask: 图像类型
action: 浮点数列表类型
reward: 浮点数类型
terminated: 布尔类型
truncated: 布尔类型
pred_mask: 图像类型

数据划分说明

包含训练集和测试集的配置: cheetah_run, hopper_hop
仅包含测试集的配置: cheetah_run_distractor_low, hopper_hop_distractor_low, humanoid_walk, humanoid_walk_distractor_low, walker_run
每个测试集样本数量: 均为1,000,000个样本
训练集样本数量: 在提供的配置中，仅cheetah_run和hopper_hop包含训练集，均为9,000,000个样本

搜集汇总

数据集介绍

构建方式

在强化学习与机器人控制领域，仿真环境的交互数据对于模型训练至关重要。dcs_mujoco_with_masks数据集基于MuJoCo物理引擎构建，通过模拟多个经典控制任务（如猎豹奔跑、机器人跳跃等）生成轨迹数据。每个任务配置包含训练集与测试集，数据通过智能体与环境交互采集，记录观测图像、状态向量、动作、奖励及终止标志，并特别引入了掩码图像以标识关键视觉区域，为视觉强化学习提供结构化支持。

使用方法

研究人员可利用该数据集进行离线强化学习、视觉表征学习及掩码预测等任务。通过HuggingFace平台加载对应任务配置（如cheetah_run），可访问训练与测试分割。数据以标准特征格式组织，支持直接输入深度学习框架。典型应用包括训练视觉策略网络、评估模型在干扰环境下的鲁棒性，或利用掩码信息提升决策效率，推动机器人控制算法的实证研究。

背景与挑战

背景概述

在强化学习与机器人控制领域，视觉观测数据的引入为智能体理解复杂环境提供了丰富信息，但如何从高维图像中提取有效状态表征仍是一个核心难题。dcs_mujoco_with_masks数据集应运而生，它基于MuJoCo物理仿真引擎构建，专注于连续控制任务，如猎豹奔跑、机器人行走等。该数据集由研究团队精心设计，旨在推动视觉强化学习与状态表征学习的发展，通过提供带有掩码标注的观测图像、状态向量及动作序列，为模型学习可解释且鲁棒的视觉表征奠定基础。其影响力体现在促进从像素到动作的端到端策略学习，以及提升智能体在视觉干扰环境下的泛化能力。

当前挑战

该数据集致力于解决视觉强化学习中状态表征学习的挑战，即如何从原始像素观测中分离出与任务相关的关键特征，并忽略无关视觉干扰。具体而言，数据集中包含的掩码标注旨在引导模型关注场景中的动态物体，但掩码的精确生成依赖于仿真环境中的物体分割，这在实际应用中可能难以复现。在构建过程中，挑战主要源于大规模高质量数据的生成与标注，例如需要高效运行大量仿真以收集百万级样本，并确保掩码与观测图像的对齐一致性。此外，处理高维图像数据带来的存储与计算开销，以及设计具有不同干扰水平的变体以评估模型鲁棒性，均增加了数据集的构建复杂度。

常用场景

经典使用场景

在强化学习与机器人控制领域，视觉观测与状态信息的有效整合是提升智能体决策能力的关键。dcs_mujoco_with_masks数据集通过提供包含图像观测、状态向量及掩码标签的多模态数据，为基于模型的强化学习算法提供了理想的训练与评估平台。该数据集尤其适用于研究如何在复杂环境中从高维视觉输入中提取关键状态特征，以优化策略学习过程。经典应用场景包括训练深度强化学习模型，如视觉预测模型或掩码引导的表示学习方法，以实现在模拟机器人任务中的高效控制。

解决学术问题

该数据集有效应对了强化学习中从原始像素到控制策略的端到端学习难题，特别是解决了视觉观测中无关信息干扰导致的表示学习效率低下问题。通过提供精确的掩码标注，它支持研究如何分离环境中的动态主体与静态背景，从而提升状态表示的鲁棒性与可解释性。其意义在于推动了视觉强化学习领域的发展，为处理高维观测空间、减少样本复杂度以及增强模型泛化能力提供了重要数据基础，促进了仿真到现实迁移研究的深入。

实际应用

在实际应用层面，dcs_mujoco_with_masks数据集为机器人仿真控制系统的开发提供了有力支撑。基于该数据集训练的模型能够应用于虚拟环境中的机器人运动规划，如猎豹奔跑、人形行走等复杂动作的生成与优化。这些技术可进一步迁移至实体机器人控制，提升其在动态环境中的自适应能力。此外，数据集中的掩码信息有助于开发更高效的视觉感知模块，为自动驾驶、智能监控等需要精准目标分割的领域提供参考方案。

数据集最近研究