five

dm_lab

收藏
Hugging Face2025-08-23 更新2025-08-24 收录
下载链接:
https://huggingface.co/datasets/EpicPinkPenguin/dm_lab
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含两种配置:探索目标位置小型数据集(explore_goal_locations_small)和探索受阻目标小型数据集(explore_obstructed_goals_small)。每种配置都包含图像观测数据、动作、奖励以及两个布尔类型的状态标记(是否终止和是否截断)。数据集分为训练集和测试集,每个数据集包含900万条训练样本和100万条测试样本,数据大小分别为约54GB。
创建时间:
2025-08-22
原始信息汇总

数据集概述

基本信息

  • 数据集名称: dm_lab
  • 来源地址: https://huggingface.co/datasets/EpicPinkPenguin/dm_lab
  • 配置数量: 3个

配置详情

配置1: explore_goal_locations_large

  • 特征:
    • observation: RGB图像
    • action: int32类型
    • reward: float32类型
    • terminated: bool类型
    • truncated: bool类型
  • 数据划分:
    • train: 9,000,000个样本,51,949,873,917字节
    • test: 1,000,000个样本,5,716,507,814字节
  • 下载大小: 57,827,858,782字节
  • 数据集大小: 57,666,381,731字节

配置2: explore_goal_locations_small

  • 特征:
    • observation: RGB图像
    • action: int32类型
    • reward: float32类型
    • terminated: bool类型
    • truncated: bool类型
  • 数据划分:
    • train: 9,000,000个样本,48,935,413,826字节
    • test: 1,000,000个样本,5,442,716,893字节
  • 下载大小: 54,546,267,916字节
  • 数据集大小: 54,378,130,719字节

配置3: explore_obstructed_goals_small

  • 特征:
    • observation: RGB图像
    • action: int32类型
    • reward: float32类型
    • terminated: bool类型
    • truncated: bool类型
  • 数据划分:
    • train: 9,000,000个样本,49,220,656,886字节
    • test: 1,000,000个样本,5,472,353,256字节
  • 下载大小: 54,845,215,456字节
  • 数据集大小: 54,693,010,142字节

数据文件结构

  • explore_goal_locations_large配置: train和test划分分别对应路径explore_goal_locations_large/train-和explore_goal_locations_large/test-
  • explore_goal_locations_small配置: train和test划分分别对应路径explore_goal_locations_small/train-和explore_goal_locations_small/test-
  • explore_obstructed_goals_small配置: train和test划分分别对应路径explore_obstructed_goals_small/train-和explore_obstructed_goals_small/test-
搜集汇总
数据集介绍
main_image_url
构建方式
在深度强化学习研究领域,dm_lab数据集通过精心设计的仿真环境生成,采用三个独立配置场景:大型目标位置探索、小型目标位置探索及障碍目标探索。每个配置均包含RGB图像观测、离散动作空间、奖励信号及终止标志,数据源自智能体与环境的交互轨迹,确保了数据的多样性与真实性。
特点
该数据集以其大规模和高复杂性著称,每个配置提供900万训练样本和100万测试样本,涵盖丰富的视觉观察和决策序列。RGB观测模式保证了视觉输入的逼真度,而多维特征结构支持复杂的强化学习任务,如长期规划与稀疏奖励学习,为算法评估提供了坚实基准。
使用方法
研究人员可通过HuggingFace平台直接加载数据集,按配置名称选择特定场景,并划分为训练与测试集。数据以标准格式组织,支持主流框架如TensorFlow或PyTorch,便于进行离线强化学习训练、行为克隆或环境建模,推动智能决策系统的进展。
背景与挑战
背景概述
DeepMind Lab(dm_lab)数据集作为深度强化学习领域的重要基准环境,由DeepMind研究团队于2016年推出,旨在为智能体提供复杂的三维视觉导航与任务解决平台。该数据集通过高度可配置的迷宫环境模拟真实世界的空间探索挑战,其核心研究问题聚焦于智能体在部分可观测环境中的长期规划能力与奖励稀疏场景下的学习效率,对推动强化学习从游戏领域向机器人自主导航等实际应用转化具有深远影响。
当前挑战
dm_lab数据集主要解决深度强化学习中稀疏奖励环境下的长期依赖与探索效率问题,其挑战在于智能体需在高维视觉输入与动作空间的组合中学习有效策略,同时应对奖励延迟与目标遮蔽等复杂场景。构建过程中的技术挑战包括大规模三维环境的高效渲染与数据同步、多模态观测数据的标准化存储,以及确保不同任务配置下数据轨迹的一致性与可复现性,这些因素共同增加了数据集构建的技术复杂度与资源消耗。
常用场景
经典使用场景
在深度强化学习领域,dm_lab数据集通过提供丰富的视觉观察和动作序列,成为训练智能体在复杂三维环境中进行导航与探索任务的重要基准。其多配置设计支持智能体学习目标定位、障碍规避等核心能力,为研究样本效率与泛化性能提供了标准化评估框架。
衍生相关工作
基于该数据集衍生的经典工作包括深度Q网络与渐进式分层策略的融合研究,以及基于内在好奇心的探索机制创新。这些研究显著推动了分层强化学习架构的发展,并催生了多项在记忆增强与状态表示学习方面具有影响力的学术成果。
数据集最近研究
最新研究方向
在深度强化学习领域,dm_lab数据集凭借其丰富的视觉观察空间和结构化奖励机制,已成为评估智能体探索能力的重要基准。当前研究聚焦于样本效率提升与稀疏奖励环境下的策略优化,特别是在目标定位与障碍物规避任务中探索基于世界模型的表示学习方法。该数据集推动了对部分可观测马尔可夫决策过程的理论研究,并与大规模多任务强化学习框架相结合,为开发通用型智能体提供了关键训练资源。其高维视觉输入与精确的行为标注持续推动着视觉-运动控制联合建模技术的突破,对自动驾驶与机器人导航等现实应用产生深远影响。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作