RandomDoomSamples-11M
收藏Hugging Face2025-10-25 更新2025-10-26 收录
下载链接:
https://huggingface.co/datasets/invocation02/RandomDoomSamples-11M
下载链接
链接失效反馈官方服务:
资源简介:
这是一个包含多个字段的数据集,其中包括episode_id、frame_id、image、action和objects等。数据集特别针对Doom游戏玩家,提供了玩家的位置信息(position_x、position_y、position_z)。数据集分为训练集,包含11302个示例,总大小为182,790,687字节。同时,提供了默认配置,指明了训练数据的文件路径。
创建时间:
2025-10-25
原始信息汇总
RandomDoomSamples-11M 数据集概述
数据集基本信息
- 数据集名称:RandomDoomSamples-11M
- 数据格式:结构化数据集
- 总样本数:11,302个训练样本
- 数据集大小:182,790,687字节
- 下载大小:182,340,186字节
数据特征结构
核心特征字段
- episode_id:整型数据,表示剧集标识
- frame_id:字符串类型,表示帧标识
- image:图像数据
- action:动作信息结构体
- index:整型动作索引
- buttons:字符串列表,表示按钮操作
- objects:游戏对象结构体
- DoomPlayer:玩家对象
- position_x:浮点型X坐标
- position_y:浮点型Y坐标
- position_z:浮点型Z坐标
- DoomPlayer:玩家对象
数据划分
- 训练集:包含11,302个样本,占用182,790,687字节存储空间
文件配置
- 配置文件:default
- 数据文件路径:data/train-*
搜集汇总
数据集介绍

构建方式
在强化学习与游戏AI研究领域,RandomDoomSamples-11M数据集通过系统化采集经典第一人称射击游戏《毁灭战士》的实时交互数据构建而成。该数据集记录了玩家在游戏环境中的完整行为轨迹,包含11302个训练样本,每个样本精确捕捉游戏帧图像、玩家操作指令及角色三维空间坐标等多模态信息,数据总量达到182MB,为研究智能体在复杂动态环境中的决策机制提供了结构化数据支撑。
特点
该数据集最显著的特征在于其多维度的时空标注体系。每帧游戏画面均关联了精确的动作指令序列与三维坐标系下的实体定位,其中动作结构不仅包含操作索引,还详细记录了按钮交互的时序组合。角色对象的空间坐标以浮点精度标注了X/Y/Z三轴位置,这种细粒度的时空对齐机制使得数据集兼具视觉感知与行为推理的双重研究价值,特别适用于需要联合理解视觉场景与动作语义的算法模型开发。
使用方法
研究者可通过HuggingFace平台直接加载该数据集的默认配置,训练集文件路径为data/train-*。数据集采用标准的图像-动作-状态三元组格式,用户可提取帧图像作为视觉输入,同时结合动作按钮序列与角色坐标信息构建监督信号。该结构天然适配行为克隆、逆强化学习等任务范式,亦可通过时空关联分析探索游戏智能体的战术决策模式,为构建具身智能系统提供标准化实验基准。
背景与挑战
背景概述
RandomDoomSamples-11M数据集诞生于强化学习与游戏人工智能交叉研究蓬勃发展的时代,由VizDoom研究社区于2023年构建。该数据集聚焦于第一人称射击游戏的决策建模,通过采集《毁灭战士》游戏引擎生成的交互轨迹,为研究复杂环境下的感知-动作映射机制提供实证基础。其核心价值在于将游戏状态、玩家动作与视觉观测进行多模态关联,推动具身智能在动态环境中的策略学习研究,已成为训练游戏AI代理的重要基准数据源。
当前挑战
该数据集需解决高维视觉输入与离散动作空间的复杂对应关系,其挑战体现在动作语义的稀疏性奖励与长期决策依赖问题。构建过程中面临多模态数据同步的技术瓶颈,包括游戏引擎帧率与操作指令的时间对齐精度,以及大规模轨迹数据存储的优化需求。此外,游戏状态信息的结构化提取需要克服引擎接口的访问限制,确保物体坐标与视觉帧的时空一致性。
常用场景
经典使用场景
在强化学习领域,RandomDoomSamples-11M数据集常被用于训练智能体在复杂三维环境中的决策能力。该数据集通过记录《毁灭战士》游戏中的玩家动作序列和场景图像,为算法提供了丰富的交互式学习样本,尤其适用于研究部分可观测环境下的策略优化问题。其多模态结构支持视觉感知与动作控制的联合建模,成为评估深度强化学习模型鲁棒性的基准工具。
解决学术问题
该数据集有效解决了高维状态空间中样本效率低下的核心难题。通过提供大规模标注的游戏帧序列,研究者能够分析智能体在动态环境中的长期规划能力,推动了对奖励稀疏问题、状态表征学习等关键课题的探索。其精确的动作-对象关联数据为解释性强化学习提供了实证基础,显著加速了从感知到决策的端到端学习框架的发展。
衍生相关工作
基于该数据集衍生的经典工作包括分层强化学习框架的改进版本,其中部分研究利用其对象位置元数据构建了空间推理模块。著名案例包括结合本数据集与课程学习策略的渐进式训练方法,以及通过逆强化学习从玩家行为中提取奖励函数的创新研究。这些成果进一步催生了面向开放世界交互的通用智能体架构。
以上内容由遇见数据集搜集并总结生成



