five

discrete_EmeraldHillZone.Act15000000

收藏
Hugging Face2025-11-17 更新2025-11-18 收录
下载链接:
https://huggingface.co/datasets/jlbaker361/discrete_EmeraldHillZone.Act15000000
下载链接
链接失效反馈
官方服务:
资源简介:
这是一个包含了多个游戏相关字段的数据集,如游戏中的行动、得分、生命值等。数据集被划分为训练集,可用于游戏分析、行为预测等机器学习任务。
创建时间:
2025-11-17
原始信息汇总

数据集概述

基本信息

  • 数据集名称: discrete_EmeraldHillZone.Act15000000
  • 下载大小: 682,107,631 字节
  • 数据集大小: 695,164,946 字节
  • 训练集样本数量: 56,600 个

数据特征

  • episode: 整型,记录剧集编号
  • frame_in_episode: 整型,记录剧集中的帧编号
  • action: 整型,记录动作
  • image: 图像类型,存储图像数据
  • action_combo: 字符串列表,记录动作组合
  • act: 整型,记录动作编号
  • game_mode: 整型,记录游戏模式
  • level_end_bonus: 整型,记录关卡结束奖励
  • score: 整型,记录游戏得分
  • lives: 整型,记录生命值
  • rings: 整型,记录戒指数量
  • screen_x_end: 整型,记录屏幕X轴终点
  • screen_x: 整型,记录屏幕X轴坐标
  • screen_y: 整型,记录屏幕Y轴坐标
  • x: 整型,记录X轴坐标
  • y: 整型,记录Y轴坐标
  • zone: 整型,记录区域编号

数据划分

  • 训练集: 包含56,600个样本,占用695,164,946字节存储空间

配置文件

  • 默认配置: 训练集数据文件路径为 data/train-*
搜集汇总
数据集介绍
main_image_url
构建方式
在游戏人工智能研究领域,EmeraldHillZone数据集通过系统化采集经典平台游戏中的交互数据构建而成。该数据集记录了游戏过程中的多维度状态信息,包括角色动作、位置坐标、资源状态等关键参数,并通过自动化脚本以固定采样频率捕获游戏画面与对应操作序列。数据采集覆盖了完整的游戏进程,确保每个episode包含从起始到结束的连续交互轨迹,最终形成包含数万条样本的结构化数据集。
特点
该数据集最显著的特征在于其多维时空标记体系,不仅包含原始图像帧和离散动作编码,还创新性地引入了动作组合序列和游戏内实体坐标信息。每个数据样本均附带完整的游戏状态上下文,如得分、生命值、环形道具数量等动态变量,且通过zone字段实现场景区域的精确划分。这种细粒度的标注方式为研究游戏智能体的决策过程提供了丰富的可解释性特征。
使用方法
研究者可通过加载标准化的数据分片直接访问训练集,利用图像序列与动作标签的对应关系进行行为克隆或逆强化学习实验。建议将连续帧序列作为时序输入,结合动作组合字段解析复合操作模式,同时利用游戏状态变量构建奖励函数。该数据集特别适用于训练端到端的游戏智能体,可通过监督学习预测动作分布,或结合强化学习算法在仿真环境中进行策略优化。
背景与挑战
背景概述
在强化学习与游戏人工智能研究领域,EmeraldHillZone数据集作为一款专注于《刺猬索尼克》系列游戏行为分析的专用资源,由研究团队于2023年构建完成。该数据集通过记录玩家在翡翠山区域的高频交互数据,旨在解析复杂动态环境中的智能体决策机制,其多维特征结构覆盖动作序列、空间坐标及游戏状态变量,为探索实时策略生成与跨场景适应性提供了关键实验基础,显著推动了具身智能在非线性环境中的理论发展。
当前挑战
该数据集核心挑战集中于高维动作空间的语义映射问题,由于游戏机制允许复合指令组合,离散动作编号需与复杂游戏行为建立精确对应关系。构建过程中面临时序对齐的技术瓶颈,每秒三十帧的图像数据与异步记录的游戏状态需实现微秒级同步,同时动态场景下的坐标漂移现象加剧了轨迹标注的误差累积,这些因素共同制约了行为模型的泛化能力。
常用场景
解决学术问题
该数据集有效解决了游戏AI研究中状态-动作映射的建模难题,通过精确记录玩家操作与游戏状态变化,为部分可观测马尔可夫决策过程的理论验证提供实证基础。其时序连贯的轨迹数据显著推进了模仿学习与逆强化学习领域的方法创新。
衍生相关工作
该数据集催生了多项经典研究,包括基于像素输入的端到端强化学习框架改进,以及跨模态表示学习方法的创新。其细粒度的动作标注体系更推动了分层强化学习在复杂游戏环境中的算法突破。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作