five

TheGreatRambler/mm2_world

收藏
Hugging Face2022-11-11 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/TheGreatRambler/mm2_world
下载链接
链接失效反馈
官方服务:
资源简介:
Mario Maker 2超级世界数据集包含来自任天堂在线服务的28.9万个超级世界,总计约13.5GB的数据。该数据集是通过自托管的Mario Maker 2 API在2022年2月的一个月内创建的。每个数据行代表一个由玩家创建的独特超级世界,包含玩家ID、世界ID、世界数量、关卡数量、星球类型、创建时间戳等字段。数据集仅包含训练集,且提供了如何使用流式API加载和迭代数据集的代码示例。此外,README还提醒用户注意数据集中可能存在的有害内容。
提供机构:
TheGreatRambler
原始信息汇总

Mario Maker 2 super worlds 数据集概述

数据集基本信息

  • 语言: 多语言
  • 许可证: cc-by-nc-sa-4.0
  • 多语言性: 多语言
  • 大小: 100K<n<1M
  • 来源: 原始数据
  • 任务类别: 其他、目标检测、文本检索、令牌分类、文本生成
  • 任务ID: 无
  • 名称: Mario Maker 2 super worlds
  • 标签: 文本挖掘

数据集描述

  • 内容: 包含289,000个来自Nintendo在线服务的超级世界,总数据量约13.5GB。
  • 创建时间: 2022年2月,使用自托管的Mario Maker 2 API收集。

数据使用

  • 加载方式: 推荐使用datasets库的流式API加载数据集。

  • 示例代码: python from datasets import load_dataset ds = load_dataset("TheGreatRambler/mm2_world", streaming=True, split="train") print(next(iter(ds)))

  • 输出示例: python { pid: 14510618610706594411, world_id: c96012bef256ba6b_20200513204805563301, worlds: 1, levels: 5, planet_type: 0, created: 1589420886, unk1: [some binary data], unk5: 3, unk6: 1, unk7: 1, thumbnail: [some binary data] }

数据结构

  • 数据实例: 每个实例代表一个独特的超级世界,由world_id标识。
  • 数据字段:
    字段 类型 描述
    pid string 创建超级世界的玩家ID
    world_id string 世界ID
    worlds int 世界数量
    levels int 关卡数量
    planet_type int 星球类型
    created int 创建时间戳
    unk1 bytes 未知
    unk5 int 未知
    unk6 int 未知
    unk7 int 未知
    thumbnail bytes 缩略图(PNG格式)

数据分割

  • 分割: 仅包含训练集。

枚举类型

  • 星球类型: python SuperWorldPlanetType = { 0: "Earth", 1: "Moon", 2: "Sand", 3: "Green", 4: "Ice", 5: "Ringed", 6: "Red", 7: "Spiral" }

数据集创建

  • 创建时间: 2022年2月,使用自托管的Mario Maker 2 API。
  • 注意事项: 数据收集过程中需谨慎,以避免对Nintendo服务器造成过载。

使用注意事项

  • 内容多样性: 数据集包含来自全球不同玩家的超级世界,可能存在有害内容。
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作