TheGreatRambler/mm2_world
收藏Hugging Face2022-11-11 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/TheGreatRambler/mm2_world
下载链接
链接失效反馈官方服务:
资源简介:
Mario Maker 2超级世界数据集包含来自任天堂在线服务的28.9万个超级世界,总计约13.5GB的数据。该数据集是通过自托管的Mario Maker 2 API在2022年2月的一个月内创建的。每个数据行代表一个由玩家创建的独特超级世界,包含玩家ID、世界ID、世界数量、关卡数量、星球类型、创建时间戳等字段。数据集仅包含训练集,且提供了如何使用流式API加载和迭代数据集的代码示例。此外,README还提醒用户注意数据集中可能存在的有害内容。
提供机构:
TheGreatRambler
原始信息汇总
Mario Maker 2 super worlds 数据集概述
数据集基本信息
- 语言: 多语言
- 许可证: cc-by-nc-sa-4.0
- 多语言性: 多语言
- 大小: 100K<n<1M
- 来源: 原始数据
- 任务类别: 其他、目标检测、文本检索、令牌分类、文本生成
- 任务ID: 无
- 名称: Mario Maker 2 super worlds
- 标签: 文本挖掘
数据集描述
- 内容: 包含289,000个来自Nintendo在线服务的超级世界,总数据量约13.5GB。
- 创建时间: 2022年2月,使用自托管的Mario Maker 2 API收集。
数据使用
-
加载方式: 推荐使用
datasets库的流式API加载数据集。 -
示例代码: python from datasets import load_dataset ds = load_dataset("TheGreatRambler/mm2_world", streaming=True, split="train") print(next(iter(ds)))
-
输出示例: python { pid: 14510618610706594411, world_id: c96012bef256ba6b_20200513204805563301, worlds: 1, levels: 5, planet_type: 0, created: 1589420886, unk1: [some binary data], unk5: 3, unk6: 1, unk7: 1, thumbnail: [some binary data] }
数据结构
- 数据实例: 每个实例代表一个独特的超级世界,由
world_id标识。 - 数据字段:
字段 类型 描述 pid string 创建超级世界的玩家ID world_id string 世界ID worlds int 世界数量 levels int 关卡数量 planet_type int 星球类型 created int 创建时间戳 unk1 bytes 未知 unk5 int 未知 unk6 int 未知 unk7 int 未知 thumbnail bytes 缩略图(PNG格式)
数据分割
- 分割: 仅包含训练集。
枚举类型
- 星球类型: python SuperWorldPlanetType = { 0: "Earth", 1: "Moon", 2: "Sand", 3: "Green", 4: "Ice", 5: "Ringed", 6: "Red", 7: "Spiral" }
数据集创建
- 创建时间: 2022年2月,使用自托管的Mario Maker 2 API。
- 注意事项: 数据收集过程中需谨慎,以避免对Nintendo服务器造成过载。
使用注意事项
- 内容多样性: 数据集包含来自全球不同玩家的超级世界,可能存在有害内容。



