scryfall-default-cards
收藏Hugging Face2025-12-20 更新2025-12-21 收录
下载链接:
https://huggingface.co/datasets/nishtahir/scryfall-default-cards
下载链接
链接失效反馈官方服务:
资源简介:
Scryfall默认卡片数据集是一个包含Scryfall上所有卡片对象的JSON文件。数据集中的卡片信息以英语或卡片的唯一可用语言呈现。数据集详细记录了每张卡片的多种属性,包括但不限于ID、名称、发行日期、图像URI、法力值、类型、颜色、合法性、游戏类型、价格等。这些信息对于研究或分析集换式卡牌游戏(如魔法风云会)的卡片数据非常有价值。
创建时间:
2025-12-12
原始信息汇总
Scryfall默认卡牌数据集概述
数据集基本信息
- 数据集名称: Scryfall Default Cards
- 数据集地址: https://huggingface.co/datasets/nishtahir/scryfall-default-cards
- 数据来源: Scryfall默认卡牌批量数据,原始数据可在此处获取:https://scryfall.com/docs/api/bulk-data
- 数据描述: 一个包含Scryfall上所有卡牌对象的JSON文件,卡牌语言为英语,若卡牌仅有一种可用语言,则为该印刷语言。
数据集结构与规模
- 数据分割: 仅包含一个“train”分割。
- 训练集样本数: 111,178条。
- 训练集大小: 337,924,272字节。
- 下载大小: 81,304,913字节。
- 数据集总大小: 337,924,272字节。
数据集特征字段
数据集包含以下主要特征字段:
卡牌标识信息
object: 对象类型。id: 卡牌唯一标识符。oracle_id: Oracle标识符。multiverse_ids: 多重宇宙标识符列表。mtgo_id: MTGO标识符。arena_id: Arena标识符。tcgplayer_id: TCGplayer标识符。cardmarket_id: Cardmarket标识符。
卡牌核心信息
name: 卡牌名称。lang: 语言。released_at: 发布日期。uri: 资源标识符。scryfall_uri: Scryfall资源标识符。layout: 版面布局。mana_cost: 法术力费用。cmc: 总法术力值。type_line: 类别栏。oracle_text: Oracle文本。colors: 颜色列表。color_identity: 颜色身份列表。keywords: 关键词列表。produced_mana: 产生的法术力列表。
图像信息
highres_image: 是否具有高分辨率图像。image_status: 图像状态。image_uris: 图像URI结构体,包含art_crop、border_crop、large、normal、png、small等字段。
赛制与游戏信息
legalities: 合法性结构体,包含alchemy、brawl、commander、duel、future、gladiator、historic、legacy、modern、oathbreaker、oldschool、pauper、paupercommander、penny、pioneer、predh、premodern、standard、standardbrawl、timeless、vintage等赛制。games: 游戏列表。reserved: 是否为保留卡牌。game_changer: 是否为游戏改变者。
印刷与版本信息
foil: 是否有闪卡版本。nonfoil: 是否有非闪卡版本。finishes: 工艺列表。oversized: 是否为超大卡牌。promo: 是否为促销卡牌。reprint: 是否为重印卡牌。variation: 是否为变体卡牌。set_id: 系列标识符。set: 系列代码。set_name: 系列名称。set_type: 系列类型。set_uri: 系列资源标识符。set_search_uri: 系列搜索资源标识符。scryfall_set_uri: Scryfall系列资源标识符。rulings_uri: 裁定资源标识符。prints_search_uri: 印刷品搜索资源标识符。collector_number: 收藏编号。digital: 是否为数字卡牌。rarity: 稀有度。card_back_id: 卡背标识符。
艺术与设计信息
artist: 画家。artist_ids: 画家标识符列表。illustration_id: 插画标识符。border_color: 边框颜色。frame: 卡框。full_art: 是否为全画卡牌。textless: 是否为无文字卡牌。booster: 是否出现在补充包中。story_spotlight: 是否为故事焦点卡牌。
价格与购买信息
prices: 价格结构体,包含eur、eur_foil、tix、usd、usd_etched、usd_foil等字段。related_uris: 相关资源标识符结构体,包含edhrec、gatherer、tcgplayer_infinite_articles、tcgplayer_infinite_decks等字段。purchase_uris: 购买资源标识符结构体,包含cardhoarder、cardmarket、tcgplayer等字段。
使用方法
python from datasets import load_dataset dataset = load_dataset("nishtahir/scryfall-default-cards")
搜集汇总
数据集介绍

构建方式
在集换式卡牌游戏数据领域,Scryfall Default Cards数据集通过系统化地整合Scryfall API提供的原始批量数据构建而成。该数据集以JSON格式收录了所有卡牌对象的完整信息,涵盖了从基础属性到游戏机制的多维度字段。构建过程依赖于Scryfall平台的实时数据更新机制,确保卡牌信息的准确性与时效性,为研究者提供了结构化的卡牌数据资源。
使用方法
通过Hugging Face数据集库,用户可直接加载该数据集进行探索与分析。典型应用场景包括卡牌文本的自然语言处理、游戏平衡性研究以及市场价格趋势预测。数据集支持标准的数据切片与字段提取操作,研究者可结合卡牌类型、颜色身份等维度进行筛选,为游戏设计、经济分析等跨学科研究提供数据支撑。
背景与挑战
背景概述
Scryfall默认卡牌数据集源于数字卡牌游戏《万智牌》的社区驱动数据平台Scryfall,该平台自2016年由开发者团队创立,致力于提供全面、实时的卡牌信息检索服务。数据集的核心研究问题聚焦于如何系统化地整合与呈现《万智牌》庞大且动态更新的卡牌元数据,涵盖从基本属性到游戏规则、市场价格等多维度信息。这一资源为卡牌游戏分析、人工智能卡组构建及数字收藏品研究奠定了数据基础,显著推动了游戏数据科学领域的发展,成为学术界与爱好者社区的重要参考。
当前挑战
该数据集旨在解决卡牌游戏领域中复杂元数据的标准化与可访问性问题,其挑战在于卡牌属性的高度异构性,如多版本印刷、动态规则解释及跨格式合法性,这要求数据模型具备极强的灵活性与一致性。构建过程中的挑战涉及实时同步海量卡牌更新、处理多语言文本的非结构化描述,以及维护图像链接和价格信息的准确性,这些因素共同增加了数据清洗与长期维护的复杂度。
常用场景
经典使用场景
在集换式卡牌游戏领域,scryfall-default-cards数据集为研究人员提供了全面的卡牌元数据,常用于构建卡牌推荐系统与平衡性分析。通过整合卡牌的法术力消耗、类型、规则文本及合法性信息,该数据集支持对卡牌强度与协同效应的量化评估,为游戏策略优化与卡组构建提供数据驱动的见解。
解决学术问题
该数据集解决了游戏设计中卡牌平衡性与多样性的量化研究难题,通过提供标准化的卡牌属性与价格数据,支持复杂系统分析、经济模型构建以及玩家行为研究。其结构化特征促进了机器学习在游戏智能中的应用,为理解动态卡牌生态系统的演化规律提供了实证基础。
实际应用
在实际应用中,该数据集被广泛用于卡牌交易平台的定价算法开发、在线游戏平台的卡牌数据库构建以及玩家社区的卡组分析工具。其丰富的图像链接与多语言支持,亦为数字卡牌收藏管理与跨语言卡牌检索系统提供了可靠的数据源。
数据集最近研究
最新研究方向
在卡牌游戏与人工智能交叉领域,scryfall-default-cards数据集凭借其详尽的结构化卡牌信息,正成为前沿研究的关键资源。当前研究聚焦于利用该数据集训练大型语言模型,以解析卡牌文本中的复杂规则语义,进而构建智能卡牌推荐系统与自动化对战策略生成器。随着数字卡牌游戏的兴起,该数据集亦被应用于玩家行为分析与市场动态预测,通过整合价格与合法性字段,为经济模型与平衡性设计提供数据支撑。这些探索不仅推动了游戏人工智能的实用化进程,也为理解复杂规则系统的计算建模开辟了新路径。
以上内容由遇见数据集搜集并总结生成



