scryfall-oracle-cards
收藏Hugging Face2025-12-20 更新2025-12-21 收录
下载链接:
https://huggingface.co/datasets/nishtahir/scryfall-oracle-cards
下载链接
链接失效反馈官方服务:
资源简介:
Scryfall Oracle Cards数据集是一个包含Scryfall批量数据转储的JSON文件,每个Oracle ID对应一个Scryfall卡片对象。数据集旨在返回每个卡片的最新且可识别的版本。数据集包含丰富的卡片信息,如名称、ID、发行日期、图像URI、法力值、类型、颜色、关键词、合法性、游戏类型、价格等。此外,还包含卡片在不同平台上的URI链接和购买链接。数据集主要用于训练,包含36,264个示例。
创建时间:
2025-12-12
原始信息汇总
Scryfall Oracle Cards 数据集概述
数据集基本信息
- 数据集名称: Scryfall Oracle Cards
- 托管地址: https://huggingface.co/datasets/nishtahir/scryfall-oracle-cards
- 数据来源: Scryfall 批量数据,原始数据可在此处获取:https://scryfall.com/docs/api/bulk-data
- 数据描述: 一个JSON文件,包含Scryfall上每个Oracle ID对应的一个Scryfall卡牌对象。所选择的卡牌系列旨在提供最新且最易识别的卡牌版本。
数据集规模与结构
- 数据分割: 仅包含一个“train”分割。
- 训练集样本数: 36,264 个示例。
- 训练集大小: 118,354,975 字节。
- 下载大小: 32,073,689 字节。
- 数据集总大小: 118,354,975 字节。
数据集特征(字段)概览
数据集包含丰富的卡牌信息字段,主要类别如下:
标识与元数据
object,id,oracle_id: 对象类型、唯一标识符和Oracle标识符。multiverse_ids,mtgo_id,tcgplayer_id,cardmarket_id: 在不同平台(如Magic Online、TCGplayer、Cardmarket)的标识符。name: 卡牌名称。lang: 语言。released_at: 发布日期。
资源链接
uri,scryfall_uri: 卡牌的API URI和网页URI。image_uris: 包含不同尺寸(如art_crop, border_crop, large, normal, png, small)的图片URI的结构体。set_uri,set_search_uri,scryfall_set_uri,rulings_uri,prints_search_uri: 与卡牌系列、裁定、印刷品搜索相关的URI。related_uris: 指向EDHrec、Gatherer、TCGplayer文章和套牌的相关链接。purchase_uris: 指向Cardhoarder、Cardmarket、TCGplayer的购买链接。
卡牌属性与游戏信息
layout: 版面布局。mana_cost: 法术力费用。cmc: 总法术力费用。type_line: 类别栏。oracle_text: Oracle文本(规则文本)。power,toughness: 力量与防御力。colors,color_identity: 颜色与颜色标识。keywords: 关键词。all_parts: 关联部件(如组合卡)的列表,包含组件类型、ID、名称等信息。
合法性信息
legalities: 一个结构体,包含卡牌在各种赛制(如standard, modern, legacy, vintage, commander, pioneer等)中的合法性状态。
印刷与版本信息
set_id,set,set_name,set_type: 卡牌所属系列的ID、代码、名称和类型。collector_number: 收藏编号。rarity: 稀有度。finishes: 表面处理(如光面、非光面)。foil,nonfoil,digital: 是否为闪卡、非闪卡、数字版。reprint,variation: 是否为重印卡、变体卡。promo,full_art,textless,booster: 是否为促销卡、全画卡、无文字卡、可在补充包中获得。
美术与设计
artist,artist_ids: 画家及其ID。illustration_id: 插画ID。flavor_text: 背景叙述文字。watermark: 水印。border_color,frame,frame_effects,security_stamp: 边框颜色、牌框、牌框效果、安全印戳。highres_image,image_status: 是否有高分辨率图像及图像状态。
其他信息
games: 卡牌可游玩的游戏平台。reserved: 是否为保留列表卡牌。game_changer,oversized,story_spotlight: 是否为游戏改变者卡、超大卡、故事焦点卡。edhrec_rank: EDH/Commander格式中的排名。preview: 预览信息,包含预览日期、来源和来源URI。prices: 价格信息(欧元、欧元闪卡、Tix、美元、美元蚀刻版、美元闪卡)。
使用方法
python from datasets import load_dataset dataset = load_dataset("nishtahir/scryfall-oracle-cards")
搜集汇总
数据集介绍

构建方式
在集换式卡牌游戏数据管理领域,Scryfall Oracle Cards数据集通过系统化整合与规范化处理构建而成。其核心数据源自Scryfall官方提供的批量数据接口,该接口以Oracle ID为唯一标识,为每个独特的卡牌概念选取最具代表性且信息最新的版本。构建过程中,数据以结构化JSON格式组织,确保了每张卡牌对象的完整性与一致性,涵盖了从基本属性到游戏规则、市场价格等维度的详细信息。
使用方法
研究人员与开发者可通过Hugging Face的`datasets`库便捷加载此数据集。典型应用流程始于执行`load_dataset("nishtahir/scryfall-oracle-cards")`指令,随后即可访问包含数万条卡牌记录的训练集。该数据集适用于自然语言处理任务,如基于规则文本的卡牌分类或语义分析;也可用于游戏AI开发,通过解析卡牌属性构建决策模型;同时,其丰富的元数据支持可视化分析、版本对比研究以及游戏经济系统的实证分析。
背景与挑战
背景概述
Scryfall Oracle Cards数据集源于对集换式卡牌游戏《万智牌》数字化信息整合的迫切需求,由Scryfall平台于2016年创建并持续维护。该数据集旨在为研究人员和开发者提供一套标准化、结构化的卡牌数据,覆盖从基础属性到游戏规则、市场价值等多维度信息。其核心研究问题聚焦于如何高效处理复杂游戏卡牌的语义信息,支持自然语言处理、游戏人工智能及数字人文等跨学科研究。该数据集已成为卡牌游戏分析领域的重要基准,推动了游戏智能代理、卡牌文本理解及元游戏策略优化等前沿方向的发展。
当前挑战
该数据集致力于解决集换式卡牌游戏领域内卡牌语义理解与游戏状态建模的挑战,具体包括卡牌文本中嵌套规则逻辑的解析、动态游戏交互的表示学习,以及多格式卡牌数据的统一标准化。在构建过程中,面临的主要挑战涉及海量历史卡牌数据的爬取与清洗,确保不同版本卡牌信息的一致性,以及处理卡牌规则文本中存在的歧义性与复杂性。此外,数据集中卡牌属性的频繁更新与游戏环境的动态演变,也对数据的时效性与完整性维护提出了持续要求。
常用场景
经典使用场景
在集换式卡牌游戏领域,Scryfall Oracle Cards数据集为研究人员和开发者提供了全面的卡牌信息基准。该数据集最经典的使用场景在于支持卡牌游戏分析与模拟,例如通过卡牌属性如法力值、类型和规则文本,构建游戏状态模型或评估卡牌强度。这些数据使得算法能够模拟对战策略,优化卡组构建,并推动游戏人工智能的发展,为复杂决策系统提供结构化输入。
解决学术问题
该数据集解决了游戏研究中的多个核心学术问题,包括卡牌游戏平衡性分析、玩家行为建模以及规则系统的形式化验证。通过提供标准化的卡牌元数据,它支持量化研究卡牌间的交互效应,评估游戏设计的公平性与多样性。其意义在于为计算游戏学提供了可靠的数据基础,促进了跨学科研究,如人工智能在策略游戏中的应用,从而深化了对复杂系统动态的理解。
实际应用
在实际应用层面,Scryfall Oracle Cards数据集被广泛用于卡牌游戏社区工具开发,例如卡牌搜索引擎、卡组构建助手和价格追踪平台。游戏开发者利用这些数据集成卡牌信息到数字版本中,确保规则一致性;同时,市场分析师借助价格和合法性字段,监控卡牌经济趋势。这些应用提升了玩家体验,并支持了游戏产业的数字化运营。
数据集最近研究
最新研究方向
在集换式卡牌游戏与人工智能交叉领域,scryfall-oracle-cards数据集凭借其详尽的卡牌元数据与图像信息,正成为前沿研究的核心资源。当前研究聚焦于利用该数据集训练多模态模型,以解析卡牌文本、图像与游戏机制间的复杂关联,推动自动化卡牌设计平衡性与游戏策略生成的进展。随着数字卡牌游戏的兴起,该数据集在预测卡牌市场动态、模拟玩家行为及增强游戏AI智能体方面展现出关键价值,为游戏开发与经济学研究提供了坚实的数据基础。
以上内容由遇见数据集搜集并总结生成



