War Of The Five Kings
收藏github2014-09-21 更新2024-05-31 收录
下载链接:
https://github.com/zatopek8848/war_of_the_five_kings_dataset
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含了乔治·R·R·马丁的《冰与火之歌》系列中五王之战中的战斗数据。数据集旨在作为数据科学教学工具,提供了一个既有虚构背景又有内置上下文的数据集。
This dataset encompasses battle data from the War of the Five Kings in George R.R. Martin's 'A Song of Ice and Fire' series. Designed as a pedagogical tool for data science, it offers a dataset that combines a fictional backdrop with built-in contextual relevance.
创建时间:
2014-09-21
原始信息汇总
数据集概述
数据集名称
- 名称: The War Of The Five Kings, A Dataset
数据集描述
- 来源: 基于George R.R. Martin的《冰与火之歌》系列中的五王之战。
- 目的: 作为数据科学教学工具,提供既有虚构背景又有明确上下文的数据集。
数据集结构
- 观察层次: 五王之战的战斗。
- 变量详情:
- name: 字符串变量,战斗名称。
- year: 数值变量,战斗年份。
- battle_number: 数值变量,战斗的唯一ID。
- attacker_king: 分类变量,攻击方的国王。
- defender_king: 分类变量,防御方的国王。
- attacker_1, attacker_2, attacker_3, attacker_4: 字符串变量,攻击方主要家族。
- defender_1, defender_2, defender_3, defender_4: 字符串变量,防御方主要家族。
- attacker_outcome: 分类变量,攻击方结果(胜、负、平)。
- battle_type: 分类变量,战斗类型(正规战、伏击、围攻、破坏)。
- major_death: 二元变量,战斗中是否有主要人物死亡。
- major_capture: 二元变量,战斗中是否有主要人物被捕。
- attacker_size: 数值变量,攻击方兵力规模。
- defender_size: 数值变量,防御方兵力规模。
- attacker_commander: 字符串变量,攻击方主要指挥官。
- defender_commander: 字符串变量,防御方主要指挥官。
- summer: 二元变量,战斗是否发生在夏季。
- location: 字符串变量,战斗地点。
- region: 分类变量,战斗发生的区域。
- note: 字符串变量,关于个别观察的编码注释。
数据集来源
- 来源: A Wiki of Fire and Ices War Of The Five Kings。
- 数据收集时间: 2014年8月17日。
数据集使用
- 探索性分析: 可在此nbviewer链接查看。
- API查询: 数据可通过此链接进行API查询。
搜集汇总
数据集介绍

构建方式
War Of The Five Kings数据集的构建,是以乔治·R·R·马丁的《冰与火之歌》系列中的五王之战为背景,采用小说中描述的战斗事件作为数据来源。数据集的构建者精选了与战斗相关的多个维度信息,如战斗名称、年份、参战各方、指挥官、战斗类型、兵力规模等,并进行了系统性的编码,以形成结构化的数据集,旨在作为数据科学教学的辅助工具。
特点
该数据集的特点在于其基于著名小说的虚构背景,既包含了丰富的战斗细节,又避免了现实世界数据集的复杂性和不确定性。数据集涵盖了几十次战斗,包含了战斗的基本信息以及战斗结果,为研究者提供了探索战争模式、战略和结果之间关系的良好基础。此外,数据集的变量分类清晰,便于不同维度的分析。
使用方法
用户可以通过数据集提供的API进行数据的查询和访问,也可以直接从GitHub仓库下载数据集。数据集采用了代码簿(codebook)的形式,详细说明了每个变量的含义和类型,便于用户理解和应用。对于数据科学教学而言,教师可以引导学生利用该数据集进行探索性数据分析,通过可视化和分析来加深对统计方法的理解。
背景与挑战
背景概述
《War Of The Five Kings》数据集,是基于乔治·R·R·马丁的奇幻小说系列《冰与火之歌》中的五王之战所构建的。该数据集的创建,源于创作者在寻找适用于数据科学教学的小型-n数据集的过程中,认为现实世界的非虚构数据集虽然更具吸引力,但伴随的复杂性和灰色地带不适宜教学;而随机生成的数据集在视觉化或分析结果上又缺乏实际意义。因此,利用《冰与火之歌》系列中丰富的虚构素材,创建了一个既具有内置背景又适合教学的数据集。这一项目起初是作者在机场消磨时间的小型旁项目,后成为具有教学价值的数据集。
当前挑战
在构建《War Of The Five Kings》数据集的过程中,所面临的挑战主要包括:如何将虚构文学作品中的战争事件转化为结构化的数据形式,确保数据的准确性和一致性;同时,由于文学作品中的描述往往具有一定的模糊性和主观性,如何在数据编码过程中处理这些 grey-areas,以确保数据的可用性和教学效果。此外,该数据集在解决领域问题——如历史事件分析、文本挖掘等方面,也面临着如何将虚构数据与现实世界的数据分析相对应的挑战。
常用场景
经典使用场景
在数据科学的教学领域,War Of The Five Kings数据集因其源自乔治·R·R·马丁的《冰与火之歌》系列小说而独具魅力,提供了一个既虚构又充满内在故事背景的教学案例。该数据集常被用于展示如何处理和分析带有分类和数值变量的数据,以及如何进行探索性数据分析,例如通过可视化战争的时间线和地理分布。
衍生相关工作
基于War Of The Five Kings数据集,衍生出了一系列相关工作,包括对数据集的扩展、深入分析以及将数据集与其他相关数据集的整合。这些工作不仅加深了对《冰与火之歌》中战争事件的理解,也推动了数据科学在虚构环境中的应用研究。
数据集最近研究
最新研究方向
《War Of The Five Kings》数据集基于乔治·R·R·马丁的《冰与火之歌》系列中的五王之战,收集了该战争中的战斗信息。近期研究聚焦于探索虚构数据集在数据科学教学中的应用,尤其是如何利用该数据集进行探索性数据分析,以及如何将此类数据集作为教学工具,以弥补现实世界数据集的复杂性和随机生成数据集的无意义输出。该数据集为教学提供了丰富的情境背景,使得学生可以在具有故事性的虚构环境中学习数据分析的方法和技巧,进而提升数据科学的普及与教育质量。
以上内容由遇见数据集搜集并总结生成



