Zola-Character-Network-Dataset
收藏github2024-07-07 更新2024-07-08 收录
下载链接:
https://github.com/yrochat/Zola-Character-Network-Dataset
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含20部小说中角色出现的索引和基于这些小说的角色网络。这些网络是基于Émile Zola的Les Rougon-Macquart系列小说构建的,写作时间跨度为1870年至1893年。角色网络以csv文件形式提供,包含三列数据,其中第三列表示权重。
This dataset comprises indexes of character appearances in 20 novels and the character networks derived from these novels. These networks are constructed based on Émile Zola's Les Rougon-Macquart series, written between 1870 and 1893. The character networks are provided in CSV format, containing three columns of data, with the third column representing the weight.
创建时间:
2024-07-07
原始信息汇总
Zola Character Networks Dataset 概述
基本信息
- DOI: 10.5281/zenodo.12675627
- 引用格式: Yannick Rochat. (2024). Zola Character Networks Dataset (v1.0.0) [Data set]. EPFL. https://doi.org/10.5281/zenodo.12675627
- 相关论文: 该数据集用于2015年悉尼数字人文会议的一篇会议论文 serval.unil.ch/fr/notice/serval:BIB_E4427AF55A80
数据集内容
-
角色出现索引:
- 包含20部小说(La Pléiade版本)中角色的出现索引。
- 数据来源于《Les Rougon-Macquart》的La Pléiade版本末尾的角色索引,经过数字化和校正。
-
角色网络:
- 包含20个基于Émile Zola的《Les Rougon-Macquart》(1870-1893年间创作)的角色网络。
- 网络为无向图,以CSV文件格式提供,包含三列(第三列为权重)。
数据构建方法
- 使用共现方法构建网络(方法详见作者的博士论文 serval.unil.ch/fr/notice/serval:BIB_663137B68131)。
- 使用R和igraph工具进行构建。
数据示例
- 角色索引示例:

- 网络分析示例:

注意事项
- 角色索引数据存在少量错误,但对整体数据无显著影响。
- 提醒:避免仅基于网络图得出结论。
搜集汇总
数据集介绍

构建方式
该数据集基于Émile Zola的Les Rougon-Macquart系列小说构建,采用了共现分析方法。具体而言,通过R语言和igraph库,对20部小说中的角色共现关系进行了量化分析,生成了20个无向角色网络。这些网络以CSV文件形式存储,包含三列数据,其中第三列表示权重,权重计算方法详见作者的博士论文。此外,数据集还包括了角色在小说中的出现索引,该索引源自La Pléiade版本的Les Rougon-Macquart,经过数字化和校正,确保了角色名称的可识别性。
特点
此数据集的显著特点在于其基于文学作品的共现网络分析,提供了对文学角色互动关系的量化视角。数据集包含了20部小说的角色网络,每个网络均以CSV格式存储,便于后续分析。此外,数据集还附带了角色出现索引,确保了数据的完整性和可追溯性。尽管在数字化过程中存在一些误差,但这些误差对整体数据分析的影响微乎其微。
使用方法
该数据集适用于文学研究、社会网络分析以及文本挖掘等多个领域。用户可以通过加载CSV文件,利用R语言或其他数据分析工具,对角色网络进行深入分析。特别地,数据集提供了角色共现的权重信息,这为研究角色互动强度提供了量化依据。此外,角色出现索引也可用于进一步的文本分析和角色关系研究。在使用过程中,建议结合作者的博士论文,以更好地理解数据集的构建方法和分析技巧。
背景与挑战
背景概述
Zola-Character-Network-Dataset是由Yannick Rochat于2024年创建,旨在通过分析Émile Zola的20部小说《Les Rougon-Macquart》中的角色网络,探讨文学作品中角色关系的复杂性。该数据集基于Rochat博士论文中的共现方法构建,涵盖了20部小说的角色出现索引及相应的角色网络。此数据集不仅为文学研究提供了新的视角,还在2015年悉尼的数字人文会议上被用于相关研究,展示了其在文学分析领域的应用潜力。
当前挑战
Zola-Character-Network-Dataset在构建过程中面临的主要挑战包括:首先,角色索引的数字化和校正过程复杂,尽管已尽力减少错误,但仍存在一些识别问题。其次,角色网络的分析需谨慎,避免仅基于网络图形的直观判断,而应深入理解其背后的计算方法。此外,该数据集的应用需结合文学理论,以确保分析结果的准确性和科学性。
常用场景
经典使用场景
在文学研究领域,Zola-Character-Network-Dataset 被广泛用于分析 Émile Zola 的 Les Rougon-Macquart 系列小说中的人物关系网络。通过构建基于共现方法的人物网络,研究者能够深入探讨小说中人物之间的互动模式及其在不同作品中的变化。这种分析不仅揭示了作者在不同作品中对人物关系的处理方式,还为理解文学作品的结构和叙事提供了新的视角。
衍生相关工作
基于 Zola-Character-Network-Dataset,研究者们开展了一系列相关工作,包括对其他文学作品中人物关系网络的扩展分析,以及将社会网络分析方法应用于不同文化和历史背景下的文学作品。此外,该数据集还启发了对文学作品中人物关系动态变化的研究,探讨人物关系如何随时间演变。这些衍生工作不仅丰富了文学研究的理论框架,还推动了文学分析技术的创新和发展。
数据集最近研究
最新研究方向
在数字人文领域,Zola-Character-Network-Dataset已成为研究Émile Zola作品中人物关系网络的重要资源。该数据集通过分析20部小说中的人物共现关系,揭示了Zola作品中复杂的人物互动模式。最新研究方向主要集中在利用网络分析技术,探索这些人物网络的结构特征及其在不同小说中的变化,从而深入理解Zola的叙事策略和文学创作风格。此外,研究者还关注如何通过数据挖掘和机器学习方法,自动识别和纠正数据中的错误,以提高数据集的准确性和可靠性。这些研究不仅有助于文学批评和历史研究,还为数字人文领域的技术应用提供了新的视角和方法。
以上内容由遇见数据集搜集并总结生成



