wikipeople15, sistercities, wikipeople24
收藏github2018-10-06 更新2024-05-31 收录
下载链接:
https://github.com/elaragon/wikidatasets
下载链接
链接失效反馈官方服务:
资源简介:
由Wikipedia数据生成的研究用数据集,每个数据集包含一个README.md文件,描述了构成数据集的文件。鼓励使用这些数据集并在使用文件时引用相应的研究。
A research dataset generated from Wikipedia data, each dataset includes a README.md file that describes the files constituting the dataset. The use of these datasets is encouraged, and citation of the corresponding research is recommended when utilizing the files.
创建时间:
2016-03-25
原始信息汇总
数据集概述
本数据集包含三个子数据集,分别用于支持不同的研究文章。每个子数据集均附有README文件,详细描述了构成该数据集的文件。
子数据集列表
wikipeople15
- 研究文章: Aragón P., Kaltenbrunner A., Laniado D., & Volkovich Y. (2012), “Biographical Social Networks on Wikipedia – A cross-cultural study of links that made history”. WikiSym ’12 – 8th International Symposium on Wikis and Open Collaboration, Linz, Austria.
- 链接: wikipeople15
sistercities
- 研究文章: Kaltenbrunner, A., Aragón, P., Laniado, D., & Volkovich, Y. (2013). “Not All Paths Lead to Rome: Analysing the Network of Sister Cities”. IWSOS ’13 – 7th International Workshop on Self-organizing Systems, Palma de Mallorca, Spain.
- 链接: sistercities
wikipeople24
- 研究文章: Eom, Y. H., Aragón, P., Laniado, D., Kaltenbrunner, A., Vigna, S., & Shepelyansky, D. L. (2015). Interactions of cultures and top people of Wikipedia from ranking of 24 language editions. PloS one, 10(3), e0114825.
- 链接: wikipeople24
搜集汇总
数据集介绍

构建方式
wikipeople15数据集是通过采集Wikipedia上具有历史意义的传记性社会网络链接构建而成,旨在进行跨文化研究。sistercities数据集则是对城市之间姐妹关系的网络分析,通过收集各城市官方公布的姐妹城市资料进行构建。wikipeople24数据集汇集了24种语言版本的Wikipedia中顶级人物的互动信息,通过对不同语言版本的排名分析进行构建。
特点
wikipeople15数据集特点在于其跨文化比较的维度,提供了丰富的传记链接数据。sistercities数据集展现了城市网络的全球化特征,揭示了不同城市间的关联性。wikipeople24数据集则特色在于多语言视角下的人物互动分析,对于研究文化间相互作用具有重要价值。
使用方法
使用wikipeople15数据集,研究者可以探究传记社会网络的文化差异。sistercities数据集可供分析城市间的关系网络,有助于理解城市间的合作与交流。而wikipeople24数据集则可用于研究不同文化背景下的人物排名及其相互作用,使用时需参照相应的数据字典和文档以确保正确解读数据。
背景与挑战
背景概述
wikipeople15、sistercities和wikipeople24数据集均为学术研究而构建,旨在探索和揭示维基百科中人物传记网络、城市间姐妹关系以及不同语言版本中文化互动等社会网络结构特征。wikipeople15数据集由Aragón P.等研究人员于2012年创建,其研究背景源于对维基百科中传记条目间链接的跨文化研究;sistercities数据集由同一研究团队于2013年构建,关注于分析城市间姐妹关系的网络结构;wikipeople24数据集则由Eom Y. H.等人在2015年完成,研究关注不同语言版本的维基百科中的人物排名及其文化交流互动。
当前挑战
这些数据集在构建过程中所面临的挑战包括:如何准确提取和表示维基百科中的人物传记网络结构,处理跨文化差异带来的链接分析难题;如何有效地收集和整理全球城市间的姐妹关系数据,以及如何量化不同语言版本维基百科中人物排名的文化互动特征。此外,数据集在解决领域问题方面也面临挑战,例如在人物传记网络分析中,如何识别和衡量文化影响力,以及在姐妹城市网络分析中,如何揭示城市间关系网络的动态变化规律。
常用场景
经典使用场景
在社会科学研究中,wikipeople15数据集以其丰富的维基人物传记资料,被广泛用于构建和分析跨文化的人物社会网络。该数据集记录了不同文化背景下人物间的关联,为研究历史人物的社会网络结构提供了重要的数据基础。
实际应用
在现实应用中,wikipeople15数据集可用于改善搜索引擎优化,为在线百科全书提供人物关系图的构建,以及为文化研究、历史学和社会学的教学提供直观的数据资源。
衍生相关工作
基于wikipeople15数据集的研究衍生出了如sistercities数据集,探讨了姐妹城市间的网络关系;以及wikipeople24数据集,分析了24种语言版本维基百科中的人物互动和文化交流,推动了跨文化网络分析领域的深入研究。
以上内容由遇见数据集搜集并总结生成



