Pleiades gazetteer datasets
收藏github2024-05-16 更新2024-05-31 收录
下载链接:
https://github.com/isawnyu/pleiades-datasets
下载链接
链接失效反馈官方服务:
资源简介:
这是一个从Pleiades古代地点地名词典中提取的数据包,用于存档和重新分发目的。它可能比https://pleiades.stoa.org上的实时数据更新较少。Pleiades是一个社区构建的地名词典和古代地点的图形,发布有关古代地点和空间的有权威的信息,提供开放许可下查找、显示和重用该信息的独特服务。
This is a data package extracted from the Pleiades ancient place name gazetteer, intended for archiving and redistribution purposes. It may be less frequently updated compared to the live data available at https://pleiades.stoa.org. Pleiades is a community-built gazetteer and graph of ancient places, providing authoritative information on ancient locations and spaces, and offering a unique service for finding, displaying, and reusing this information under an open license.
创建时间:
2018-03-07
原始信息汇总
数据集概述
基本信息
- 名称: Pleiades gazetteer datasets
- 版本: 3.2
- 发布日期: 3 November 2023
- 数据量: 40,418 place resources
更新内容
- 新增与更新: 108 new and 1,629 updated place resources.
- 实验性索引: JSON index of links extracted from Pleiades place resources to "toponym" entries in Veronique Chankowski et al. Chronique Des Fouilles En Ligne = Archaeology in Greece Online.
数据集内容
JSON格式数据
- 位置:
/data/json/ - 描述: 包含每个发布对象的完整序列化数据,每天更新。文件按URI的数字部分命名,分布在多级目录结构中。
GIS包(CSV格式)
- 位置:
/data/gis/ - 描述: 包含从_Pleiades_ gazetteer导出的CSV文件,用于地理信息系统软件。
资源描述框架(RDF)
- 位置:
/data/rdf/ - 描述: 提供所有地方、错误、作者、地方类型和时间段的摘要数据,以Turtle格式提供,每周更新。
变更日志
- 位置:
/data/changelogs/ - 描述: 包含自2009年以来的每月新旧和更新地方资源的HTML文件。
数据质量指标
- 位置:
/data/data_quality/ - 描述: 包含实验性数据质量报告,用于优先处理和组织功能改进和内容清理工作。
信用
- 位置:
/data/html/credits.html - 描述: 包含_Pleiades_ gazetteer的信用页面副本。
已弃用的CSV格式数据
- 位置:
/data/csv/ - 描述: 包含每天更新的压缩CSV文件,总结发布的位置、名称和地方。
许可证
- 类型: Creative Commons Attribution license (cc-by)
- 链接: Creative Commons Attribution 3.0
搜集汇总
数据集介绍

构建方式
Pleiades gazetteer datasets的构建方式体现了其作为古代地理信息的综合性资源库的特性。该数据集通过从Pleiades gazetteer中提取并整理古代地点、名称、位置和连接资源的数据,形成了一个完整的JSON序列化文件。每日更新后,这些数据被分割成多个独立的JSON文件,每个文件对应一个地点资源及其相关信息。为提高文件系统的处理效率,这些JSON文件被分布在多级目录结构中,使用URI的最后几位数字作为子目录名称。此外,数据集还包括CSV格式的GIS数据、RDF格式的摘要数据以及变更日志等,确保了数据的多样性和完整性。
特点
Pleiades gazetteer datasets的特点在于其数据的权威性和开放性。该数据集不仅包含了40,418个地点资源,还定期更新,反映了学术界的最新研究成果。其数据格式多样,包括JSON、CSV和RDF等,适应了不同用户的需求。此外,数据集采用了Creative Commons Attribution (CC-BY) 许可,允许用户在注明出处的前提下自由使用和分发数据。这种开放性和灵活性使得该数据集成为古代地理研究的重要工具,同时也促进了学术界的合作与共享。
使用方法
Pleiades gazetteer datasets的使用方法多样且灵活。用户可以通过GitHub下载最新版本的数据集,或通过Zenodo、NYU Archive和Internet Archive等平台获取归档版本。数据集中的JSON文件可以直接用于数据分析和可视化,而CSV文件则适合导入地理信息系统(GIS)软件进行空间分析。对于需要RDF格式的用户,可以通过Pleiades网站或GitHub获取RDF数据。此外,数据集还提供了详细的变更日志和数据质量报告,帮助用户了解数据的更新情况和质量状况。用户在使用数据时,应遵循CC-BY许可,注明数据来源,并可通过邮件向Pleiades社区报告数据重用的相关信息。
背景与挑战
背景概述
Pleiades gazetteer datasets是由一群志愿者和学术机构共同构建的古代地名 Gazetteer,旨在为古代地点和空间提供权威信息。该数据集自2006年起由美国国家人文基金会(NEH)提供持续资助,并得到了北卡罗来纳大学古代世界地图中心(AWMC)和纽约大学古代世界研究所(ISAW)的支持。Pleiades不仅服务于个人用户,还为搜索引擎和计算研究工具提供支持,推动人文学科的教学与研究。其核心研究问题在于如何通过开放许可的方式,提供高质量的古代地点信息,并促进社区参与和同行评审。
当前挑战
Pleiades gazetteer datasets在构建过程中面临多项挑战。首先,数据的质量控制是一个持续的挑战,尤其是在处理来自不同贡献者的信息时,确保数据的准确性和一致性至关重要。其次,数据格式的多样性(如JSON、CSV、RDF等)增加了数据处理的复杂性,尤其是在不同系统间的兼容性和互操作性方面。此外,随着数据量的增加,如何高效地管理和存储数据,以及如何确保数据的长期可访问性,也是该数据集面临的重大挑战。
常用场景
经典使用场景
Pleiades gazetteer datasets 在古代地理研究领域中,主要用于构建和维护一个详尽的古代地点数据库。该数据集通过提供精确的地理坐标、历史名称和相关连接资源,支持学者们进行古代地理信息的检索与分析。其经典使用场景包括但不限于:历史地理学研究、考古学定位、古代文献的地理参照以及数字人文项目中的地理信息系统(GIS)应用。
实际应用
在实际应用中,Pleiades gazetteer datasets 被广泛用于考古发掘的定位与记录、历史地图的制作与更新、以及教育资源的开发。例如,考古学家可以利用该数据集快速定位古代遗址,历史学家则可以通过其检索古代文献中的地理信息。此外,该数据集还被整合到地理信息系统(GIS)中,用于构建交互式历史地图,支持教学和公众教育。
衍生相关工作
Pleiades gazetteer datasets 的开放性和丰富性催生了许多相关研究和工作。例如,有研究者将其数据转换为GeoJSON格式,以便于在GIS软件中使用;还有学者利用其数据进行古代地理信息的可视化研究。此外,该数据集还激发了关于古代地理信息标准化和数据质量评估的研究,推动了数字人文领域的发展。
以上内容由遇见数据集搜集并总结生成



