Livingwithmachines/MapReader_Data_SIGSPATIAL_2022
收藏Hugging Face2023-05-11 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/Livingwithmachines/MapReader_Data_SIGSPATIAL_2022
下载链接
链接失效反馈官方服务:
资源简介:
该数据集主要用于人文学科研究,特别是基于历史地图扫描和元数据的分析。数据集包含了来自英国国家图书馆的19世纪英国地图,涵盖了1888年至1913年的英格兰、威尔士和苏格兰地区。数据集中的标注和输出反映了与历史研究相关的标签任务,特别是与铁路基础设施和建筑物的识别相关。数据集的结构包括标注和输出目录,标注目录中包含了地图切片和对应的标签,输出目录中包含了模型预测结果和相关统计数据。
提供机构:
Livingwithmachines
原始信息汇总
数据集概述
数据集名称: MapReader Data SIGSPATIAL 2022
语言: 英语 (en)
许可证: CC-BY-NC-SA-4.0
大小: 10K<n<100K
标签:
- maps
- historical
- National Library of Scotland
- heritage
- humanities
- lam
任务类别:
- image-classification
任务ID:
- multi-class-image-classification
数据集内容
数据来源
- 数据源自19世纪英国由Ordnance Survey制作的1888至1913年的地图,覆盖英格兰、威尔士和苏格兰。
目录结构
- annotations: 包含地图图像、切片图像及其对应的标注文件。
- maps: 包含从National Library of Scotland获取的地图图像。
- slice_meters_100_100: 包含100m x 100m的地图切片,用于训练、验证和测试。
- train.csv, valid.csv, test.csv: 包含训练、验证和测试集的标注信息。
- outputs: 包含模型的输出结果和相关资源。
- label_01_03, label_02: 包含不同类别的预测结果。
- patches_all.csv: 包含所有切片的预测结果。
- percentage: 包含与铁路和车站相关的统计信息。
- resources: 包含额外的资源文件,如StopsGB数据和地图元数据。
标注信息
- image_id: 图像路径,包含切片存储位置和切片ID。
- label: 标注,包括0(无建筑或铁路空间)、1(铁路空间)、2(建筑)、3(铁路空间和非铁路空间建筑)。
输出文件
- pred_01_03_all.csv, pred_02_all.csv: 包含所有切片的预测结果。
- pred_01_03_keep_01_0250.csv, pred_02_keep_01_0250.csv: 移除了与同一标签的邻近切片距离超过250米的切片。
- pred_01_03_keep_05_0500.csv, pred_02_keep_05_0500.csv: 移除了与同一标签的邻近切片少于五个且距离超过500米的切片。
- pred_01_03_keep_10_1000.csv, pred_02_keep_10_1000.csv: 移除了与同一标签的邻近切片少于十个且距离超过1000米的切片。
数据集创建
- 数据访问: 通过National Library of Scotland的历史地图API获取。
- 标注过程: 使用MapReader自定义的标注界面进行标注,遵循特定的标注指南。
- 标注者: Kasra Hosseini和Katherine McDonough,以及Living with Machines研究团队的早期贡献者。
使用条款
- MapReader输出: 根据CC-BY-NC-SA-4.0许可证共享。
- 数字化地图: 非商业用途下根据CC-BY-NC-SA-4.0许可证使用。



