five

Livingwithmachines/MapReader_Data_SIGSPATIAL_2022

收藏
Hugging Face2023-05-11 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/Livingwithmachines/MapReader_Data_SIGSPATIAL_2022
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集主要用于人文学科研究,特别是基于历史地图扫描和元数据的分析。数据集包含了来自英国国家图书馆的19世纪英国地图,涵盖了1888年至1913年的英格兰、威尔士和苏格兰地区。数据集中的标注和输出反映了与历史研究相关的标签任务,特别是与铁路基础设施和建筑物的识别相关。数据集的结构包括标注和输出目录,标注目录中包含了地图切片和对应的标签,输出目录中包含了模型预测结果和相关统计数据。
提供机构:
Livingwithmachines
原始信息汇总

数据集概述

数据集名称: MapReader Data SIGSPATIAL 2022

语言: 英语 (en)

许可证: CC-BY-NC-SA-4.0

大小: 10K<n<100K

标签:

  • maps
  • historical
  • National Library of Scotland
  • heritage
  • humanities
  • lam

任务类别:

  • image-classification

任务ID:

  • multi-class-image-classification

数据集内容

数据来源

  • 数据源自19世纪英国由Ordnance Survey制作的1888至1913年的地图,覆盖英格兰、威尔士和苏格兰。

目录结构

  • annotations: 包含地图图像、切片图像及其对应的标注文件。
    • maps: 包含从National Library of Scotland获取的地图图像。
    • slice_meters_100_100: 包含100m x 100m的地图切片,用于训练、验证和测试。
    • train.csv, valid.csv, test.csv: 包含训练、验证和测试集的标注信息。
  • outputs: 包含模型的输出结果和相关资源。
    • label_01_03, label_02: 包含不同类别的预测结果。
    • patches_all.csv: 包含所有切片的预测结果。
    • percentage: 包含与铁路和车站相关的统计信息。
    • resources: 包含额外的资源文件,如StopsGB数据和地图元数据。

标注信息

  • image_id: 图像路径,包含切片存储位置和切片ID。
  • label: 标注,包括0(无建筑或铁路空间)、1(铁路空间)、2(建筑)、3(铁路空间和非铁路空间建筑)。

输出文件

  • pred_01_03_all.csv, pred_02_all.csv: 包含所有切片的预测结果。
  • pred_01_03_keep_01_0250.csv, pred_02_keep_01_0250.csv: 移除了与同一标签的邻近切片距离超过250米的切片。
  • pred_01_03_keep_05_0500.csv, pred_02_keep_05_0500.csv: 移除了与同一标签的邻近切片少于五个且距离超过500米的切片。
  • pred_01_03_keep_10_1000.csv, pred_02_keep_10_1000.csv: 移除了与同一标签的邻近切片少于十个且距离超过1000米的切片。

数据集创建

  • 数据访问: 通过National Library of Scotland的历史地图API获取。
  • 标注过程: 使用MapReader自定义的标注界面进行标注,遵循特定的标注指南。
  • 标注者: Kasra Hosseini和Katherine McDonough,以及Living with Machines研究团队的早期贡献者。

使用条款

  • MapReader输出: 根据CC-BY-NC-SA-4.0许可证共享。
  • 数字化地图: 非商业用途下根据CC-BY-NC-SA-4.0许可证使用。
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作