Cadasym

github2024-04-10 更新2024-05-31 收录

下载链接：

https://github.com/brawer/cadasym

下载链接

链接失效反馈

官方服务：

资源简介：

Cadasym是一个用于计算机视觉研究的图像语料库，专注于瑞士地籍图中的符号。该数据集的图像来源于地籍变更计划，旨在通过分析历史档案来重建建筑物随时间的发展。

Cadasym is an image corpus designed for computer vision research, focusing on symbols found in Swiss cadastral maps. The images in this dataset are sourced from cadastral change plans, aiming to reconstruct the development of buildings over time through the analysis of historical archives.

创建时间：

2024-03-27

原始信息汇总

数据集概述

背景

数据集来源于瑞士的地产变更计划图，主要用于分析建筑随时间的发展变化，目前所有图像均来自苏黎世市的地产变更计划。

目的

用于测试、评估和训练计算机视觉系统，特别是符号识别任务，适合用于训练卷积神经网络或传统算法。

数据构建

通过自定义的桌面应用程序从扫描的计划中提取图像片段，并由人工用户手动分类。

数据下载

数据集可通过GitHub的发布页面下载，包含ZIP文件。

数据结构

数据集包含256x256像素的PNG图像，符号位于图像中心。图像分为以下类别：
- white_circle
- double_white_circle
- black_dot
- double_black_circle
- small_cross
- large_cross
- triangle
- other

许可

数据集采用公共领域（CC0-1.0）许可，无版权限制。

搜集汇总

数据集介绍

构建方式

Cadasym数据集的构建基于对瑞士地籍图中的符号进行提取与分类。研究团队开发了一款专门的桌面应用程序，用于从扫描的地籍变更图中提取图像片段。随后，通过人工手动分类，将这些图像片段归类为不同的符号类别，如白色圆圈、黑色圆点、小十字等。这一过程确保了数据集的准确性和多样性，为后续的计算机视觉任务提供了高质量的训练和测试数据。

使用方法

Cadasym数据集适用于计算机视觉领域的符号识别任务，尤其适合用于训练卷积神经网络或传统算法。用户可通过GitHub页面下载包含PNG格式图像的ZIP文件，并根据提供的分类目录进行数据加载和处理。数据集的结构清晰，便于用户快速上手，适用于测试、评估和训练多种计算机视觉模型，为地籍图符号识别提供了可靠的数据支持。

背景与挑战

背景概述

Cadasym数据集专注于计算机视觉在地籍图符号识别中的应用，由瑞士苏黎世市提供的历史地籍变更计划图像构建而成。该数据集的创建旨在通过分析这些历史图像，重现建筑物随时间演变的历史。Cadasym数据集的构建始于对纸质地籍图的数字化处理，并利用专门的桌面应用程序提取图像片段，由人工进行分类。这一数据集的开发不仅为计算机视觉系统提供了宝贵的训练和测试资源，还为研究地籍图符号识别提供了新的视角，对地理信息系统和历史建筑研究领域具有重要意义。

当前挑战

Cadasym数据集面临的挑战主要集中在符号识别的复杂性上。由于图像中符号周围可能存在其他符号或线条的重叠，这增加了符号识别的难度。此外，不同地区可能使用不同的扫描设备，导致图像质量不一致，进一步增加了数据处理的复杂性。数据集的构建过程中，人工分类的准确性和效率也是一大挑战，尤其是在处理大量图像时。未来，数据集可能需要进一步细分符号类别，并增加更多类别以提高模型的泛化能力，这些都为研究者提出了新的技术难题。

常用场景

经典使用场景

Cadasym数据集在计算机视觉领域中，主要用于符号识别任务。其经典使用场景包括训练和评估卷积神经网络（CNN）以识别地籍图中的各种符号，如白色圆圈、黑色点、小十字等。由于这些符号在地籍图中常与其他符号或线条重叠，数据集的复杂性为模型提供了丰富的训练环境，使其能够应对实际应用中的多样性和复杂性。

解决学术问题

Cadasym数据集解决了计算机视觉领域中符号识别的学术难题。通过提供高质量的、经过人工分类的地籍图符号图像，该数据集为研究人员提供了一个标准化的测试平台，用于评估和比较不同符号识别算法的性能。这不仅推动了计算机视觉技术在地籍图分析中的应用，还为历史地籍图的数字化和分析提供了技术支持，具有重要的学术价值。

实际应用

在实际应用中，Cadasym数据集可用于自动化地籍图的符号识别和分类，从而加速地籍数据的数字化进程。例如，在瑞士，地籍图的更新和维护是一个复杂且耗时的过程，通过使用该数据集训练的模型，可以自动识别和分类地籍图中的符号，减少人工干预，提高工作效率。此外，该数据集还可应用于历史地籍图的分析，帮助重建建筑物和地块的历史演变过程。

数据集最近研究