WikiChurches
收藏arXiv2021-10-19 更新2024-06-21 收录
下载链接:
https://doi.org/10.5281/zenodo.5166986
下载链接
链接失效反馈官方服务:
资源简介:
WikiChurches数据集由弗里德里希·席勒大学耶拿分校计算机视觉组创建,包含9,485张欧洲教堂建筑的图像,标记有其建筑风格。数据来源于维基数据,旨在为建筑风格分类提供一个细粒度的基准。该数据集面临多种实际机器学习应用中的挑战,如样本量小、类别分布高度不平衡、类别间细微差别等。此外,数据集还提供了631个边界框标注,指示特定建筑风格的特征结构。WikiChurches适用于多个研究领域,如细粒度视觉识别、数据高效深度学习等,旨在解决建筑风格分类中的复杂问题。
The WikiChurches dataset was created by the Computer Vision Group of Friedrich Schiller University Jena. It consists of 9,485 images of European church buildings, annotated with their respective architectural styles. Sourced from Wikidata, this dataset is designed to provide a fine-grained benchmark for architectural style classification. It faces multiple challenges in real-world machine learning applications, such as small sample size, highly imbalanced class distribution, and subtle differences between categories. In addition, the dataset provides 631 bounding box annotations that indicate the characteristic structures of specific architectural styles. WikiChurches is applicable to multiple research fields including fine-grained visual recognition and data-efficient deep learning, aiming to solve complex problems in architectural style classification.
提供机构:
弗里德里希·席勒大学耶拿分校计算机视觉组
创建时间:
2021-08-16
搜集汇总
数据集介绍

构建方式
WikiChurches数据集的构建主要依托于Wikidata和Wikimedia Commons两个平台。研究者首先通过Wikidata的SPARQL查询接口获取了与建筑风格相关的教堂列表及其对应的图片。然后,他们从Wikimedia Commons下载了这些图片,并对图片进行了格式转换和大小调整。在数据清洗过程中,研究者移除了室内图片和不符合要求的图片,最终得到了包含9485张教堂图片的数据集。此外,研究者还邀请了艺术史专家为139座教堂的图片进行了特征结构框标注,为细粒度分类研究提供了额外的专家知识。
特点
WikiChurches数据集的特点在于它结合了多个现实世界中的挑战,包括:基于细微视觉特征的细粒度类别区分、相对较小的样本量、高度不平衡的类别分布、视角的高变异性以及标签的层次组织结构。此外,数据集还提供了631个特征结构框标注,这些标注可以用于研究细粒度分类,其中额外的专家知识对于识别具有独特对象部分的类别非常有用。
使用方法
使用WikiChurches数据集时,首先需要了解其层次化的标签结构,并根据研究需求选择合适的子集。例如,对于细粒度分类任务,可以选择包含至少20张图片的14个类别的WikiChurches-14子集。对于需要特征结构框标注的研究,可以选择包含罗马式、哥特式、文艺复兴和巴洛克式四个主要类别的WikiChurches-4子集。在使用数据集时,还需要注意标签噪声和偏差问题,并采取适当的方法进行处理。
背景与挑战
背景概述
建筑风格分类是计算机视觉领域的一项重要任务,它依赖于对建筑细节的细致观察和理解。为了推进这一领域的研究,Björn Barz和Joachim Denzler在2021年创建了一个名为WikiChurches的数据集。这个数据集包含了9,485张欧洲教堂建筑的照片,这些照片和风格标签都是从Wikipedia获取的。WikiChurches数据集不仅为建筑风格分类提供了一个基准,还包含了多个现实世界中的挑战,如基于细微视觉特征的细粒度类别区分、相对较小的样本量、高度不平衡的类别分布、视角的高变异性以及标签的层次化组织。此外,该数据集还提供了631个边界框标注,用于139座教堂的四个主要类别中的特征视觉元素,这些标注对于细粒度分类研究特别有用。
当前挑战
WikiChurches数据集面临的挑战包括:1) 解决的领域问题:建筑风格分类,这是一个需要识别细小和微妙视觉特征的挑战性任务;2) 构建过程中遇到的挑战:样本量较小、类别分布不平衡、细粒度类别区分、视角变异性高、标签噪声和标签层次结构。这些挑战使得WikiChurches数据集成为一个有用的基准和实验场所,用于研究数据高效深度学习、处理不平衡训练集和层次分类等领域。
常用场景
经典使用场景
WikiChurches 数据集被广泛应用于建筑风格分类研究,特别是在细粒度视觉识别领域。该数据集包含了 9,485 张欧洲教堂建筑图片,并标注了其建筑风格。研究者可以利用这些数据来训练和评估建筑风格分类模型,以提高模型在识别细微视觉特征方面的能力。此外,数据集中的 631 个边界框标注了 139 座教堂的标志性视觉特征,可用于研究细粒度分类中的专家知识整合。
实际应用
WikiChurches 数据集在实际应用场景中具有广泛的应用潜力。例如,它可以用于文化遗产保护,通过识别和分类建筑风格,帮助研究者更好地了解和记录历史建筑。此外,数据集还可以用于智能城市规划和旅游推荐系统,通过分析建筑风格,为用户提供更加个性化的旅游建议。最后,数据集还可以用于建筑教育和培训,帮助学生和专业人士更好地学习和理解不同建筑风格的特点。
衍生相关工作
WikiChurches 数据集衍生了多个相关的研究工作。例如,研究者可以利用数据集中的边界框标注来研究细粒度分类中的专家知识整合问题,以提高分类模型的准确率。此外,数据集还可以用于研究数据不平衡处理、鲁棒识别和层级分类等问题,为相关领域的研究提供新的思路和方法。
以上内容由遇见数据集搜集并总结生成



