NGonthier/IconArt
收藏Hugging Face2024-04-18 更新2024-04-19 收录
下载链接:
https://hf-mirror.com/datasets/NGonthier/IconArt
下载链接
链接失效反馈官方服务:
资源简介:
IconArt数据集旨在评估绘画中的弱监督目标检测方法。该数据集包含5955张图像,其中训练集2978张,测试集2977张。测试集中的1480张图像标注了10个视觉类别的边界框,类别包括‘angel’、‘beard’、‘capital’、‘Child_Jesus’、‘crucifixion_of_Jesus’、‘Mary’、‘nudity’、‘ruins’、‘Saint_Sebastien’和‘turban’。大多数方法仅在最简单的7个类别上进行评估。数据集包含三个文件夹:JPEGImages存储JPEG图像,Annotations存储PASCAL VOC格式的边界框标注,ImageSets/Main包含训练集和测试集的图像名称列表以及每张图像的类别信息。
The IconArt dataset is designed to evaluate weakly-supervised object detection methods for paintings. It contains a total of 5955 images, with 2978 samples in the training set and 2977 in the test set. A total of 1480 images in the test set are annotated with bounding boxes covering 10 visual categories, namely 'angel', 'beard', 'capital', 'Child_Jesus', 'crucifixion_of_Jesus', 'Mary', 'nudity', 'ruins', 'Saint_Sebastien', and 'turban'. Most existing methods only perform evaluations on the simplest 7 categories. The dataset consists of three folders: JPEGImages stores JPEG-format images, Annotations stores bounding box annotations in PASCAL VOC format, and ImageSets/Main contains the image name lists for both the training and test sets as well as the category information for each image.
提供机构:
NGonthier
原始信息汇总
数据集概述
名称: IconArt
许可: Apache-2.0
任务类别: 对象检测
标签: 艺术
大小类别: 1K<n<10K
数据集描述:
- 来源: 包含5955张图像,来源于WikiCommons。
- 分割: 训练集包含2978张图像,测试集包含2977张图像。其中,1480张测试图像带有边界框标注。
- 类别: 包含10个视觉类别,包括‘angel’,‘beard’,‘capital’,‘Child_Jesus’,‘crucifixion_of_Jesus’,‘Mary’,‘nudity’,‘ruins’,‘Saint_Sebastien’,‘turban’。
- 评估: 多数方法仅评估7个最简单的类别。
文件结构:
- JPEGImages: 包含JPEG格式的图像。
- Annotations: 包含边界框信息,格式为PASCAL VOC模板(XML文件)。
- ImageSets/Main: 包含三个文件:
train.txt: 列出训练集图像名称。test.txt: 列出带有实例级标注的测试图像名称。IconArt_v2.csv: 包含每张图像的类别信息(0或1),以及是否属于训练集或测试集,以及是否有关联的边界框标注。
引用:
@InProceedings{Gonthier_2018_ECCV_Workshops, author = {Gonthier, Nicolas and Gousseau, Yann and Ladjal, Said and Bonfait, Olivier}, title = {Weakly Supervised Object Detection in Artworks}, booktitle = {Proceedings of the European Conference on Computer Vision (ECCV) Workshops}, month = {September}, year = {2018} }
搜集汇总
数据集介绍

构建方式
在艺术图像分析领域,IconArt数据集的构建体现了对弱监督学习范式的精心设计。该数据集从WikiCommons平台精选了5955幅艺术画作图像,划分为包含2978幅图像的训练集与2977幅图像的测试集。其中,测试集内的1480幅图像经过精细标注,涵盖了‘天使’、‘胡须’、‘柱头’等十个视觉类别的边界框。标注格式遵循PASCAL VOC标准,以XML文件存储,同时通过CSV文件提供图像级别的类别标签及划分信息,为弱监督目标检测任务提供了结构化的评估基础。
使用方法
使用IconArt数据集时,研究者可依据其提供的结构化目录进行操作。JPEGImages文件夹存储所有图像文件,Annotations文件夹则包含PASCAL VOC格式的边界框标注。ImageSets/Main中的文本文件明确了训练集与测试集的划分,而CSV文件则提供了每幅图像的类别存在性标签及标注状态。典型工作流程包括:利用训练集图像及其图像级别标签进行弱监督模型训练;随后在带有边界框标注的测试子集上评估检测性能。该数据集可直接支持基于深度学习的弱监督目标检测算法的开发与比较。
背景与挑战
背景概述
在计算机视觉与数字人文的交叉领域,艺术图像分析长期面临标注数据稀缺的困境。IconArt数据集由Nicolas Gonthier等学者于2018年提出,依托巴黎高等电信学院等机构,旨在推动弱监督目标检测技术在绘画作品中的应用。该数据集收录了近六千幅来自WikiCommons的艺术图像,聚焦‘天使’、‘圣母’等十类宗教与历史主题视觉元素,为核心研究问题——如何在有限标注下实现艺术图像中的目标定位——提供了基准测试平台。其诞生不仅填补了艺术领域弱监督检测的数据空白,更为文化遗产的数字化解析奠定了方法论基础。
当前挑战
IconArt数据集所应对的领域挑战,在于艺术作品中目标检测的独特复杂性:绘画风格的多样性、象征性表现与透视变形使得传统自然图像检测模型泛化能力显著下降。构建过程中的挑战则体现在多维度:一是数据标注需依赖艺术史专家知识,成本高昂且主观性强;二是原始图像来源分散,需统一处理尺寸、光照与版权问题;三是弱监督设定下,仅部分测试集具备边界框标注,加剧了模型评估的不确定性。这些挑战共同凸显了艺术视觉分析中数据稀缺与语义歧义并存的深层难题。
常用场景
经典使用场景
在艺术图像分析领域,IconArt数据集为弱监督目标检测方法提供了关键评估基准。该数据集专注于绘画作品中的特定视觉类别识别,如‘天使’、‘圣母玛利亚’、‘废墟’等,其经典使用场景在于训练模型仅利用图像级标签(即是否存在某类别)来定位画作中的目标对象,从而克服艺术图像中标注稀缺的挑战。研究者通过该数据集能够系统评估模型在复杂艺术风格下的泛化能力,推动计算机视觉与数字人文的交叉融合。
解决学术问题
IconArt数据集主要解决了艺术领域中弱监督目标检测的核心学术问题。传统全监督方法依赖大量精确边界框标注,而艺术图像标注成本高昂且主观性强。该数据集通过提供部分边界框注释和图像级标签,使研究者能够探索如何在有限监督下准确识别绘画中的象征性元素。这不仅促进了弱监督学习理论的发展,还为艺术史研究提供了自动化分析工具,有助于量化视觉主题的演变规律。
实际应用
在实际应用层面,IconArt数据集支撑了多项文化遗产数字化项目。博物馆和艺术档案馆可利用基于该数据集训练的模型,自动索引海量绘画中的宗教符号、人物服饰或建筑特征,大幅提升艺术品的检索与分类效率。此外,该技术还能辅助艺术教育平台,为学生提供交互式视觉分析,或帮助修复专家识别画作中的结构性元素。这些应用推动了艺术资源的智能化管理,使公众更易接触和理解人类视觉遗产。
数据集最近研究
最新研究方向
在艺术图像分析领域,IconArt数据集作为弱监督目标检测的关键基准,持续推动着计算机视觉与文化遗产数字化的交叉研究。当前前沿聚焦于利用弱监督学习技术,仅依赖图像级标签训练模型以精准定位画作中的特定类别对象,如‘天使’、‘圣母’等,这有效应对了艺术数据标注成本高昂的挑战。相关研究热点包括探索跨域适应方法,以提升模型从自然图像到艺术风格的泛化能力,并融合注意力机制与上下文建模,增强对复杂艺术构图的理解。这些进展不仅深化了对艺术史视觉元素的自动化分析,也为博物馆数字化存档与交互式展览提供了技术支撑,具有显著的学术与应用价值。
以上内容由遇见数据集搜集并总结生成



