iMet Collection 2019

Name: iMet Collection 2019
Creator: 谷歌研究
Published: 2019-06-04 10:37:29
License: 暂无描述

arXiv2019-06-04 更新2024-06-21 收录

下载链接：

https://www.metmuseum.org/art/collection

下载链接

链接失效反馈

官方服务：

资源简介：

iMet Collection 2019数据集是由谷歌研究和大都会艺术博物馆合作创建的，专注于细粒度的艺术品属性识别。该数据集包含155,531个样本，每个样本都附有由世界级博物馆专家审核的高质量属性标签。数据集的内容涵盖了多种艺术品，包括绘画、乐器等，数据来源于大都会艺术博物馆的开放访问项目。创建过程中，数据集的属性标签由专家和外包组织共同标注，确保了标签的准确性和多样性。该数据集主要应用于计算机视觉领域，旨在推动细粒度视觉识别技术的发展，特别是在艺术品数字化管理方面。

The iMet Collection 2019 Dataset was developed through a collaboration between Google Research and the Metropolitan Museum of Art, focusing on fine-grained artwork attribute recognition. It contains 155,531 samples, each accompanied by high-quality attribute labels reviewed by world-class museum experts. Covering diverse artwork categories including paintings, musical instruments and more, the dataset is sourced from the Metropolitan Museum of Art's Open Access program. During its construction, the attribute labels were jointly annotated by experts and outsourcing institutions, which guarantees the accuracy and diversity of the labels. This dataset is primarily utilized in the field of computer vision, with the goal of promoting the advancement of fine-grained visual recognition technologies, especially in the domain of artwork digital management.

提供机构：

谷歌研究

创建时间：

2019-06-04

搜集汇总

数据集介绍

构建方式

在数字人文与计算机视觉交叉领域，iMet Collection 2019数据集构建于纽约大都会艺术博物馆的开放访问项目之上。该数据集精选了馆藏中的主要展示图像，每幅图像均以专业摄影技术捕捉，并统一调整为短边300像素的PNG格式。标注工作融合了博物馆专家的专业知识和外包标注团队的视觉推断，涵盖文化、媒介等多个预定义领域，最终形成1103个细粒度属性标签。数据划分采用以“枢纽”属性为核心的策略，确保训练、验证与测试集在标签分布上的平衡，最终包含155,531个样本，其中训练集109,274个，验证集7,443个，测试集38,814个。

使用方法

该数据集主要用于推动细粒度视觉分类研究，特别是在多标签艺术品属性识别领域。研究者可基于训练集开发深度学习模型，利用验证集进行超参数调优，并通过测试集评估模型性能。评估采用Fβ分数（β=2），以在真实场景中平衡真阳性与假阳性。数据集最初通过Kaggle平台作为iMet Collection 2019挑战赛发布，要求参赛者在有限资源内开源模型，促进了算法透明度与资源公平性。未来，该数据集可扩展至更多语义组（如媒介、尺寸），并支持实例检测、图像描述生成及跨模态检索等应用，为数字策展与文化遗产计算提供基础。

背景与挑战

背景概述

在计算机视觉领域，细粒度视觉分类（FGVC）已成为一个日益重要的研究方向，尤其在艺术品识别这一专业领域。iMet Collection 2019数据集由谷歌研究院、大都会艺术博物馆、康奈尔大学及Arraiy公司等机构的研究人员于2019年共同创建，旨在推动艺术品细粒度属性识别的研究。该数据集基于大都会艺术博物馆的开放访问项目，收录了超过15万件艺术品的专业图像，并由博物馆专家精心标注了1103个细粒度属性标签，涵盖文化、主题、视觉元素等多个维度。其核心研究问题在于如何通过计算机视觉技术自动识别艺术品的复杂属性，从而提升数字策展的效率和精度。该数据集的发布不仅丰富了细粒度视觉分类的研究资源，也为文化遗产的数字化管理提供了重要支持，促进了艺术与技术的交叉融合。

当前挑战

iMet Collection 2019数据集面临的挑战主要体现在两个方面：首先，在领域问题层面，艺术品细粒度属性识别本身具有高度复杂性，因为艺术品属性往往涉及抽象的文化、历史和视觉语义，如宗教主题、历史事件或特定动植物符号，这要求模型具备深层次的语义理解能力，而非简单的物体分类。其次，在数据集构建过程中，研究人员遇到了数据分布不平衡的难题，即属性标签呈现长尾分布，少数热门属性（如“男性”、“女性”）样本丰富，而许多冷门属性（如“阿富汗”）仅有个别样本，这给模型训练带来了偏差风险。此外，每个样本的属性数量不均，从1到11个不等，多数样本拥有2至4个属性，这种多标签、稀疏标注的结构增加了算法设计的复杂性，需要模型在有限样本下实现精准的多标签预测。

常用场景

经典使用场景

在细粒度视觉识别领域，iMet Collection 2019数据集为艺术品属性识别提供了经典的研究平台。该数据集汇集了大都会艺术博物馆的馆藏图像，每幅作品均标注了由博物馆专家精心验证的细粒度属性标签，如文化背景、主题元素等。研究者利用这一数据集，能够训练深度学习模型以识别艺术作品中蕴含的复杂语义特征，从而推动计算机视觉算法在文化遗产数字化分析中的精度提升。

解决学术问题

该数据集主要解决了艺术品识别中细粒度属性分类的学术难题。传统方法多侧重于实例检索或粗粒度分类，而iMet Collection 2019通过提供高质量、多标签的标注数据，使模型能够学习艺术品的深层文化、主题与视觉特征。这不仅弥补了现有艺术品数据集的不足，还为细粒度视觉分类研究提供了标准化评估基准，促进了跨领域知识融合与算法创新。

实际应用

在实际应用中，iMet Collection 2019数据集支持博物馆藏品的数字化管理与智能检索。通过自动化属性标注技术，博物馆能够高效扩展其开放访问计划中的关键词标签，提升艺术资源的可发现性与导航体验。此外，该数据集还可用于开发个性化内容推荐系统，帮助公众更便捷地探索跨越五千年的艺术瑰宝，增强文化遗产的普及与教育价值。

数据集最近研究