ArtBench-10

Name: ArtBench-10
Creator: 卡内基梅隆大学
Published: 2022-06-23 06:10:18
License: 暂无描述

arXiv2022-06-23 更新2024-06-21 收录

下载链接：

https://github.com/liaopeiyuan/artbench

下载链接

链接失效反馈

官方服务：

资源简介：

ArtBench-10是由卡内基梅隆大学和加州大学伯克利分校的研究人员共同创建的一个艺术风格多样、类别平衡的高质量数据集。该数据集包含60,000张艺术品图像，涵盖10种不同的艺术风格，每种风格包含5,000张训练图像和1,000张测试图像。数据集通过严格的数据收集、标注、过滤和预处理流程创建，确保图像质量和标签的准确性。ArtBench-10适用于评估和比较不同艺术风格生成模型的性能，为艺术生成领域的研究提供了一个标准化的基准。

ArtBench-10 is a high-quality, class-balanced dataset featuring diverse art styles, jointly created by researchers from Carnegie Mellon University and the University of California, Berkeley. It contains 60,000 artwork images covering 10 distinct art styles, with 5,000 training images and 1,000 test images for each style. The dataset is constructed through rigorous data collection, annotation, filtering and preprocessing pipelines, ensuring the quality of images and the accuracy of its labels. ArtBench-10 is suitable for evaluating and comparing the performance of different art style generation models, providing a standardized benchmark for research in the field of art generation.

提供机构：

卡内基梅隆大学

创建时间：

2022-06-23

搜集汇总

数据集介绍

构建方式

ArtBench-10的构建始于从Ukiyo-e.org、WikiArt.org及Surrealism.website三个遵循合理使用许可的在线数据库采集原始图像。随后，依据WikiArt中频次最高的十种艺术风格进行标注与筛选，并将单一风格数据库中的图像直接归入对应类别。通过感知哈希技术剔除近重复图像，并过滤低分辨率或极端宽高比的低质量样本。为达成类别均衡与艺术家多样性，采用基于艺术家作品频次倒数的加权采样策略，从约27万张非重复图像中为每种风格抽取6000张，最终经人工审查替换低质样本后，随机划分为每类5000张训练集与1000张测试集。数据集提供32×32、256×256及原始尺寸三种分辨率版本，分别采用CIFAR、ImageFolder与LSUN格式存储，便于集成至主流深度学习框架。

使用方法

ArtBench-10专为无条件与类别条件图像合成任务的基准测试而设计。使用者可根据实验需求选择32×32、256×256或原始尺寸版本，并通过PyTorch或TensorFlow的标准数据加载器直接加载。该数据集支持训练与评估多种生成模型，包括生成对抗网络、变分自编码器及扩散模型，并提供了FID、IS、Precision/Recall及KID等常用指标的基准结果。此外，数据集附带的元数据包含艺术家名称、图像尺寸及公共领域标识，可用于细粒度分析。研究者需遵循合理使用许可，并注意数据集偏向欧洲、北美及东亚艺术的局限性，未来版本计划扩展地理与时间覆盖范围以提升多样性。

背景与挑战

背景概述

在生成式模型领域，标准化的基准数据集对于系统评估模型性能至关重要。然而，现有的图像合成基准如CIFAR-10、ImageNet和LSUN主要侧重于真实场景或物体的照片，缺乏专门针对艺术作品的标准化评估平台。为填补这一空白，来自卡内基梅隆大学和加州大学伯克利分校的研究人员于2022年提出了ArtBench-10数据集。该数据集由Peiyuan Liao、Xiuyu Li、Xihui Liu和Kurt Keutzer共同创建，包含60,000幅来自10种鲜明艺术风格的高质量艺术作品图像，每类风格包含5,000张训练图像和1,000张测试图像。ArtBench-10是首个类别平衡、标注干净且经过标准化流程构建的艺术作品生成基准，其标准化数据收集、标注、过滤和预处理流程显著提升了数据质量，为生成式模型在艺术领域的研究提供了可靠支撑，对计算艺术史、计算创造力及人机交互等方向产生了深远影响。

当前挑战

ArtBench-10面临的核心挑战源于其旨在解决的领域问题及构建过程中的技术难点。在领域层面，现有艺术作品数据集普遍存在长尾类别分布、标签噪声、图像质量参差不齐及重复样本等问题，导致难以公平评估生成模型在各艺术风格上的表现，且缺乏对生成多样性和质量的系统性度量。在构建过程中，挑战尤为突出：首先，从WikiArt等来源收集的原始数据存在严重的类别不平衡和艺术家分布长尾现象，需设计加权采样策略以平衡类别与艺术家多样性；其次，数据中存在大量语义近似重复图像，需采用感知哈希算法进行精确去重；此外，还需过滤低分辨率或极端宽高比的低质量图像，并统一标准化预处理流程（如中心裁剪和Robidoux重采样），以消除缩放伪影。这些步骤共同构成了一个复杂且高成本的流水线，确保最终数据集的高质量与可靠性。

常用场景

经典使用场景

在艺术与人工智能的交叉领域中，ArtBench-10作为首个类别均衡、高质量、标注清晰且标准化的艺术图像生成基准数据集，其最经典的使用场景在于评估和对比各类生成模型在艺术风格图像合成任务上的表现。研究者可基于该数据集对生成对抗网络（GAN）、变分自编码器（VAE）及扩散模型等代表性方法进行无条件或类别条件生成训练，并通过Inception Score、Fréchet Inception Distance等指标量化分析模型在不同分辨率下的生成质量与多样性，从而推动艺术生成领域的标准化评测。

解决学术问题

此前艺术图像数据集普遍存在类别分布长尾、标签噪声高、图像质量参差及预处理流程非标准化等问题，严重制约了生成模型的公正评估与可复现研究。ArtBench-10通过精心设计的标准化数据采集、标注、去重与平衡采样流程，系统性地解决了上述困境，为学术社区提供了首个兼顾类别平衡、艺术家多样性与高标注纯净度的艺术生成基准。该数据集不仅填补了现有图像合成基准（如CIFAR-10、ImageNet）缺乏艺术领域专门评测的空白，更推动了生成模型在风格化创作、计算艺术史及人机交互等交叉研究方向上的严谨实证分析。

实际应用

在实际应用中，ArtBench-10为数字艺术创作工具、智能设计辅助系统及文化遗产数字化保护提供了关键的训练与评测资源。例如，基于该数据集训练的生成模型可辅助艺术家或设计师快速生成特定风格（如印象派、浮世绘、超现实主义）的灵感草图，降低创作门槛；同时，博物馆与美术馆可借助这些模型对馆藏作品进行风格迁移、虚拟修复或互动展示，丰富观众的审美体验。此外，该数据集还可用于开发面向艺术教育领域的风格识别与自动标注工具，提升艺术史研究的数字化效率。

数据集最近研究