Behance Artistic Media Dataset

Name: Behance Artistic Media Dataset
Creator: Adobe Research 和 Cornell Tech
Published: 2017-07-09 10:48:53
License: 暂无描述

arXiv2017-07-09 更新2024-06-21 收录

下载链接：

https://bam-dataset.org/

下载链接

链接失效反馈

官方服务：

资源简介：

Behance Artistic Media Dataset（BAM）是由Adobe Research和Cornell Tech联合创建的大规模数据集，包含近6500万张来自Behance网站的当代艺术作品图像。该数据集通过丰富的属性标签对内容、情感和艺术媒介进行标注，旨在提高机器对非摄影图像的识别能力，并推动艺术风格预测、对象分类器泛化及视觉域适应等领域的研究。BAM数据集不仅涵盖了广泛的艺术风格和媒介，还关注情感表达，为研究者提供了一个研究艺术图像及其相关问题的坚实基础。

The Behance Artistic Media Dataset (BAM) is a large-scale dataset jointly created by Adobe Research and Cornell Tech. It contains nearly 65 million contemporary artwork images sourced from the Behance website. The dataset uses rich attribute tags to annotate content, emotion and artistic media, with the aim of improving machine recognition capabilities for non-photographic images and advancing research in fields such as artistic style prediction, generalization of object classifiers and visual domain adaptation. The BAM dataset covers a wide range of artistic styles and media, while also focusing on emotional expression, providing researchers with a solid foundation for studying artistic images and their related research topics.

提供机构：

Adobe Research 和 Cornell Tech

创建时间：

2017-04-27

搜集汇总

数据集介绍

构建方式

在当代艺术图像分析领域，构建大规模标注数据集面临艺术表现多样性与标注成本的双重挑战。Behance Artistic Media Dataset 采用人机协同的迭代标注流程，从 Behance 艺术社区采集约 6500 万张图像。首先，研究团队依据艺术媒介、情感表达与基础物体类别三个维度，定义了 20 个二元属性标签。随后，通过亚马逊 Mechanical Turk 平台进行众包标注，仅采纳两位标注者一致同意的结果以确保质量。标注过程中，采用基于深度学习的分类器（如 ResNet-50 与 StyleNet）对未标注图像进行评分，筛选出分类置信度模糊的样本交由人工复审。经过四轮迭代训练与阈值优化，最终以 90.4% 的平均精度构建了涵盖多种艺术风格的大规模数据集。

特点

该数据集的核心特点在于其规模宏大与标注维度的多元性。相较于传统摄影数据集，它涵盖了油画、素描、矢量艺术、3D 渲染等七种艺术媒介，以及平静、欢快、悲伤、恐惧四种情感标签，同时包含自行车、鸟类、建筑等九种基础物体类别。这种多维度标注体系能够捕捉艺术创作中内容、形式与情感的交织关系。数据集的图像源自 Behance 专业艺术家的作品集，代表了当代数字艺术的广泛风貌，而非局限于古典艺术或日常摄影。其标注质量经过严格验证，通过人工复审与阈值控制，确保了标签的可靠性与一致性，为跨媒介视觉表征研究提供了丰富素材。

使用方法

该数据集主要应用于艺术图像分析与跨域视觉理解研究。在物体识别方面，可用于评估与提升模型对艺术化渲染物体的检测能力，通过比较在 ImageNet 等摄影数据集上训练的模型与在本数据集上微调的模型性能，揭示视觉表征的领域差异。在风格迁移与域适应研究中，可利用其多媒介标注探究不同艺术风格间的知识迁移规律，例如训练于素描媒介的物体分类器在油画媒介上的泛化表现。此外，情感与媒介标签支持艺术风格分类、美学质量预测等任务，通过训练多任务联合模型，可同时预测图像的内容、情感与媒介属性。数据集还可用于视觉子空间学习，构建分离的内容、情感与媒介特征空间，实现基于特定属性的图像检索与生成。

背景与挑战

背景概述

在计算机视觉领域，传统研究多聚焦于日常摄影图像的识别与分析，然而艺术创作往往呈现出与真实世界迥异的视觉表达，这为机器理解带来了显著挑战。Behance Artistic Media Dataset（BAM）由Adobe Research、Cornell Tech等机构的研究人员于2017年创建，旨在填补当代艺术图像大规模标注数据的空白。该数据集从Behance艺术平台采集了约6500万张图像，并标注了内容、情感与艺术媒介等多维度属性，核心研究问题在于探索如何使计算机视觉模型超越摄影范畴，有效识别与分类多样化艺术表现形式。BAM的建立为艺术风格预测、对象识别泛化及视觉域适应研究提供了重要基础，推动了跨媒体视觉理解的发展。

当前挑战

该数据集致力于解决艺术图像分类与理解中的核心挑战，即如何使模型在非写实性艺术媒介中准确识别对象、情感与风格，弥合摄影图像与艺术创作之间的表征鸿沟。在构建过程中，面临多重困难：首先，Behance平台用户标签噪声显著，项目级标注无法精确对应单张图像，直接利用标签训练会导致分类器精度低下；其次，大规模艺术图像标注需平衡标注成本与质量，研究者采用人机协同迭代策略，通过深度学习模型放大人工标注效能，并设定90%的精度阈值以确保标注可靠性。此外，定义涵盖当代艺术多样性的分类词汇、处理艺术风格的高类内差异，以及在不同媒介间实现有效的域适应，均是构建过程中的关键难点。

常用场景

经典使用场景

在计算机视觉领域，Behance Artistic Media Dataset（BAM）为研究艺术图像识别提供了经典场景。该数据集通过标注内容、情感和艺术媒介等多维度属性，成为探索非写实性当代艺术作品分类与理解的基准平台。研究者利用其大规模图像资源，系统分析艺术风格与摄影图像之间的表征差异，推动视觉模型在多样化艺术表现形式上的泛化能力。

衍生相关工作

围绕该数据集衍生出多项经典研究工作。在域适应领域，学者利用其多媒介标注探究艺术风格间的知识迁移机制；情感计算研究则基于情感标签开发视觉情感识别模型。此外，联合属性模型（JAM）的提出实现了多属性协同预测，而视觉子空间学习方法则启发了面向艺术图像的特征解耦研究。这些工作共同推动了艺术计算与跨模态理解的技术发展。

数据集最近研究