EmoArt
收藏arXiv2025-06-04 更新2025-06-06 收录
下载链接:
https://zhiliangzhang.github.io/EmoArt-130k/
下载链接
链接失效反馈官方服务:
资源简介:
EmoArt是一个大规模的多维度情绪感知艺术数据集,包含132,664幅跨越56种绘画风格(如印象派、表现主义、抽象艺术)的艺术作品,提供了丰富的风格和文化多样性。每个图像都包括结构化注释:客观场景描述、五个关键视觉属性(笔触、构图、颜色、线条、光线)、二元唤醒-效价标签、十二种情绪类别以及潜在的艺术治疗效果。EmoArt旨在支持情绪驱动的图像合成,推动情感计算、多模态学习和计算艺术等领域的发展,使艺术疗法和创意设计等应用成为可能。
EmoArt is a large-scale, multi-dimensional emotion-aware art dataset. It comprises 132,664 artworks spanning 56 painting styles including Impressionism, Expressionism, and Abstract Art, and features rich stylistic and cultural diversity. Each image is equipped with structured annotations: objective scene descriptions, five core visual attributes (brushstrokes, composition, color, lines, lighting), binary arousal-valence labels, twelve emotion categories, and potential art therapeutic effects. EmoArt aims to support emotion-driven image synthesis, promote the development of disciplines such as affective computing, multimodal learning, and computational art, and enable applications including art therapy and creative design.
提供机构:
吉林大学
创建时间:
2025-06-04
原始信息汇总
EmoArt Dataset 概述
数据集基本信息
- 名称: EmoArt
- 规模: 超过132,000件艺术作品
- 艺术风格: 56种
- 情感维度: 12种代表性情感
- 视觉属性: 5种(笔触、构图、色彩、线条、光线)
数据集亮点
- 全面收集: 涵盖从文艺复兴到当代运动的西方和东方传统艺术作品
- 丰富标注: 由GPT-4o生成多维标注,人类验证一致率超过85%
- 情感维度: 涵盖完整的效价-唤醒空间,支持可解释分类
- 视觉分析: 提供五种艺术元素的结构化分析
基准测试结果
评估了最先进的文本到图像扩散模型在EmoArt数据集上的表现:
| 模型 | 整体质量 | 情感对齐 | 色彩 | 构图 | FID ↓ |
|---|---|---|---|---|---|
| FLUX.1-dev-lora | 0.6604 | 0.6698 | 0.6974 | 0.6698 | 31.65 |
| PixArt-sigma | 0.6505 | 0.6342 | 0.6746 | 0.6342 | 36.64 |
| Playground | 0.6486 | 0.6247 | 0.6788 | 0.6247 | 42.57 |
| SD3.5 | 4.35 | 0.6324 | 0.342 | 0.4324 | 37.96 |
| FLUX.1-dev | 0.6392 | 0.645 | 0.6503 | 0.645 | 21.29 |
关键应用领域
- 情感感知生成: 训练模型生成具有特定情感表达和艺术风格的图像
- 情感计算: 推动情感识别、情感分析和计算心理学研究
- 艺术治疗: 支持AI辅助的艺术生成和分析在心理健康干预中的应用
- 创意设计: 实现风格保持生成的新型人机协作艺术创作
艺术风格分布(部分)
- 印象派: 15,295件
- 现实主义: 12,847件
- 表现主义: 10,039件
- 抽象艺术: 8,756件
- 浪漫主义: 7,892件
- 中国画: 4,156件
- 浮世绘: 3,689件
- 超现实主义: 4,432件
- 立体主义: 3,024件
- 波普艺术: 2,891件
- 野兽派: 2,456件
- 其他45种风格: 完整多样性
详细情感分析示例(部分艺术风格)
| 艺术风格 | 条目数 | 唤醒水平 | 效价 | 主导情感 |
|---|---|---|---|---|
| 抽象艺术 | 1,759 | 高:51.45%, 低:48.55% | 正:93.46%, 负:6.54% | 兴奋:46.79%, 平静:38.54% |
| 抽象表现主义 | 3,674 | 高:58.74%, 低:41.26% | 正:85.74%, 负:14.26% | 兴奋:47.09%, 平静:31.33% |
| 学院派 | 3,693 | 高:11.72%, 低:88.28% | 正:90.74%, 负:9.26% | 平静:60.57%, 满足:23.67% |
| 原生艺术 | 399 | 高:62.41%, 低:37.59% | 正:69.67%, 负:30.33% | 兴奋:38.60%, 平静:22.56% |
| 装饰艺术 | 570 | 高:27.02%, 低:72.98% | 正:92.98%, 负:7.02% | 平静:57.54%, 兴奋:21.23% |
搜集汇总
数据集介绍

构建方式
EmoArt数据集的构建过程体现了严谨的学术态度与跨学科研究方法。研究团队从WikiArt、大都会艺术博物馆等权威艺术平台收集了超过20万件涵盖56种艺术风格的作品,通过四层过滤机制确保数据质量:艺术形式筛选保留纯绘画作品,内容安全过滤剔除不当内容,图像质量筛选保证分辨率,类别平衡处理维持风格分布均衡。创新性地采用GPT-4o作为核心标注引擎,通过多轮生成-验证流程,为每幅作品建立包含内容描述、五大视觉属性、二元唤醒-效价标签、12种情感分类及艺术治疗潜力在内的五维标注体系,最后经5600幅样本的人工验证显示标注一致性超过91%。
特点
作为当前最全面的情感标注艺术数据集,EmoArt展现出三大核心特征:其规模优势体现在13.2万件跨越东西方艺术史的高质量作品;标注深度首创性地融合了艺术心理学维度,特别是对笔触、构图等五大视觉属性的结构化标注;文化多样性覆盖从古典主义到新波普艺术的56种风格,其中东方精神主题作品占比达17.3%,为跨文化情感研究提供独特素材。数据统计分析显示,71.33%的作品呈现低唤醒-正效价特征,与中国工笔画等东方艺术99.76%的平静特质形成有趣对比,而表现主义等现代流派则呈现28.99%的负面情感分布。
使用方法
该数据集为情感感知图像生成研究提供了标准化实验范式。研究者可采用两种典型应用路径:基于描述-情感联合提示的生成评估,如输入"表现主义+高唤醒+负效价+扭曲人脸"的结构化指令;或利用视觉属性-情感关联进行条件生成,通过控制笔触粗细与色彩饱和度等参数调控输出情感强度。基准测试表明,经EmoArt微调的FLUX.1-dev模型在艺术属性对齐度上提升12.7%,特别是在表现焦虑情感时能生成更具构图失衡感的图像。数据集配套提供基于MiniCPM-V-2.6的评估模块,支持FID、SSIM等传统指标与独创的五维属性对齐度联合测评。
背景与挑战
背景概述
EmoArt数据集由吉林大学张程团队于2025年提出,是当前最全面的情感标注艺术数据集,包含13.2万件涵盖56种绘画风格的艺术作品。该数据集通过整合大都会艺术博物馆、WikiArt等跨文化资源,构建了包含视觉属性、情感维度及艺术治疗潜能的多层次标注体系。其创新性地采用GPT-4o辅助标注流程,在情感计算与生成艺术领域填补了传统数据集在艺术图像情感细粒度分析上的空白,为扩散模型的情感对齐研究提供了重要基准。
当前挑战
该数据集需解决两大核心挑战:在领域问题层面,艺术图像的情感表达具有高度主观性和文化依赖性,需突破传统图像分类任务中客观语义与情感特征的解耦难题;在构建过程中,面临跨风格艺术作品的标准化标注挑战,包括如何平衡不同文化背景下的情感解读差异,以及确保抽象艺术中非具象元素与情感标签的准确映射。此外,数据清洗时需兼顾艺术价值与伦理审查,避免算法偏见影响情感标注的客观性。
常用场景
经典使用场景
EmoArt数据集在情感计算和艺术生成领域具有广泛的应用价值。该数据集通过整合56种绘画风格的13万余幅艺术作品,为研究者提供了丰富的情感标注数据。在情感感知图像生成任务中,EmoArt常被用于训练和评估扩散模型的情感表达能力,帮助模型理解并生成具有特定情感色彩的艺术作品。其多层次标注体系包括视觉属性、情感类别和艺术治疗潜力,为跨模态学习提供了坚实基础。
解决学术问题
EmoArt有效解决了艺术领域情感标注数据稀缺的学术难题。传统数据集往往局限于真实照片或标注粒度粗糙,而EmoArt通过结构化标注情感维度(如效价-唤醒度)和视觉属性(如笔触、构图),建立了艺术形式与情感表达的映射关系。该数据集为情感驱动的图像合成研究提供了基准测试平台,推动了计算机视觉与情感计算的交叉研究,特别是在抽象艺术的情感表达机制探索方面具有重要意义。
衍生相关工作
EmoArt催生了多项情感生成领域的创新研究。基于该数据集,研究者开发了情感对齐评估框架,提出了视觉属性与情感维度的量化关联模型。在技术应用方面,衍生工作包括改进的LoRA微调方法、多模态情感嵌入表示等。数据集还被扩展应用于艺术风格迁移研究,建立了不同文化背景下艺术形式与情感表达的跨文化分析模型。
以上内容由遇见数据集搜集并总结生成



