five

EmoArt-130k

收藏
Hugging Face2025-05-28 更新2025-05-29 收录
下载链接:
https://huggingface.co/datasets/printblue/EmoArt-130k
下载链接
链接失效反馈
官方服务:
资源简介:
EmoArt是一个大规模的情感注释艺术数据集,包含132,664件来自56种绘画风格和7个主题类别的艺术品。该数据集旨在支持情感感知图像生成、情感计算、跨模态学习、计算美学、艺术治疗和幸福感分析等研究。

EmoArt is a large-scale emotionally annotated art dataset, consisting of 132,664 artworks spanning 56 painting styles and 7 thematic categories. This dataset aims to support research in areas including emotion-aware image generation, affective computing, cross-modal learning, computational aesthetics, art therapy, and well-being analysis.
创建时间:
2025-05-24
原始信息汇总

EmoArt-130k 数据集概述

数据集基本信息

  • 名称: EmoArt: A Large-Scale Emotion-Annotated Artistic Dataset
  • 规模: 132,664件艺术品
  • 版本:
    • 完整版: 132,664件艺术品 (EmoArt-130k)
    • 精简版: 5,000+件艺术品 (EmoArt-5k)
  • 许可证: Creative Commons

数据集结构

  • 组织形式:

    • 按艺术类别分组的压缩文件 (.tar.gz)
    • 统一的注释文件 (Annotation.json)
  • 文件夹结构:

    EmoArt Dataset/ ├── {ArtCategory}.tar.gz │ └── images/ │ ├── image_00001.jpg │ └── ... └── Annotation.json

艺术类别

  1. Classics (经典艺术)
  2. Modern Edge (现代艺术)
  3. East Spirit (东方艺术)
  4. Chromatic Soul (色彩艺术)
  5. Dream Visions (梦幻艺术)
  6. Form & Flow (形式艺术)
  7. Social Mirror (社会艺术)

注释信息

  • 包含内容:
    • 情感标签 (12类)
    • 情感效价与唤醒度 (Positive/Negative, High/Low)
    • 视觉属性: 笔触、色彩、构图、线条、光影
    • 情感描述
    • 治疗效果评估
  • 注释格式: json { "request_id": "...", "description": { "first_section": "...", "second_section": { "visual_attributes": "...", "emotional_impact": "..." }, "third_section": { "emotional_arousal_level": "...", "emotional_valence": "...", "dominant_emotion": "...", "healing_effects": [...] } }, "image_path": "..." }

关键特性

  • 132,664件高分辨率艺术品
  • 多样化的文化和风格覆盖
  • 丰富的情感中心注释
  • GPT-4o生成+人工验证的注释
  • 模块化结构: 可单独下载特定类别或全部注释

应用领域

  • 情感感知图像生成
  • 情感计算
  • 跨模态学习 (视觉-语言)
  • 计算美学
  • 艺术治疗和健康分析

基准性能

模型 质量 ↑ 情感对齐 ↑ FID ↓
FLUX.1-dev-lora 0.6604 0.6698 31.65
PixArt-sigma 0.6505 0.6342 36.23
FLUX.1-dev 0.6392 0.6228 21.29
Playground 0.6486 0.6247 42.57

伦理与质量

  • 仅包含开放获取的公共领域艺术品
  • 人工+AI质量控制
  • 手动过滤敏感/NSFW内容
  • 保持文化代表性平衡

联系方式

  • 邮箱: zhangcheng2122@jlu.edu.com
  • 问题报告: GitHub Issues
  • 讨论: Hugging Face Discussions
搜集汇总
数据集介绍
main_image_url
构建方式
EmoArt-130k数据集作为艺术与情感计算交叉领域的重要资源,其构建过程体现了多模态数据整合的前沿方法。研究团队从56种绘画风格和7大主题类别中系统收集了132,664件高分辨率艺术品,采用GPT-4o模型生成初始情感标注,并经过人工验证确保标注质量。数据集采用模块化架构设计,将图像按艺术流派分类存储为独立压缩包,同时将所有情感元数据整合为统一的JSON注解文件,这种分离存储策略既保证了数据完整性,又提升了访问灵活性。
特点
该数据集最显著的特征在于其多维度的情感标注体系,每件艺术品不仅标注了12种基本情绪类别,还包含情感效价与唤醒度的二元评估。注解文件详细记录了作品的视觉属性(笔触、色彩、构图等)、情绪影响描述以及潜在治疗效果,为情感计算研究提供了丰富的语义信息。数据集涵盖从古典主义到现代艺术的广泛风格,在保持文化多样性的同时,通过人工筛选确保了内容的适宜性和质量,使其成为跨文化情感感知研究的理想基准。
使用方法
使用者可通过Hugging Face平台灵活获取该数据集,支持按艺术流派下载特定类别的图像压缩包或单独获取全局注解文件。数据集加载接口兼容Hugging Face生态系统,用户可通过标准API实现一键式载入。对于特定研究需求,可单独解析Annotation.json文件获取情感元数据,或结合图像路径实现跨模态分析。该数据集特别适合开发情感感知的图像生成模型,其模块化设计允许研究者根据计算资源情况选择完整版或精简版数据集进行实验。
背景与挑战
背景概述
EmoArt-130k数据集由吉林大学的研究团队于近年构建,是一个大规模的艺术作品情感标注数据集,包含来自56种绘画风格和7个主题类别的132,664件艺术作品。该数据集旨在推动情感计算、跨模态学习及计算美学等领域的研究,特别是在情感感知图像生成和艺术治疗分析方面具有重要应用价值。通过结合GPT-4o与人工验证的标注方法,EmoArt-130k为研究者提供了丰富的视觉属性和情感标签,显著提升了艺术与情感交叉领域的研究潜力。
当前挑战
EmoArt-130k数据集面临的挑战主要包括两方面:领域问题的挑战和构建过程的挑战。在领域问题方面,艺术作品的多样性和文化背景差异使得情感标注的准确性和一致性难以保证,尤其是在跨文化情感感知研究中。此外,情感标签的细粒度划分和情感与视觉属性的关联性分析也是重要难点。在构建过程中,数据集的规模庞大导致标注工作耗时且复杂,同时需平衡不同文化背景的艺术作品以避免偏见。数据质量控制,包括敏感内容的筛选和标注的准确性验证,也是构建过程中的关键挑战。
常用场景
经典使用场景
在情感计算与艺术治疗领域,EmoArt-130k数据集以其13万件情感标注的艺术作品成为跨模态研究的基石。该数据集最经典的用途在于训练情感感知的图像生成模型,研究者通过分析56种绘画风格与12类情感标签的对应关系,构建了艺术表现与情感映射的量化框架。其模块化结构允许针对特定艺术流派(如巴洛克或抽象表现主义)进行细粒度分析,为生成具有特定情感倾向的艺术作品提供了数据支撑。
衍生相关工作
基于该数据集衍生的经典工作包括:FLUX.1-dev-lora模型在情感对齐生成任务上的突破性表现,其0.6698的Emotion Alignment分数刷新了基准;《Affective Art Generation》系列研究建立了视觉属性(笔触、色彩)与情绪效价的预测模型;《Cross-Cultural Emotion Perception》项目则揭示了东西方艺术在情感表达上的系统性差异。这些成果均发表在NeurIPS、ICML等顶级会议,推动了AIGC与情感计算的深度融合。
数据集最近研究
最新研究方向
在情感计算与艺术交叉领域,EmoArt-130k数据集正推动多项前沿研究。该数据集通过融合56种绘画风格与情感标注,为跨模态学习提供了丰富素材,特别是在视觉-语言模型的情感对齐方面展现出独特价值。近期研究聚焦于利用其大规模标注数据训练生成模型,探索艺术创作中色彩、构图等视觉元素与情绪效价的映射关系。在心理健康应用方向,学者们正基于数据集分析不同艺术风格对压力缓解的差异性影响,为数字艺术治疗提供量化依据。数据集涵盖的东西方艺术对比特性,也为跨文化情感感知研究创造了条件,相关成果已应用于情感化人机交互系统设计。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作