aesthetic-emotions-map
收藏Hugging Face2026-05-15 更新2026-05-16 收录
下载链接:
https://huggingface.co/datasets/bjoern-doege/aesthetic-emotions-map
下载链接
链接失效反馈官方服务:
资源简介:
Aesthetic Emotions Map (AEM) 是一个用于图像分类任务的数据集,包含6,832张AI生成的RGB图像,这些图像被组织成8个情感风格簇。该数据集源自一个更大的研究项目,旨在探索视觉风格与审美情感之间的关系。原始研究使用基于42项AESTHEMOS框架的LLM生成情感剖面来构建视觉风格的低维情感地图,并通过降维和聚类分析得到8个情感风格簇。本数据集发布仅包含图像和聚类标签,不包含原始的情感评分。数据集的构建基于一个包含8,000张合成图像的原始语料库,这些图像由500种视觉风格与4个语义主题(风景、细菌、抗生素、耳部感染)交叉生成,每个风格-主题组合包含4个图像变体。在发布的数据集中,有1,168张因聚类分配模糊或不稳定而被排除,以确保监督分类基准的清晰性。数据集采用风格级划分策略,将训练集、验证集和测试集按70%、15%、15%的比例手动划分,以防止因同一风格图像出现在不同分割中而导致的数据泄漏。这种划分方式旨在评估模型对未见风格的泛化能力。数据分布显示存在中等程度的类别不平衡,例如“Intellectual Unease”类别约占23%,而“Energetic Playfulness”类别仅占约5%。该数据集适用于情感风格分类、计算美学、情感图像分析、表示学习等任务,并提供了针对卷积神经网络训练的推荐归一化统计值(均值和标准差)。数据集采用CC BY-NC-SA 4.0许可证,允许非商业用途的共享和改编。需要注意的是,图像为AI生成的合成图像,聚类标签基于LLM标注,情感结构尚需人类验证研究确认。
Aesthetic Emotions Map (AEM) is a dataset for image classification tasks, containing 6,832 AI-generated RGB images organized into 8 emotional style clusters. The dataset originates from a larger research project aimed at exploring the relationship between visual styles and aesthetic emotions. The original research used an LLM-based emotional profile based on the 42-item AESTHEMOS framework to construct a low-dimensional emotional map of visual styles, and obtained 8 emotional style clusters through dimensionality reduction and clustering analysis. This dataset release includes only images and cluster labels, not the original emotional scores. The dataset is built on an original corpus of 8,000 synthetic images generated by crossing 500 visual styles with 4 semantic themes (landscape, bacteria, antibiotics, ear infection), with each style-theme combination containing 4 image variants. In the released dataset, 1,168 images were excluded due to ambiguous or unstable cluster assignments to ensure clarity in supervised classification benchmarks. The dataset employs a style-level partitioning strategy, manually dividing the training, validation, and test sets into 70%, 15%, and 15% proportions, respectively, to prevent data leakage caused by images of the same style appearing in different splits. This partitioning method aims to evaluate the models generalization ability to unseen styles. The data distribution shows a moderate degree of class imbalance, with the Intellectual Unease category accounting for about 23% and the Energetic Playfulness category only about 5%. The dataset is suitable for tasks such as emotional style classification, computational aesthetics, emotional image analysis, and representation learning, and provides recommended normalization statistics (mean and standard deviation) for convolutional neural network training. The dataset uses the CC BY-NC-SA 4.0 license, allowing sharing and adaptation for non-commercial purposes. It should be noted that the images are AI-generated synthetic images, the cluster labels are based on LLM annotations, and the emotional structure requires confirmation through human validation studies.
创建时间:
2026-05-12
原始信息汇总
数据集概述:Aesthetic Emotions Map (AEM)
该数据集是一个用于图像分类任务的公开数据集,专注于视觉风格与审美情绪之间的关联。
核心任务与数据规模
- 任务类型: 图像分类(8个情绪风格簇)
- 图像数量: 6,832张RGB图像
- 类别数量: 8个情绪风格标签
- 来源: 8,000张AI生成图像,排除了1,168张聚类不明确的图像
- 生成工具: Midjourney
- 视觉风格: 500种
- 语义主题: Landscape(风景)、Bacteria(细菌)、Antibiotics(抗生素)、Ear infection(耳部感染)
- 标注来源: 基于大语言模型(LLM)的AESTHEMOS情感标注与聚类分析
- 许可证: CC BY-NC-SA 4.0
研究背景
- 数据集源自“Aesthetic Emotions Map (AEM)”项目,旨在探索视觉风格如何引发审美情绪反应。
- 原始研究生成了8,000张图像,覆盖500种视觉风格与4个语义主题的组合。
- 使用LLM对42项AESTHEMOS框架进行情感评分,并通过降维和聚类分析得到8个情绪风格簇。
数据集结构
- 原始语料: 8,000张图像、500种风格、4个主题、每种风格-主题组合有4个变体。
- 发布版本: 仅包含可可靠分配到8个情绪簇的图像,共6,832张。
- 排除图像: 1,168张因聚类不明确或结果不稳定而被排除。
数据划分策略
- 划分方式: 基于风格级别的划分(而非随机图像级别),以防止数据泄露。
- 划分比例: 训练集70%、验证集15%、测试集15%。
- 细分结果:
| 标签 | 训练集 (图像/风格) | 验证集 (图像/风格) | 测试集 (图像/风格) |
|---|---|---|---|
| Sublime Activation | 896 / 56 | 192 / 12 | 208 / 13 |
| Intellectual Unease | 1,088 / 68 | 240 / 15 | 240 / 15 |
| Energetic Playfulness | 256 / 16 | 48 / 3 | 64 / 4 |
| Lighthearted Humor | 624 / 39 | 144 / 9 | 144 / 9 |
| Aesthetic Emptiness | 368 / 23 | 80 / 5 | 80 / 5 |
| Melancholic | 400 / 25 | 96 / 6 | 96 / 6 |
| Pure Calm | 528 / 33 | 112 / 7 | 128 / 8 |
| Serene Beauty | 560 / 35 | 112 / 7 | 128 / 8 |
| 总计 | 4,720 / 295 | 1,024 / 64 | 1,088 / 68 |
- 类别不平衡: 存在中等程度的类别不平衡(如“Intellectual Unease”约占23%,“Energetic Playfulness”约占5%),建议训练时采用类别加权、加权采样或焦点损失等技术。
建议应用场景
- 图像分类、情感图像分析、计算美学研究
- 情绪风格预测、表征学习
- 针对视觉情感预测的可解释AI
- 情感感知生成系统
推荐归一化参数
- 均值(Mean):
[0.5111, 0.4883, 0.4648] - 标准差(Std):
[0.3434, 0.3208, 0.3226] - 可在PyTorch中通过
transforms.Normalize(mean, std)使用。
主要局限
- 图像为AI合成生成。
- 簇标签源于LLM情感标注,而非人工评分。
- 数据集反映了生成与标注流程中的假设与偏差。
- 情绪结构目前为探索性、初步性的,需要人工验证研究加以确认。
搜集汇总
数据集介绍

构建方式
Aesthetic Emotions Map数据集源于一项探索视觉风格与审美情感关联的研究,其构建过程严谨而精密。研究者利用Midjourney生成引擎,跨越500种视觉风格与四种语义主题(景观、细菌、抗生素、耳部感染)的组合,共合成8000幅图像。在此基础上,借助基于LLM的AESTHEMOS框架对每幅图像进行42个维度的情感标注,并通过降维与聚类分析,最终提炼出八个明晰的审美情感风格簇。为确保分类基准的纯净性,排除了1168幅聚类归属模糊的样本,剩余6832幅图像构成最终数据集。
特点
该数据集的核心特色在于其以视觉风格为基本单元的情感标注体系。八个情感簇——如崇高激活、智识不安、宁静之美等——并非简单的情感标签,而是从数百种视觉风格的审美体验中自然涌现的聚类结构。数据集采用风格级别的划分策略,将所有属于同一视觉风格的图像完整分配至训练、验证或测试集之一,有效规避了数据泄漏风险。此外,数据集中存在适度的类别不平衡,如“智识不安”类约占23%而“活力俏皮”仅占5%,这为研究类别不平衡下的分类算法提供了天然实验场。
使用方法
作为面向图像分类任务的数据集,Aesthetic Emotions Map可广泛应用于审美情感分类、计算美学研究、情感图像分析及表征学习等领域。使用时需加载预设的训练/验证/测试划分,并建议采用数据集提供的归一化统计量(均值与标准差)对图像进行标准化处理。针对数据集中存在的类别不平衡现象,研究者可考虑引入类别权重、加权采样或焦点损失等策略。该数据集特别适合评估模型对未见视觉风格的泛化能力,可用于探究解释性人工智能与情感感知生成系统的交叉方向。
背景与挑战
背景概述
审美情感的计算建模是情感计算与计算美学交叉领域的前沿课题,其核心在于量化视觉刺激所诱发的情感体验。Aesthetic Emotions Map (AEM) 数据集由Björn Döge于2026年创建,旨在弥合视觉风格与审美情感之间的结构性鸿沟。该数据集源自一项大型研究项目,通过Midjourney生成8000幅覆盖500种视觉风格与四种语义主题(风景、细菌、抗生素、耳部感染)的合成图像,并基于AESTHEMOS框架的42项情感维度的LLM标注,经降维与聚类分析提炼出八个情感风格簇(如崇高激活、智性不安、宁静之美等),最终发布包含6832幅可靠聚类图像及其标签的分类基准。该数据集为图像分类、计算美学、情感图像分析及表征学习提供了独特的研究资源,推动了从情感分布视角理解视觉风格的研究范式。
当前挑战
所解决的领域问题挑战在于,传统图像情感分析多聚焦于基本情绪或效价-唤醒维度,而审美情感(如崇高、宁静、戏谑)的细腻语义分类缺乏标准化标注基准,AEM通过八类情感风格簇首次提供了面向复杂审美情感的图像分类任务。构建过程中的挑战体现在三个方面:其一,合成图像的视觉多样性依赖于500种风格与四种主题的组合控制,生成管道的偏差可能影响情感表达的代表性;其二,LLM标注的情感轮廓替代了人类被试的真实评分,其有效性与文化普适性尚未得到验证,聚类标签的探索性本质要求后续人工验证;其三,风格级数据划分策略虽避免了数据泄露,却加剧了类别不均衡(如“活力戏谑”仅占5%),对分类器的鲁棒训练与评估提出了方法学考验。
常用场景
经典使用场景
在计算美学与情感计算交叉领域,Aesthetic Emotions Map(AEM)数据集的核心价值在于其为图像的情感风格分类提供了结构化基准。该数据集包含6832张由Midjourney生成的合成图像,跨越500种视觉风格与4种语义母题(风景、细菌、抗生素、耳部感染),并经由基于AESTHEMOS框架的LLM情感标注与聚类分析,提炼出八种情感风格簇:崇高激活、理智不安、活力俏皮、轻松幽默、审美空虚、忧郁悲怆、纯粹宁静与宁静之美。研究者可借此训练分类器,将视觉输入映射至细粒度的情感风格空间,从而推动从情感维度理解视觉审美体验的自动化建模。
实际应用
在实际应用层面,AEM数据集为情感感知的生成式视觉系统搭建了桥梁。基于本数据集训练的分类器可嵌入图像编辑软件或内容创作平台,帮助创作者实时感知并调整作品的情感调性,例如将“宁静之美”风格应用于冥想应用界面或健康环境设计。此外,在广告与品牌领域,该数据集支持自动优选与品牌调性契合的视觉风格,如为奢侈品广告挑选“崇高激活”类别图像以强化高端感。在数字心理健康干预中,系统可根据用户情感状态推荐匹配的视觉内容,如“纯粹宁静”图像用于压力缓解,而“活力俏皮”用于情绪提振。这些应用标志着审美情感从抽象理论向可编程用户体验的关键转变。
衍生相关工作
AEM数据集催生了一系列衍生研究工作,尤其在多模态情感推理与可解释视觉特征归因方面。基于该数据集的经典工作包括:一是构建情感风格预测的卷积神经网络基线,利用提供的归一化统计量(均值[0.511,0.488,0.465]与标准差[0.343,0.321,0.323])训练模型,并探讨类别不平衡(如“智力不安”占23%而“活力俏皮”仅5%)对分类性能的影响,提出加权采样与焦点损失等缓解策略。二是探索跨语义母题迁移能力,检验模型在未见情景(如从“风景”风格泛化至“细菌”风格)下的鲁棒性。三是结合梯度加权类激活映射(Grad-CAM)等方法,揭示驱动特定情感风格预测的关键视觉区域,为理解审美情感的底层视觉特征提供了可解释性工具。这些工作共同推动了计算美学从直觉评判向可验证科学范式的演进。
以上内容由遇见数据集搜集并总结生成



