Impressions dataset

github2023-12-13 更新2024-05-31 收录

下载链接：

https://github.com/SALT-NLP/Impressions

下载链接

链接失效反馈

官方服务：

资源简介：

Impressions数据集是一个多模态基准，包含4,300个独特的注释和超过1,440对图像-标题，来自摄影领域。每个注释探讨了(1)照片的美学影响力，(2)包含实用推断的图像描述，(3)照片可能激发的情感/思想/信念，以及(4)引发表达印象的美学元素。

The Impressions dataset serves as a multimodal benchmark, encompassing 4,300 unique annotations and over 1,440 image-caption pairs derived from the field of photography. Each annotation delves into (1) the aesthetic impact of the photograph, (2) the image description containing practical inferences, (3) the emotions/thoughts/beliefs potentially evoked by the photograph, and (4) the aesthetic elements that elicit expressive impressions.

创建时间：

2023-10-23

原始信息汇总

数据集概述

Impressions数据集是一个多模态基准，包含4,300个独特的注释和超过1,440对图像-标题配对，来源于摄影领域。每个注释探讨以下四个方面：

照片的美学影响力
包含实用推理的图像描述
照片可能激发的情感/思想/信念
引发表达印象的美学元素

数据集内容

metadata
- all_image_annotations.csv：所有关于图像影响、描述、感知和美学评估的注释。
- image_annotations_3cap.csv：图像-标题配对有3个以上注释的注释集，来自3个不同的注释者。
- mean_impact_scores.csv：数据收集期间评估的所有图像的平均美学影响分数，分数范围从1（高度影响）到4（无影响）。
- annotator_personality_data.csv：注释者对简化版Big 5性格测试的回答。
- annotator_demographic_data.csv：注释者的人口统计信息。

数据集媒体下载

要下载Impressions数据集中的所有图像，请运行：

python download_images.py

搜集汇总

数据集介绍

构建方式

Impressions数据集的构建基于多模态数据收集方法，涵盖了摄影领域的1,440张图像及其对应的文字描述。每张图像均通过多个独立标注者的视角进行深入分析，标注内容包括图像的美学影响力、描述性文字、情感反应以及美学元素的识别。数据集的构建过程严格遵循科学实验设计，确保每个图像-描述对至少有三个独立的标注，以保证数据的多样性和可靠性。

特点

该数据集的特点在于其丰富的多模态数据结构和深度情感分析。每张图像不仅附有详细的文字描述，还包含了从美学角度出发的评分和情感反应，这些数据通过多个标注者的独立评估获得，确保了数据的广泛性和深度。此外，数据集还包含了标注者的人格测试和人口统计信息，为研究视觉符号学及其对情感和信念的影响提供了多维度的分析视角。

使用方法

使用Impressions数据集时，研究者可以通过提供的Python脚本下载所有图像数据。数据集中的CSV文件包含了详细的图像注释、美学评分和标注者信息，便于进行数据分析和模型训练。研究者可以利用这些数据探索视觉美学与情感反应之间的关系，或开发新的算法来预测图像的美学影响力。数据集的使用需遵循Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International License。

背景与挑战

背景概述

Impressions数据集是一个多模态基准数据集，专注于视觉符号学的研究，旨在探讨特定视觉特征和设计选择如何引发特定的情感、思想和信念。该数据集由4,300个独特的注释和超过1,440个图像-标题对组成，涵盖了摄影领域的内容。每个注释都深入分析了照片的美学影响力、图像描述、情感/思想/信念的激发以及引发这些印象的美学元素。该数据集由EMNLP 2023会议发布，相关论文可在arXiv上查阅。其创建旨在为视觉符号学、情感计算和美学评估等领域提供重要的研究资源。

当前挑战

Impressions数据集在解决视觉符号学和情感计算领域的核心问题时，面临多重挑战。首先，如何准确捕捉和量化图像的美学影响力及其对观者情感和思想的激发，是一个复杂且主观的任务。其次，数据集的构建过程中，确保注释的一致性和多样性也是一大挑战，尤其是在涉及多个注释者的主观评价时。此外，如何将图像的美学元素与观者的情感反应有效关联，并避免文化和个人偏见的干扰，也是该数据集需要克服的关键问题。

常用场景

经典使用场景

Impressions数据集在视觉符号学研究中扮演了重要角色，尤其是在探索特定视觉特征和设计选择如何引发特定情感、思想和信念方面。该数据集通过包含超过1,440张图像-标题对及其4,300个独特的注释，为研究者提供了一个多模态基准，用于分析图像的美学影响力、情感表达以及美学元素对观众感知的影响。

衍生相关工作

基于Impressions数据集，许多相关研究得以展开，尤其是在情感计算和视觉传达领域。例如，一些研究利用该数据集开发了新的算法，用于预测图像的情感影响力，或通过分析图像的美学特征来优化视觉内容的设计。这些工作不仅扩展了数据集的应用范围，还为相关领域的研究提供了新的视角和方法。

数据集最近研究