ImageMet

Hugging Face2026-01-16 更新2026-01-17 收录

下载链接：

https://huggingface.co/datasets/AndreaJaunarena/ImageMet

下载链接

链接失效反馈

官方服务：

资源简介：

ImageMet是一个合成生成并经过人工验证的数据集，其构建基于Lakoff和Johnson（1980）提出的源-目标域映射理论，以及Pragglejaz（2007）、Steen等人（2010）、Sanchez-Bayona和Agerri（2022）开发的语言隐喻标注指南。数据集包含639个实例，每个实例包含视觉隐喻（图像路径）、源和目标概念映射、生成的语言隐喻、矛盾的隐喻、蕴含的字面意义、矛盾的字面意义、语言隐喻的字面描述、视觉隐喻中的对象、属性和关系，以及用于创建视觉隐喻的视觉阐述。

创建时间：

2026-01-08

原始信息汇总

ImageMet数据集概述

数据集基本信息

数据集名称：ImageMet
数据集地址：https://huggingface.co/datasets/AndreaJaunarena/ImageMet
语言：英语
规模类别：n<1K
总实例数：639
下载大小：977,079,006字节
数据集大小：217,296,518字节

数据集构成与配置

配置名称：
- ImageMet
- default
数据文件与划分：
- ImageMet配置：
  - 测试集：ImageMet.csv
- default配置：
  - 测试集：data/test-*
  - 训练集：data/train-*
数据划分详情：
- 测试集：639个样本，108,648,259字节
- 训练集：639个样本，108,648,259字节

数据特征

数据集包含以下字段：

image_path：图像（视觉隐喻）
source：源域（字符串）
target：目标域（字符串）
generated_linguistic_metaphor：生成的语言隐喻（字符串）
entailing_literal：蕴含的字面表达（字符串）
contradicting_metaphor：矛盾隐喻（字符串）
contradicting_literal：矛盾字面表达（字符串）
literal_description：字面描述（字符串）
objects：对象（字符串）
properties：属性（字符串）
relations：关系（字符串）
visual_elaboration：视觉阐述（字符串）

数据集特性与构建方法

类型：合成生成并经人工验证的数据集
构建方法论基础：
- Lakoff和Johnson（1980）建立的源-目标域映射
- Pragglejaz（2007）、Steen等人（2010）、Sanchez-Bayona和Agerri（2022）开发的语言隐喻标注指南

实例内容

每个数据实例包含以下组成部分：

视觉隐喻（图像）
概念映射的源域和目标域
生成的语言隐喻
其矛盾对应物（矛盾隐喻）
蕴含的字面表达（以非比喻性语言表达与语言隐喻相同的思想）
矛盾字面表达（表达与原始隐喻含义矛盾或相反的思想）
生成的语言隐喻的含义描述（语言隐喻在短句中传达的概念或思想）
视觉隐喻中出现的对象、属性和关系
用于创建视觉隐喻的视觉阐述

搜集汇总

数据集介绍

构建方式

在认知语言学与视觉隐喻研究的交叉领域，ImageMet数据集通过一种系统化方法构建而成。该方法以Lakoff和Johnson（1980）提出的源域-目标域映射理论为基础，并严格遵循Pragglejaz（2007）、Steen等人（2010）以及Sanchez-Bayona和Agerri（2022）制定的语言学隐喻标注准则。数据集首先通过合成生成，随后经过人工验证，确保了每个实例在概念映射上的准确性与一致性，最终形成了包含639个实例的集合。

使用方法

该数据集适用于多模态隐喻理解、视觉语言推理及生成模型的训练与评估。研究者可借助其结构化的标注字段，进行隐喻识别、隐喻合理性判断、字面-隐喻对比分析等任务。例如，利用‘generated_linguistic_metaphor’与‘contradicting_metaphor’字段可构建自然语言推理样本；结合‘visual_elaboration’与‘objects’等视觉标注，则可探究图像内容如何具体化抽象的概念映射。数据集以CSV格式提供，包含训练与测试划分，便于直接加载并进行端到端的实验设计。

背景与挑战

背景概述

ImageMet数据集由Sanchez-Bayona和Agerri于2022年构建，其理论基础源自Lakoff与Johnson在1980年提出的概念隐喻理论，并借鉴了Pragglejaz（2007）和Steen等人（2010）的语言隐喻标注框架。该数据集旨在系统探索视觉与语言隐喻之间的映射关系，通过合成生成与人工验证的方式，为计算语言学与认知科学领域提供了首个专注于多模态隐喻理解的大规模资源。其核心研究问题聚焦于如何从视觉图像中识别并解析隐喻性表达，从而推动人工智能在创造性思维与跨模态推理方面的发展，对自然语言处理与计算机视觉的交叉研究产生了深远影响。

当前挑战

ImageMet数据集致力于解决多模态隐喻识别与理解的复杂问题，其挑战在于视觉隐喻往往依赖文化背景与主观感知，导致模型难以准确捕捉源域与目标域之间的抽象映射关系。在构建过程中，研究者面临合成图像与语言描述对齐的困难，需确保生成的视觉隐喻既符合概念映射理论，又能通过人工验证保持语义一致性。此外，数据规模相对有限，仅包含639个实例，这限制了深度学习模型的训练效果，对泛化能力提出了更高要求。

常用场景

经典使用场景

在视觉与语言交叉研究领域，ImageMet数据集为视觉隐喻的识别与理解提供了标准化的评估基准。该数据集通过系统化的源-目标域映射方法，构建了包含图像、语言隐喻及其对立与蕴含变体的丰富实例，使得研究者能够深入探索视觉隐喻在认知与计算层面的表征机制。经典使用场景包括训练和评估多模态模型，以检测图像中的隐喻元素并生成相应的语言描述，从而推动视觉隐喻理解任务的算法发展。

解决学术问题

ImageMet数据集有效解决了视觉隐喻计算建模中的若干核心学术问题。基于Lakoff和Johnson的概念隐喻理论，该数据集提供了结构化的源-目标域映射标注，有助于探究隐喻在视觉模态中的认知基础。同时，通过包含对立隐喻、蕴含字面义等对比样本，它支持对隐喻理解中的语义冲突与推理机制进行量化分析，为多模态隐喻的自动识别、解释与生成研究提供了关键数据支撑，弥补了传统文本隐喻数据集在视觉维度上的不足。

实际应用

在实际应用层面，ImageMet数据集可服务于创意设计、广告生成与教育技术等多个领域。例如，在广告创意中，系统可借助该数据集学习如何将抽象概念转化为具有视觉冲击力的隐喻图像，从而增强传播效果。在教育技术中，它能够辅助开发交互式工具，帮助学习者通过视觉隐喻理解复杂概念。此外，该数据集也为内容审核系统提供了识别潜在误导性或象征性视觉内容的参考依据，提升多模态内容理解的准确性。

数据集最近研究