ImageMet

Hugging Face2026-01-21 更新2026-01-22 收录

下载链接：

https://huggingface.co/datasets/AndreaJaunarena-Cayetano/ImageMet

下载链接

链接失效反馈

官方服务：

资源简介：

ImageMet是一个合成生成并经过人工验证的数据集，基于Lakoff和Johnson（1980）的源-目标域映射理论以及Pragglejaz（2007）、Steen等（2010）、Sanchez-Bayona和Agerri（2022）的语言隐喻标注指南构建。数据集包含639个实例，每个实例包括视觉隐喻（图像路径）、源和目标概念映射、生成的语言隐喻、矛盾隐喻、蕴含字面意义、矛盾字面意义、语言隐喻的字面描述、视觉隐喻中的对象、属性和关系，以及用于创建视觉隐喻的视觉阐述。

创建时间：

2026-01-16

原始信息汇总

ImageMet 数据集概述

数据集基本信息

数据集名称：ImageMet
数据集地址：https://huggingface.co/datasets/AndreaJaunarena-Cayetano/ImageMet
数据集规模：639 个实例
数据格式：包含图像与文本的多模态数据
构建方式：基于系统化方法合成生成并经过人工验证

数据集构建依据

基于 Lakoff 和 Johnson (1980) 建立的源-目标域映射理论。
基于 Pragglejaz (2007)、Steen 等人 (2010)、Sanchez-Bayona 和 Agerri (2022) 开发的隐喻标注指南。

数据内容与特征

每个数据实例包含以下字段：

视觉隐喻 (image_path): 图像文件路径。
源域与目标域 (source, target): 概念映射的源域和目标域。
生成的语言隐喻 (generated_linguistic_metaphor): 生成的语言隐喻表达。
蕴含的字面表达 (entailing_literal): 不使用比喻语言表达与语言隐喻相同思想的句子。
矛盾的隐喻 (contradicting_metaphor): 与原始语言隐喻含义矛盾的隐喻表达。
矛盾的字面表达 (contradicting_literal): 表达与原始隐喻含义相反或矛盾思想的句子。
字面描述 (literal_description): 用简短句子描述生成的语言隐喻所传达的概念或思想。
视觉元素分解 (objects, properties, relations): 视觉隐喻中出现的对象、属性和关系。
视觉阐述 (visual_elaboration): 用于创建视觉隐喻的视觉阐述方法。

数据集结构

唯一数据分割：训练集 (train)
训练集实例数：639
训练集大小：108,648,259 字节（约 108.65 MB）
下载大小：108,564,334 字节（约 108.56 MB）
数据集总大小：108,648,259 字节（约 108.65 MB）

示例图像

Examples_web_orria_40_2

搜集汇总

数据集介绍

构建方式

在认知语言学与视觉隐喻研究的交叉领域，ImageMet数据集的构建遵循了严谨的理论框架。该数据集基于Lakoff与Johnson提出的源域-目标域映射理论，并采纳了Pragglejaz、Steen等人发展的语言学隐喻标注准则。通过系统化的方法论，研究团队首先生成合成数据，随后进行了人工验证，确保了每个实例在概念映射上的准确性与一致性。这一过程融合了理论指导与人工校验，为视觉与语言隐喻的关联研究奠定了可靠的数据基础。

特点

ImageMet数据集囊括了639个精心构建的实例，每个实例均呈现了视觉隐喻与语言表达的深度关联。其核心特征在于多维度的标注信息：不仅包含视觉隐喻图像及其对应的源域与目标域，还提供了生成的语言隐喻、蕴含的字面表达、矛盾的隐喻与字面对照，以及对象、属性与关系的结构化描述。这种多层次、细粒度的标注体系，使得数据集能够同时支持视觉理解、隐喻生成与推理验证等多重研究任务，体现了跨模态语义表征的丰富性。

使用方法

在自然语言处理与计算机视觉的跨模态研究中，ImageMet数据集为探索隐喻理解与生成提供了实用资源。研究者可借助其丰富的标注字段，训练或评估模型在视觉隐喻识别、隐喻-字面对照生成、以及跨模态语义对齐等方面的能力。例如，通过对比生成的语言隐喻与蕴含的字面描述，可以探究模型对隐喻性语言的理解深度；而结合对象、属性与关系标注，则能进一步分析视觉元素如何支撑隐喻意义的构建。该数据集适用于端到端训练、零样本评估及可解释性分析等多种实验场景。

背景与挑战

背景概述

视觉隐喻作为认知语言学与多模态研究的关键议题，其核心在于探索抽象概念如何通过视觉元素进行具象化表达。ImageMet数据集由研究团队于近年构建，其理论基础源自Lakoff与Johnson（1980）提出的源域-目标域映射框架，并借鉴了Pragglejaz（2007）及Steen等人（2010）的隐喻标注体系。该数据集旨在系统化地探究视觉隐喻的生成机制与理解过程，通过合成生成与人工验证相结合的方法，为多模态隐喻识别、跨模态推理及计算创意等前沿领域提供了结构化资源，推动了认知计算与人工智能在创造性语言理解方面的发展。

当前挑战

视觉隐喻的自动识别与生成面临多重挑战：在领域问题层面，隐喻的理解依赖于深层的文化语境与认知关联，模型需克服字面意义与隐喻意义之间的模糊边界，并处理多模态信息中视觉符号与语言概念的非线性映射关系。在构建过程中，数据集的合成需确保源域与目标域映射的逻辑一致性，同时维持视觉元素与语言描述的语义对齐；人工验证环节则要求标注者具备专业的语言学背景，以准确区分隐喻、直义及矛盾表述，保障数据质量的可靠性与标注标准的普适性。

常用场景

经典使用场景

在视觉与语言交叉领域的研究中，ImageMet数据集常被用于视觉隐喻的识别与生成任务。通过其精心构建的图像与文本对，研究者能够训练模型理解隐喻在视觉表达中的映射机制，例如将抽象概念如“时间”映射为具体物体如“河流”。这一过程不仅涉及图像内容的解析，还要求模型捕捉源域与目标域之间的语义关联，为多模态隐喻分析提供了标准化的实验平台。

实际应用

在实际应用中，ImageMet数据集为创意设计、广告生成与教育技术提供了重要支持。例如，在广告行业，基于该数据集的模型可以自动生成蕴含隐喻的视觉内容，增强传播效果；在教育领域，它有助于开发理解隐喻认知的教学工具，提升语言与视觉素养。这些应用不仅展示了多模态人工智能的潜力，也促进了艺术与技术的有机结合。

衍生相关工作

围绕ImageMet数据集，已衍生出多项经典研究工作，包括视觉隐喻检测模型、多模态隐喻生成系统以及隐喻一致性评估框架。这些工作借鉴了数据集的结构化标注，如源-目标域映射和矛盾样本，推动了视觉语言预训练技术的进步。相关成果常见于ACL、EMNLP等顶级会议，为多模态推理与创造性人工智能奠定了理论基础。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集