ImageMet
收藏Hugging Face2026-01-21 更新2026-01-22 收录
下载链接:
https://huggingface.co/datasets/AndreaJaunarena-Cayetano/ImageMet
下载链接
链接失效反馈官方服务:
资源简介:
ImageMet是一个合成生成并经过人工验证的数据集,基于Lakoff和Johnson(1980)的源-目标域映射理论以及Pragglejaz(2007)、Steen等(2010)、Sanchez-Bayona和Agerri(2022)的语言隐喻标注指南构建。数据集包含639个实例,每个实例包括视觉隐喻(图像路径)、源和目标概念映射、生成的语言隐喻、矛盾隐喻、蕴含字面意义、矛盾字面意义、语言隐喻的字面描述、视觉隐喻中的对象、属性和关系,以及用于创建视觉隐喻的视觉阐述。
创建时间:
2026-01-16
原始信息汇总
ImageMet 数据集概述
数据集基本信息
- 数据集名称:ImageMet
- 数据集地址:https://huggingface.co/datasets/AndreaJaunarena-Cayetano/ImageMet
- 数据集规模:639 个实例
- 数据格式:包含图像与文本的多模态数据
- 构建方式:基于系统化方法合成生成并经过人工验证
数据集构建依据
- 基于 Lakoff 和 Johnson (1980) 建立的源-目标域映射理论。
- 基于 Pragglejaz (2007)、Steen 等人 (2010)、Sanchez-Bayona 和 Agerri (2022) 开发的隐喻标注指南。
数据内容与特征
每个数据实例包含以下字段:
- 视觉隐喻 (
image_path): 图像文件路径。 - 源域与目标域 (
source,target): 概念映射的源域和目标域。 - 生成的语言隐喻 (
generated_linguistic_metaphor): 生成的语言隐喻表达。 - 蕴含的字面表达 (
entailing_literal): 不使用比喻语言表达与语言隐喻相同思想的句子。 - 矛盾的隐喻 (
contradicting_metaphor): 与原始语言隐喻含义矛盾的隐喻表达。 - 矛盾的字面表达 (
contradicting_literal): 表达与原始隐喻含义相反或矛盾思想的句子。 - 字面描述 (
literal_description): 用简短句子描述生成的语言隐喻所传达的概念或思想。 - 视觉元素分解 (
objects,properties,relations): 视觉隐喻中出现的对象、属性和关系。 - 视觉阐述 (
visual_elaboration): 用于创建视觉隐喻的视觉阐述方法。
数据集结构
- 唯一数据分割:训练集 (
train) - 训练集实例数:639
- 训练集大小:108,648,259 字节(约 108.65 MB)
- 下载大小:108,564,334 字节(约 108.56 MB)
- 数据集总大小:108,648,259 字节(约 108.65 MB)
示例图像

搜集汇总
数据集介绍

构建方式
在认知语言学与视觉隐喻研究的交叉领域,ImageMet数据集的构建遵循了严谨的理论框架。该数据集基于Lakoff与Johnson提出的源域-目标域映射理论,并采纳了Pragglejaz、Steen等人发展的语言学隐喻标注准则。通过系统化的方法论,研究团队首先生成合成数据,随后进行了人工验证,确保了每个实例在概念映射上的准确性与一致性。这一过程融合了理论指导与人工校验,为视觉与语言隐喻的关联研究奠定了可靠的数据基础。
特点
ImageMet数据集囊括了639个精心构建的实例,每个实例均呈现了视觉隐喻与语言表达的深度关联。其核心特征在于多维度的标注信息:不仅包含视觉隐喻图像及其对应的源域与目标域,还提供了生成的语言隐喻、蕴含的字面表达、矛盾的隐喻与字面对照,以及对象、属性与关系的结构化描述。这种多层次、细粒度的标注体系,使得数据集能够同时支持视觉理解、隐喻生成与推理验证等多重研究任务,体现了跨模态语义表征的丰富性。
使用方法
在自然语言处理与计算机视觉的跨模态研究中,ImageMet数据集为探索隐喻理解与生成提供了实用资源。研究者可借助其丰富的标注字段,训练或评估模型在视觉隐喻识别、隐喻-字面对照生成、以及跨模态语义对齐等方面的能力。例如,通过对比生成的语言隐喻与蕴含的字面描述,可以探究模型对隐喻性语言的理解深度;而结合对象、属性与关系标注,则能进一步分析视觉元素如何支撑隐喻意义的构建。该数据集适用于端到端训练、零样本评估及可解释性分析等多种实验场景。
背景与挑战
背景概述
视觉隐喻作为认知语言学与多模态研究的关键议题,其核心在于探索抽象概念如何通过视觉元素进行具象化表达。ImageMet数据集由研究团队于近年构建,其理论基础源自Lakoff与Johnson(1980)提出的源域-目标域映射框架,并借鉴了Pragglejaz(2007)及Steen等人(2010)的隐喻标注体系。该数据集旨在系统化地探究视觉隐喻的生成机制与理解过程,通过合成生成与人工验证相结合的方法,为多模态隐喻识别、跨模态推理及计算创意等前沿领域提供了结构化资源,推动了认知计算与人工智能在创造性语言理解方面的发展。
当前挑战
视觉隐喻的自动识别与生成面临多重挑战:在领域问题层面,隐喻的理解依赖于深层的文化语境与认知关联,模型需克服字面意义与隐喻意义之间的模糊边界,并处理多模态信息中视觉符号与语言概念的非线性映射关系。在构建过程中,数据集的合成需确保源域与目标域映射的逻辑一致性,同时维持视觉元素与语言描述的语义对齐;人工验证环节则要求标注者具备专业的语言学背景,以准确区分隐喻、直义及矛盾表述,保障数据质量的可靠性与标注标准的普适性。
常用场景
经典使用场景
在视觉与语言交叉领域的研究中,ImageMet数据集常被用于视觉隐喻的识别与生成任务。通过其精心构建的图像与文本对,研究者能够训练模型理解隐喻在视觉表达中的映射机制,例如将抽象概念如“时间”映射为具体物体如“河流”。这一过程不仅涉及图像内容的解析,还要求模型捕捉源域与目标域之间的语义关联,为多模态隐喻分析提供了标准化的实验平台。
实际应用
在实际应用中,ImageMet数据集为创意设计、广告生成与教育技术提供了重要支持。例如,在广告行业,基于该数据集的模型可以自动生成蕴含隐喻的视觉内容,增强传播效果;在教育领域,它有助于开发理解隐喻认知的教学工具,提升语言与视觉素养。这些应用不仅展示了多模态人工智能的潜力,也促进了艺术与技术的有机结合。
衍生相关工作
围绕ImageMet数据集,已衍生出多项经典研究工作,包括视觉隐喻检测模型、多模态隐喻生成系统以及隐喻一致性评估框架。这些工作借鉴了数据集的结构化标注,如源-目标域映射和矛盾样本,推动了视觉语言预训练技术的进步。相关成果常见于ACL、EMNLP等顶级会议,为多模态推理与创造性人工智能奠定了理论基础。
以上内容由遇见数据集搜集并总结生成



