KnowRecall
收藏Hugging Face2025-05-21 更新2025-05-22 收录
下载链接:
https://huggingface.co/datasets/nlp-waseda/KnowRecall
下载链接
链接失效反馈官方服务:
资源简介:
KnowRecall是一个多语言视觉问答基准数据集,用于评估多模态大型语言模型在不同语言环境下的跨语言一致性。该数据集包含1500个全球地标相关的3000个多项选择题,涵盖15种语言。每个问题都附带一张地标图片和对应的提问、答案及选项。
提供机构:
Kawahara Lab at Waseda University
创建时间:
2025-05-21
搜集汇总
数据集介绍

构建方式
在跨语言多模态研究领域,KnowRecall数据集的构建采用了系统化知识抽取与多语言对齐策略。该数据集基于全球1500个著名地标构建了3000道多选题,每个问题均通过人工标注与自动翻译相结合的方式,生成涵盖15种语言的平行语料。图像数据来源于真实地标视觉素材,问题设计聚焦于地标的核心属性知识,并通过语言代码与国家代码的双重标注确保跨语言知识的一致性。
使用方法
针对多模态语言模型的跨语言评估需求,该数据集支持端到端的视觉问答任务验证。研究者可通过加载指定语言分片(如zh、en等)获取图像-问题-选项三元组,利用预定义评估指标衡量模型在相同视觉输入下不同语言输出的知识一致性。数据集采用标准化的多选格式,答案字段提供基准参照,配套的评估代码库支持自动化的一致性度量与误差分析。
背景与挑战
背景概述
随着多模态大语言模型在跨语言环境中的应用日益广泛,确保其在不同语言间保持知识一致性成为关键研究议题。KnowRecall数据集由Waseda大学研究团队于2025年创建,旨在评估多模态模型在多种语言环境下对全球地标知识的召回能力。该数据集涵盖1500个地标的3000道多选题,支持包括英语、中文、法语等15种语言,通过图像与文本的协同建模,为跨语言知识一致性研究提供了标准化评估框架。
当前挑战
该数据集致力于解决多模态视觉问答任务中跨语言知识一致性的核心难题,具体体现为模型在非英语语境下对地标事实性知识的准确传递能力。在构建过程中,研究者面临多语言问题对齐的复杂性,需确保不同语言版本间语义等价性;同时,全球地标图像与多语言文本的精准匹配,以及文化特定知识的标准化标注,均为数据采集与验证带来显著挑战。
常用场景
经典使用场景
在跨语言多模态智能系统研究中,KnowRecall数据集被广泛应用于评估模型对全球地标知识的跨语言一致性理解。通过提供涵盖15种语言的3000道多选题,该数据集模拟了真实场景中用户使用母语查询地标信息的交互过程,例如一位法语使用者针对东京塔图像询问其高度时,模型需在多种语言环境下保持回答的准确性与一致性。
解决学术问题
该数据集有效解决了多模态大语言模型在跨语言知识召回中的语义对齐难题。通过构建覆盖1500个地标的多语言问答对,研究者能够系统量化模型在不同语言间传递事实知识时的偏差程度,为改进模型的多语言表征学习提供关键评估基准,推动跨语言认知一致性理论的发展。
实际应用
面向全球化智能服务场景,KnowRecall为多语言导游系统、跨境教育平台等应用提供核心测试标准。当游客通过手机拍摄地标并用法语提问时,系统需确保其回答与英语、日语等语言版本保持事实一致,这种能力直接关系到跨文化交际中信息服务的可靠性与用户体验。
数据集最近研究
最新研究方向
在跨语言多模态大模型研究领域,KnowRecall数据集正推动对模型知识一致性的深度探索。该数据集通过覆盖15种语言的全球地标视觉问答任务,揭示了模型在跨语言场景中知识召回的系统性偏差。当前研究聚焦于分析多语言表示对齐机制,探索语言间知识迁移的潜在规律,并构建能够评估模型文化适应性的新型评测框架。随着全球化数字应用需求的增长,该数据集为提升多模态系统在旅游、教育等跨语言场景中的可靠性提供了关键基准,促进了多语言人工智能技术的实用化发展。
以上内容由遇见数据集搜集并总结生成



