REAL-MM-RAG_TechReport

Name: REAL-MM-RAG_TechReport
Creator: maas
Published: 2025-12-05 16:54:01
License: 暂无描述

魔搭社区2025-12-05 更新2025-12-06 收录

下载链接：

https://modelscope.cn/datasets/ibm-research/REAL-MM-RAG_TechReport

下载链接

链接失效反馈

官方服务：

资源简介：

# REAL-MM-RAG-Bench：真实世界多模态检索基准我们推出了REAL-MM-RAG-Bench，这是一款面向真实场景的多模态检索基准数据集，旨在于可靠、严苛且贴合实际的环境中评估检索模型的性能。该基准数据集通过自动化流水线构建：查询由视觉语言模型（Vision-Language Model, VLM）生成，经大语言模型（Large Language Model, LLM）筛选后，再由大语言模型（LLM）进行重述，以保障检索评估的高质量。为模拟真实世界的检索挑战，我们引入多级查询重述机制，在三个不同层级对查询进行修改——从细微的措辞调整到大幅的结构变更，确保模型的评估基于其真正的语义理解能力，而非简单的关键词匹配。 ## REAL-MM-RAG_FinReport - **内容**：2005年至2023年的财务报告，共计19份文档、2687页，包含文本与表格混合内容。 ## 数据集加载方法如需使用该数据集，请先安装` datasets `库，随后按如下方式加载： python from datasets import load_dataset dataset = load_dataset("ibm-research/REAL-MM-RAG_FinReport") print(dataset) ## 来源论文 [REAL-MM-RAG：真实世界多模态检索基准](https://arxiv.org/abs/2502.12342) --- # REAL-MM-RAG-Bench：真实世界多模态检索基准我们推出了REAL-MM-RAG-Bench，这是一款面向真实场景的多模态检索基准数据集，旨在于可靠、严苛且贴合实际的环境中评估检索模型的性能。该基准数据集通过自动化流水线构建：查询由视觉语言模型（Vision-Language Model, VLM）生成，经大语言模型（Large Language Model, LLM）筛选后，再由大语言模型（LLM）进行重述，以保障检索评估的高质量。为模拟真实世界的检索挑战，我们引入多级查询重述机制，在三个不同层级对查询进行修改——从细微的措辞调整到大幅的结构变更，确保模型的评估基于其真正的语义理解能力，而非简单的关键词匹配。 ## REAL-MM-RAG_TechReport - **内容**：17份关于IBM FlashSystem的技术文档 - **规模**：共计1674页 - **构成**：以文本为主体，辅以可视化元素与结构化表格 - **用途**：用于评估模型检索结构化技术内容的性能 ## 数据集加载方法如需使用该数据集，请先安装`datasets`库，随后按如下方式加载： python from datasets import load_dataset # 加载数据集 dataset = load_dataset("ibm-research/REAL-MM-RAG_TechReport", split="test") # 建立查询到图像文件名的映射 query_to_image = {ex['query']: ex['image_filename'] for ex in dataset if ex['query'] is not None} # 建立图像文件名到关联查询的映射 image_to_queries = {} for ex in dataset: image_to_queries.setdefault(ex['image_filename'], []).append(ex['query']) # 示例1：根据特定查询查找关联图像 query_example = "IBM FlashSystem中的安全备份策略具体管控哪些内容？" if query_example in query_to_image: image_filename = query_to_image[query_example] print(f"查询'{query_example}'关联的图像为：{image_filename}") # 示例2：根据特定图像查找所有关联查询 image_example = "IBM FlashSystem Safeguarded Copy Implementation Guide_page_36.png" if image_example in image_to_queries: linked_queries = image_to_queries[image_example] print(f"图像'{image_example}'关联的查询为：{linked_queries}") # 示例3：处理无关联查询的页面（仅数据集的一部分） image_example = "IBM Storage FlashSystem 7300 Product Guide Updated for IBM Storage Virtualize 8.7_page_20.png" if image_example in image_to_queries: linked_queries = image_to_queries[image_example] print(f"图像'{image_example}'关联的查询为：{linked_queries}") ## 来源论文 bibtex @misc{wasserman2025realmmragrealworldmultimodalretrieval, title={"REAL-MM-RAG：真实世界多模态检索基准"}, author={Navve Wasserman and Roi Pony and Oshri Naparstek and Adi Raz Goldfarb and Eli Schwartz and Udi Barzelay and Leonid Karlinsky}, year={2025}, eprint={2502.12342}, archivePrefix={arXiv}, primaryClass={cs.IR}, url={https://arxiv.org/abs/2502.12342}, }

提供机构：

maas

创建时间：

2025-10-12

5,000+

优质数据集

54 个

任务类型

进入经典数据集