RAMDocs

github2025-04-18 更新2025-05-02 收录

下载链接：

https://github.com/HanNight/RAMDocs

下载链接

链接失效反馈

官方服务：

资源简介：

RAMDocs是一个模拟复杂和现实场景的数据集，用于处理用户查询中的冲突证据，包括歧义、错误信息和噪声。每个实例包含问题、文档列表（每个文档包含文本、类型和答案）、歧义实体列表、正确答案列表和错误答案列表。

RAMDocs is a dataset that simulates complex and realistic scenarios for handling conflicting evidence in user queries, including ambiguity, misinformation and noise. Each instance consists of a question, a list of documents (each containing text, type and answer), a list of ambiguous entities, a list of correct answers and a list of incorrect answers.

创建时间：

2025-04-17

原始信息汇总

RAMDocs数据集概述

数据集基本信息

名称: RAMDocs
领域: 检索增强生成（Retrieval-Augmented Generation）
主要用途: 模拟复杂且现实的冲突证据场景，包括歧义、错误信息和噪声
数据文件: RAMDocs_test.jsonl

数据结构

每个实例包含以下字段：

question: 问题文本
documents: 文档列表，每个文档包含：
- text: 文档文本
- type: 文档类型（correct正确回答、misinfo错误信息、noise噪声）
- answer: 文档中的答案（noise类型为unknown）
disambig_entity: 问题中歧义实体的消歧列表
gold_answers: 不同消歧实体的正确答案列表
wrong_answers: 问题的错误答案列表

运行要求

依赖安装: bash pip install -r requirements.txt
运行命令示例: bash python run_madam_rag.py --model_name meta-llama/Llama-3.3-70B-Instruct --dataset_path RAMDocs_test.jsonl

引用信息

bibtex @article{wang2025retrieval, title={Retrieval-Augmented Generation with Conflicting Evidence}, author={Han Wang and Archiki Prasad and Elias Stengel-Eskin and Mohit Bansal}, year={2025}, journal={arXiv preprint arXiv:2504.13079} }

致谢

感谢AmbigDocs作者公开数据

搜集汇总

数据集介绍

构建方式

RAMDocs数据集通过精心设计的模拟场景构建，旨在反映真实世界中信息检索的复杂性。研究者采用结构化方法生成每个实例，包含用户查询、多类型文档（正确信息、错误信息和噪声）、消歧实体及标准答案集合。文档类型标注基于其对问题的解答准确性，噪声文档则明确标记为未知答案，这种分层标注策略有效捕捉了信息冲突的多样性。数据构建过程特别注重模拟现实场景中的模糊性、错误信息和噪声干扰，为研究检索增强生成系统在复杂环境下的表现提供了理想测试平台。

特点

该数据集最显著的特点是系统性地整合了信息冲突的多种形态，包括答案模糊性、错误信息干扰和无关噪声。每个查询实例关联的文档集经过严格分类，明确区分正确解答、误导性内容和无关文本，这种结构化设计便于定量分析系统在不同冲突类型下的表现。数据集特别设计了消歧实体列表和对应标准答案，为评估系统处理命名歧义的能力提供了基准。统计特征显示文档类型分布均衡，能够全面测试系统在混合证据环境下的鲁棒性和推理能力。

使用方法

使用RAMDocs数据集时，研究者可通过加载标准JSONL格式文件获取结构化测试实例。典型工作流程包括：解析问题字段作为输入，处理文档集时需特别关注其类型标签以模拟真实检索结果。配套提供的MADAM-RAG框架实现多智能体辩论机制，用户可通过指定预训练模型路径和数据集路径快速复现实验。该框架支持自定义辩论轮次和随机种子，便于控制实验变量。数据集特别适用于评估系统在冲突证据下的答案生成质量，通过分析模型对gold_answers和wrong_answers的响应差异，可深入探究错误信息的缓解机制。

背景与挑战

背景概述

RAMDocs数据集由Han Wang、Archiki Prasad、Elias Stengel-Eskin和Mohit Bansal等研究人员于2025年提出，旨在模拟复杂且真实的冲突证据场景，包括歧义、错误信息和噪音。该数据集专注于解决检索增强生成（Retrieval-Augmented Generation, RAG）系统中面临的证据冲突问题，为相关领域的研究提供了重要的实验基础。RAMDocs通过提供包含正确信息、错误信息和噪音的多样化文档，帮助研究者评估和改进模型在处理冲突证据时的性能。该数据集的发布推动了自然语言处理领域对RAG系统的深入探索，特别是在歧义消解和错误信息过滤方面具有显著影响力。

当前挑战

RAMDocs数据集主要挑战包括两个方面：领域问题的挑战和构建过程的挑战。在领域问题方面，该数据集旨在解决RAG系统中证据冲突带来的复杂问题，如歧义消解、错误信息识别和噪音过滤。这些挑战要求模型具备强大的推理能力和上下文理解能力。在构建过程中，研究人员需要精心设计多样化的冲突场景，确保文档类型的平衡分布，同时保证数据的真实性和复杂性。此外，数据标注过程中如何准确划分文档类型（正确信息、错误信息和噪音）以及生成高质量的金标准答案也是一项重要挑战。这些挑战共同构成了RAMDocs数据集的核心研究价值。

常用场景

经典使用场景

在自然语言处理和信息检索领域，RAMDocs数据集被广泛用于模拟复杂且真实的冲突证据场景。研究者利用该数据集评估检索增强生成（RAG）系统在处理模糊性、错误信息和噪声方面的能力。通过提供包含正确、错误和无关文档的多样化数据，RAMDocs为测试模型在多重证据冲突下的鲁棒性提供了理想平台。

实际应用

在实际应用中，RAMDocs数据集被用于优化智能客服、搜索引擎和事实核查系统。医疗咨询平台借助该数据集训练模型识别相互矛盾的医学建议，新闻聚合系统则利用其区分事实性报道与误导信息。金融领域应用该数据集开发能识别市场谣言的投资分析工具，显著提升了信息可信度评估的准确性。

衍生相关工作

基于RAMDocs数据集衍生的经典工作包括多智能体辩论框架MADAM-RAG，该框架通过独立代理生成、中心聚合和迭代辩论的三阶段设计，显著提升了冲突证据下的生成质量。后续研究扩展了其在跨语言场景的应用，开发出能处理多语言文档冲突的X-RAG系统。AmbigDocs等关联数据集的建立也受到RAMDocs设计理念的启发。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集