five

RAMDocs

收藏
github2025-04-18 更新2025-05-02 收录
下载链接:
https://github.com/HanNight/RAMDocs
下载链接
链接失效反馈
官方服务:
资源简介:
RAMDocs是一个模拟复杂和现实场景的数据集,用于处理用户查询中的冲突证据,包括歧义、错误信息和噪声。每个实例包含问题、文档列表(每个文档包含文本、类型和答案)、歧义实体列表、正确答案列表和错误答案列表。

RAMDocs is a dataset that simulates complex and realistic scenarios for handling conflicting evidence in user queries, including ambiguity, misinformation and noise. Each instance consists of a question, a list of documents (each containing text, type and answer), a list of ambiguous entities, a list of correct answers and a list of incorrect answers.
创建时间:
2025-04-17
原始信息汇总

RAMDocs数据集概述

数据集基本信息

  • 名称: RAMDocs
  • 领域: 检索增强生成(Retrieval-Augmented Generation)
  • 主要用途: 模拟复杂且现实的冲突证据场景,包括歧义、错误信息和噪声
  • 数据文件: RAMDocs_test.jsonl

数据结构

每个实例包含以下字段:

  • question: 问题文本
  • documents: 文档列表,每个文档包含:
    • text: 文档文本
    • type: 文档类型(correct正确回答、misinfo错误信息、noise噪声)
    • answer: 文档中的答案(noise类型为unknown
  • disambig_entity: 问题中歧义实体的消歧列表
  • gold_answers: 不同消歧实体的正确答案列表
  • wrong_answers: 问题的错误答案列表

相关框架

  • MADAM-RAG: 结构化多代理框架,用于处理文档间冲突、错误信息和噪声
    • 关键组件:
      1. 独立LLM对话代理
      2. 中央聚合器
      3. 迭代多轮辩论过程

运行要求

  • 依赖安装: bash pip install -r requirements.txt

  • 运行命令示例: bash python run_madam_rag.py --model_name meta-llama/Llama-3.3-70B-Instruct --dataset_path RAMDocs_test.jsonl

引用信息

bibtex @article{wang2025retrieval, title={Retrieval-Augmented Generation with Conflicting Evidence}, author={Han Wang and Archiki Prasad and Elias Stengel-Eskin and Mohit Bansal}, year={2025}, journal={arXiv preprint arXiv:2504.13079} }

致谢

感谢AmbigDocs作者公开数据

搜集汇总
数据集介绍
main_image_url
构建方式
RAMDocs数据集通过精心设计的模拟场景构建,旨在反映真实世界中信息检索的复杂性。研究者采用结构化方法生成每个实例,包含用户查询、多类型文档(正确信息、错误信息和噪声)、消歧实体及标准答案集合。文档类型标注基于其对问题的解答准确性,噪声文档则明确标记为未知答案,这种分层标注策略有效捕捉了信息冲突的多样性。数据构建过程特别注重模拟现实场景中的模糊性、错误信息和噪声干扰,为研究检索增强生成系统在复杂环境下的表现提供了理想测试平台。
特点
该数据集最显著的特点是系统性地整合了信息冲突的多种形态,包括答案模糊性、错误信息干扰和无关噪声。每个查询实例关联的文档集经过严格分类,明确区分正确解答、误导性内容和无关文本,这种结构化设计便于定量分析系统在不同冲突类型下的表现。数据集特别设计了消歧实体列表和对应标准答案,为评估系统处理命名歧义的能力提供了基准。统计特征显示文档类型分布均衡,能够全面测试系统在混合证据环境下的鲁棒性和推理能力。
使用方法
使用RAMDocs数据集时,研究者可通过加载标准JSONL格式文件获取结构化测试实例。典型工作流程包括:解析问题字段作为输入,处理文档集时需特别关注其类型标签以模拟真实检索结果。配套提供的MADAM-RAG框架实现多智能体辩论机制,用户可通过指定预训练模型路径和数据集路径快速复现实验。该框架支持自定义辩论轮次和随机种子,便于控制实验变量。数据集特别适用于评估系统在冲突证据下的答案生成质量,通过分析模型对gold_answers和wrong_answers的响应差异,可深入探究错误信息的缓解机制。
背景与挑战
背景概述
RAMDocs数据集由Han Wang、Archiki Prasad、Elias Stengel-Eskin和Mohit Bansal等研究人员于2025年提出,旨在模拟复杂且真实的冲突证据场景,包括歧义、错误信息和噪音。该数据集专注于解决检索增强生成(Retrieval-Augmented Generation, RAG)系统中面临的证据冲突问题,为相关领域的研究提供了重要的实验基础。RAMDocs通过提供包含正确信息、错误信息和噪音的多样化文档,帮助研究者评估和改进模型在处理冲突证据时的性能。该数据集的发布推动了自然语言处理领域对RAG系统的深入探索,特别是在歧义消解和错误信息过滤方面具有显著影响力。
当前挑战
RAMDocs数据集主要挑战包括两个方面:领域问题的挑战和构建过程的挑战。在领域问题方面,该数据集旨在解决RAG系统中证据冲突带来的复杂问题,如歧义消解、错误信息识别和噪音过滤。这些挑战要求模型具备强大的推理能力和上下文理解能力。在构建过程中,研究人员需要精心设计多样化的冲突场景,确保文档类型的平衡分布,同时保证数据的真实性和复杂性。此外,数据标注过程中如何准确划分文档类型(正确信息、错误信息和噪音)以及生成高质量的金标准答案也是一项重要挑战。这些挑战共同构成了RAMDocs数据集的核心研究价值。
常用场景
经典使用场景
在自然语言处理和信息检索领域,RAMDocs数据集被广泛用于模拟复杂且真实的冲突证据场景。研究者利用该数据集评估检索增强生成(RAG)系统在处理模糊性、错误信息和噪声方面的能力。通过提供包含正确、错误和无关文档的多样化数据,RAMDocs为测试模型在多重证据冲突下的鲁棒性提供了理想平台。
实际应用
在实际应用中,RAMDocs数据集被用于优化智能客服、搜索引擎和事实核查系统。医疗咨询平台借助该数据集训练模型识别相互矛盾的医学建议,新闻聚合系统则利用其区分事实性报道与误导信息。金融领域应用该数据集开发能识别市场谣言的投资分析工具,显著提升了信息可信度评估的准确性。
衍生相关工作
基于RAMDocs数据集衍生的经典工作包括多智能体辩论框架MADAM-RAG,该框架通过独立代理生成、中心聚合和迭代辩论的三阶段设计,显著提升了冲突证据下的生成质量。后续研究扩展了其在跨语言场景的应用,开发出能处理多语言文档冲突的X-RAG系统。AmbigDocs等关联数据集的建立也受到RAMDocs设计理念的启发。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作