MTRAG|多轮对话数据集|RAG数据集
收藏MTRAG: Multi-Turn RAG Benchmark
数据集概述
MTRAG是一个综合且多样的人工生成的多轮RAG(Retrieval-Augmented Generation)数据集,包含四个文档语料库。该数据集旨在反映多轮对话的真实世界属性,是目前首个端到端的人工生成的多轮RAG基准。
语料库
数据集基于四个领域的文档语料库:ClapNQ、Cloud、FiQA和Govt。其中,ClapNQ和FiQA是来自QA/IR数据集的现有语料库,而Govt和Cloud是为该基准专门组装的新语料库。
语料库 | 领域 | 数据 | 文档数量 | 段落数量 |
---|---|---|---|---|
ClapNQ | Wikipedia | Corpus | 4,293 | 183,408 |
Cloud | 技术文档 | Corpus | 57,638 | 61,022 |
FiQA | 金融 | Corpus | 7,661 | 49,607 |
Govt | 政府 | Corpus | 8,578 | 72,422 |
人工数据
MTRAG包含110个多轮对话,转换为842个评估任务。
特征
- 多样的问题类型
- 可回答、不可回答、部分回答和对话式问题
- 多轮:跟进和澄清
- 四个领域
- 相关和不相关的段落(不相关的段落可作为硬负样本)
对话
提供了110个对话的基准,平均每个对话有7.7轮。每个对话都经过审查阶段,以确保高质量。
检索任务
每个领域的检索任务以BEIR格式提供,仅限于可回答和部分回答任务。
生成任务
对话被转换为842个任务,每个任务包含所有之前的轮次和最后一个用户问题。生成任务在三种检索设置下进行评估。
设置 | 描述 | 文件 |
---|---|---|
Reference | 使用参考段落生成 | reference.jsonl |
Reference + RAG | 检索后生成,但保留参考段落在前5个段落中 | reference+RAG.jsonl |
Full RAG | 检索后生成,检索结果为前5个段落 | RAG.jsonl |
合成数据
提供了200个合成生成的对话,这些对话遵循人工数据的属性。
对话
合成对话可在此处获取。
生成任务
设置 | 描述 | 文件 |
---|---|---|
Reference | 使用参考段落生成 | synthetic.jsonl |

LFW
人脸数据集;LFW数据集共有13233张人脸图像,每张图像均给出对应的人名,共有5749人,且绝大部分人仅有一张图片。每张图片的尺寸为250X250,绝大部分为彩色图像,但也存在少许黑白人脸图片。 URL: http://vis-www.cs.umass.edu/lfw/index.html#download
AI_Studio 收录
UAVDT
UAVDT数据集由中国科学院大学等机构创建,包含约80,000帧从10小时无人机拍摄视频中精选的图像,覆盖多种复杂城市环境。数据集主要关注车辆目标,每帧均标注了边界框及多达14种属性,如天气条件、飞行高度、相机视角等。该数据集旨在推动无人机视觉技术在不受限制场景下的研究,解决高密度、小目标、相机运动等挑战,适用于物体检测、单目标跟踪和多目标跟踪等基础视觉任务。
arXiv 收录
Subway Dataset
该数据集包含了全球多个城市的地铁系统数据,包括车站信息、线路图、列车时刻表、乘客流量等。数据集旨在帮助研究人员和开发者分析和模拟城市交通系统,优化地铁运营和乘客体验。
www.kaggle.com 收录
Materials Project
材料项目是一组标有不同属性的化合物。数据集链接: MP 2018.6.1(69,239 个材料) MP 2019.4.1(133,420 个材料)
OpenDataLab 收录
Fruits-360
一个高质量的水果图像数据集,包含多种水果的图像,如苹果、香蕉、樱桃等,总计42345张图片,分为训练集和验证集,共有64个水果类别。
github 收录