M2RAG|多模态模型数据集|自然语言处理数据集
收藏M2RAG 数据集概述
数据集简介
- 数据集名称:M2RAG
- 数据集用途:评估多模态大型语言模型(MLLMs)在利用多模态检索文档回答问题方面的能力。
- 包含任务:图像字幕、多模态问答、事实验证、图像重排。
数据集构成
-
数据结构:数据集分为四个任务文件夹,包含对应的训练和测试数据。
data/ └──m2rag/ ├──fact_verify/ ├──image_cap/ ├──image_rerank/ ├──mmqa/ ├──imgs.lineidx.new └──imgs.tsv
使用要求
- 环境要求:Python 3.10,Pytorch,Transformers,Clip,Faiss,Tqdm,Numpy,Base64,Diffusers,Flash-Attn,Llamafactory,Accelerate,Nltk,Rouge Score,Sklearn。
- 预训练模型:MiniCPM-V 2.6,Qwen2-VL,VISTA。
数据集获取
- 下载方式:使用
git clone
命令下载项目代码,从 Hugging Face 或按照说明逐步构建数据集。 - 数据链接:M2RAG,图像数据从 Google Drive 下载。
使用说明
- 零样本设置:提供脚本进行编码、检索、推理等步骤。
- 模型训练:提供脚本进行训练数据准备、模型微调、推理等步骤。
评估方法
- 评估脚本:根据任务类型使用不同的评估脚本进行模型性能评估。
联系方式
- 联系方式:zhuxingsheng@stumail.neu.edu.cn,zhoutianshuo@stumail.neu.edu.cn。
引用信息
- 论文引用:Liu, Zhenghao, et al. "Benchmarking Retrieval-Augmented Generation in Multi-Modal Contexts." arXiv preprint arXiv:2502.17297 (2025 Mar 2025).

中国交通事故深度调查(CIDAS)数据集
交通事故深度调查数据通过采用科学系统方法现场调查中国道路上实际发生交通事故相关的道路环境、道路交通行为、车辆损坏、人员损伤信息,以探究碰撞事故中车损和人伤机理。目前已积累深度调查事故10000余例,单个案例信息包含人、车 、路和环境多维信息组成的3000多个字段。该数据集可作为深入分析中国道路交通事故工况特征,探索事故预防和损伤防护措施的关键数据源,为制定汽车安全法规和标准、完善汽车测评试验规程、
北方大数据交易中心 收录
DroneVehicle 大规模无人机航拍车辆检测数据集
这个数据集是天津大学的研究团队在进行无人机航拍图像的车辆检测和计数研究过程中收集和标注的。研究团队于 2020 年发布,相关论文成果为「Drone-based RGB-Infrared Cross-Modality Vehicle Detection via Uncertainty-Aware Learning」。
超神经 收录
CrowdHuman
CrowdHuman是一个用于评估人群场景中检测器性能的基准数据集。该数据集规模大、注释丰富且具有高多样性,包含训练、验证和测试集,共计47万个标注的人体实例,平均每张图像有23个人,包含各种遮挡情况。每个人体实例都标注有头部边界框、可见区域边界框和全身边界框。
github 收录
FAOSTAT Agricultural Data
FAOSTAT Agricultural Data 是由联合国粮食及农业组织(FAO)提供的全球农业数据集。该数据集涵盖了农业生产、贸易、价格、土地利用、水资源、气候变化、人口统计等多个方面的详细信息。数据包括了全球各个国家和地区的农业统计数据,旨在为政策制定者、研究人员和公众提供全面的农业信息。
www.fao.org 收录
China Air Quality Historical Data
该数据集包含了中国多个城市的空气质量历史数据,涵盖了PM2.5、PM10、SO2、NO2、CO、O3等污染物浓度以及空气质量指数(AQI)等信息。数据按小时记录,提供了详细的空气质量监测数据。
www.cnemc.cn 收录