five

RAGBench

收藏
arXiv2025-09-30 收录
下载链接:
https://huggingface.co/datasets/rungalileo/ragbench
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集名为RAGBench,是首个大规模、全面的RAG基准数据集,包含了100,000个样本,跨越了五个独特的行业特定领域,并涵盖了各种RAG任务类型。RAGBench数据集还包含了可解释的标签,这些标签有助于对RAG系统进行全面的评估,并提供了可操作性的反馈,以促进系统的持续改进。其规模达到了100,000个样本,任务是对检索增强生成系统进行评估。

This dataset, named RAGBench, is the first large-scale and comprehensive RAG benchmark dataset. It includes 100,000 samples across five distinct industry-specific domains and covers a wide range of RAG task types. The RAGBench dataset also provides interpretable labels, which enable thorough evaluation of RAG systems and offer actionable feedback to support continuous system optimization. With 100,000 samples in total, this benchmark is dedicated to the evaluation of retrieval-augmented generation systems.
提供机构:
Hugging Face
搜集汇总
数据集介绍
main_image_url
背景与挑战
背景概述
RAGBench是一个大规模的RAG基准数据集,包含约10万示例,覆盖五个独特的行业特定领域和多种RAG任务类型,数据来源于用户手册等实际行业语料库,具有高度的行业应用相关性。数据集由12个子集组成,如covidqa和cuad,每个子集分为训练、验证和测试分割,总行数95,381行,总文件大小451 MB,采用Parquet格式和CC-BY-4.0许可证。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作