paperzilla/paperzilla-rag-retrieval-250
收藏Hugging Face2025-11-17 更新2025-11-30 收录
下载链接:
https://hf-mirror.com/datasets/paperzilla/paperzilla-rag-retrieval-250
下载链接
链接失效反馈官方服务:
资源简介:
这是一个多标注员基准数据集,用于评估检索系统在RAG(检索增强生成)研究论文上的性能。该数据集包含来自arXiv的250篇计算机科学论文,每篇论文由5个不同的语言模型独立标注,以评估其与研究兴趣的相关性。数据集提供了详细的标注信息,包括相关性评分、推理和元数据,并以JSON格式提供,方便用户访问和分析。
A multi-annotator benchmark dataset for evaluating retrieval systems on RAG (Retrieval-Augmented Generation) research papers. This dataset contains 250 computer science papers from arXiv, each independently annotated by 5 different large language models for relevance to RAG and hybrid retrieval research.
提供机构:
paperzilla



