five

BroDeadlines/EVAL.RAG.evaluation

收藏
Hugging Face2024-08-17 更新2024-07-22 收录
下载链接:
https://hf-mirror.com/datasets/BroDeadlines/EVAL.RAG.evaluation
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含多个特征,如问题、答案、URL、组别、文档ID、元数据、执行时间等。数据集分为两个部分:propostion_parent_k4和tdt_propostion_parent_k4,每个部分包含144个样本。数据集的总下载大小为147490字节,总大小为562816字节。此外,README文件还包含了关于QA、RAG、IR、BLEU和ROUGE-L的详细报告结果,这些结果涉及精确度、召回率、MAP分数、BLEU分数和ROUGE-L分数等指标。

The dataset includes multiple features such as question, answer, URL, group, doc_id, metadata, and execution time. The dataset is divided into two parts: propostion_parent_k4 and tdt_propostion_parent_k4, each containing 144 samples. The total download size of the dataset is 147490 bytes, and the total size is 562816 bytes. Additionally, the README file contains detailed report results on QA, RAG, IR, BLEU, and ROUGE-L, which include metrics such as precision, recall, MAP score, BLEU score, and ROUGE-L score.
提供机构:
BroDeadlines
原始信息汇总

数据集概述

数据集信息

  • 特征:

    • question: 问题,类型为字符串。
    • answer: 答案,类型为字符串。
    • url: URL链接,类型为字符串。
    • group: 分组,类型为字符串。
    • doc_id: 文档ID,类型为字符串。
    • metadata: 元数据,类型为字符串。
    • exc_second: 执行时间(秒),类型为浮点数。
    • evaluation: 评估信息,包含以下子特征:
      • content: 内容,类型为字符串。
      • doc_id: 文档ID,类型为字符串。
      • score: 分数,类型为浮点数。
  • 数据集分割:

    • propostion_parent_k4:
      • 字节数: 281408
      • 样本数: 144
    • tdt_propostion_parent_k4:
      • 字节数: 281408
      • 样本数: 144
  • 下载大小: 147490 字节

  • 数据集大小: 562816 字节

配置信息

  • 配置名称: default
    • 数据文件:
      • propostion_parent_k4: 路径为 data/propostion_parent_k4-*
      • tdt_propostion_parent_k4: 路径为 data/tdt_propostion_parent_k4-*
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作