five

xPXXX/fiqa_sample100

收藏
Hugging Face2024-04-18 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/xPXXX/fiqa_sample100
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含多个配置,每个配置都包含查询、语料库、真实答案等特征。部分配置还包含特定模型的响应(如GPT-3、GPT-4、LLaMA2等)以及检索信息。数据集主要用于训练和评估不同模型在问答任务中的表现,特别是那些涉及检索增强生成(RAG)的模型。

该数据集包含多个配置,每个配置都包含查询、语料库、真实答案等特征。部分配置还包含特定模型的响应(如GPT-3、GPT-4、LLaMA2等)以及检索信息。数据集主要用于训练和评估不同模型在问答任务中的表现,特别是那些涉及检索增强生成(RAG)的模型。
提供机构:
xPXXX
原始信息汇总

数据集概述

数据集配置及特征

  1. 默认配置 (config_name: default)

    • 特征:
      • query: 字符串类型
      • corpus: 字符串序列
      • ground_truths: 字符串序列
    • 训练集:
      • 字节数: 545515
      • 示例数: 100
    • 下载大小: 341614
    • 数据集大小: 545515
  2. 微调Llama2无RAG配置 (config_name: finetune_llama2_no_rag)

    • 特征:
      • 新增特征 finetune_llama2_no_rag_response: 字符串类型
    • 训练集:
      • 字节数: 950460
      • 示例数: 100
    • 下载大小: 539313
    • 数据集大小: 950460
  3. 微调Llama2带RAG配置 (config_name: finetune_llama2_rag)

    • 特征:
      • 新增特征 finetune_llama2_rag_response: 字符串类型
      • 新增特征 retrieval: 字符串序列
    • 训练集:
      • 字节数: 1347351
      • 示例数: 100
    • 下载大小: 674714
    • 数据集大小: 1347351
  4. GPT3无RAG配置 (config_name: gpt3_no_rag)

    • 特征:
      • 新增特征 gpt3_no_rag_response: 字符串类型
    • 训练集:
      • 字节数: 626884
      • 示例数: 100
    • 下载大小: 385855
    • 数据集大小: 626884
  5. GPT3带RAG配置 (config_name: gpt3_rag)

    • 特征:
      • 新增特征 gpt3_rag_response: 字符串类型
      • 新增特征 retrieval: 字符串序列
    • 训练集:
      • 字节数: 973213
      • 示例数: 100
    • 下载大小: 517276
    • 数据集大小: 973213
  6. GPT4无RAG配置 (config_name: gpt4_no_rag)

    • 特征:
      • 新增特征 gpt4_no_rag_response: 字符串类型
    • 训练集:
      • 字节数: 826180
      • 示例数: 100
    • 下载大小: 507376
    • 数据集大小: 826180
  7. GPT4带RAG配置 (config_name: gpt4_rag)

    • 特征:
      • 新增特征 gpt4_rag_response: 字符串类型
      • 新增特征 retrieval: 字符串序列
    • 训练集:
      • 字节数: 993139
      • 示例数: 100
    • 下载大小: 528640
    • 数据集大小: 993139
  8. Llama2无RAG配置 (config_name: llama2_no_rag)

    • 特征:
      • 新增特征 llama2_no_rag_response: 字符串类型
    • 训练集:
      • 字节数: 756132
      • 示例数: 100
    • 下载大小: 452395
    • 数据集大小: 756132
  9. Llama2带RAG配置 (config_name: llama2_rag)

    • 特征:
      • 新增特征 llama2_rag_response: 字符串类型
      • 新增特征 retrieval: 字符串序列
    • 训练集:
      • 字节数: 1056362
      • 示例数: 100
    • 下载大小: 558257
    • 数据集大小: 1056362

数据文件路径

  • 默认配置: data/train-*
  • 微调Llama2无RAG配置: finetune_llama2_no_rag/train-*
  • 微调Llama2带RAG配置: finetune_llama2_rag/train-*
  • GPT3无RAG配置: gpt3_no_rag/train-*
  • GPT3带RAG配置: gpt3_rag/train-*
  • GPT4无RAG配置: gpt4_no_rag/train-*
  • GPT4带RAG配置: gpt4_rag/train-*
  • Llama2无RAG配置: llama2_no_rag/train-*
  • Llama2带RAG配置: llama2_rag/train-*
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作