xPXXX/fiqa_sample100
收藏Hugging Face2024-04-18 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/xPXXX/fiqa_sample100
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含多个配置,每个配置都包含查询、语料库、真实答案等特征。部分配置还包含特定模型的响应(如GPT-3、GPT-4、LLaMA2等)以及检索信息。数据集主要用于训练和评估不同模型在问答任务中的表现,特别是那些涉及检索增强生成(RAG)的模型。
该数据集包含多个配置,每个配置都包含查询、语料库、真实答案等特征。部分配置还包含特定模型的响应(如GPT-3、GPT-4、LLaMA2等)以及检索信息。数据集主要用于训练和评估不同模型在问答任务中的表现,特别是那些涉及检索增强生成(RAG)的模型。
提供机构:
xPXXX
原始信息汇总
数据集概述
数据集配置及特征
-
默认配置 (config_name: default)
- 特征:
query: 字符串类型corpus: 字符串序列ground_truths: 字符串序列
- 训练集:
- 字节数: 545515
- 示例数: 100
- 下载大小: 341614
- 数据集大小: 545515
- 特征:
-
微调Llama2无RAG配置 (config_name: finetune_llama2_no_rag)
- 特征:
- 新增特征
finetune_llama2_no_rag_response: 字符串类型
- 新增特征
- 训练集:
- 字节数: 950460
- 示例数: 100
- 下载大小: 539313
- 数据集大小: 950460
- 特征:
-
微调Llama2带RAG配置 (config_name: finetune_llama2_rag)
- 特征:
- 新增特征
finetune_llama2_rag_response: 字符串类型 - 新增特征
retrieval: 字符串序列
- 新增特征
- 训练集:
- 字节数: 1347351
- 示例数: 100
- 下载大小: 674714
- 数据集大小: 1347351
- 特征:
-
GPT3无RAG配置 (config_name: gpt3_no_rag)
- 特征:
- 新增特征
gpt3_no_rag_response: 字符串类型
- 新增特征
- 训练集:
- 字节数: 626884
- 示例数: 100
- 下载大小: 385855
- 数据集大小: 626884
- 特征:
-
GPT3带RAG配置 (config_name: gpt3_rag)
- 特征:
- 新增特征
gpt3_rag_response: 字符串类型 - 新增特征
retrieval: 字符串序列
- 新增特征
- 训练集:
- 字节数: 973213
- 示例数: 100
- 下载大小: 517276
- 数据集大小: 973213
- 特征:
-
GPT4无RAG配置 (config_name: gpt4_no_rag)
- 特征:
- 新增特征
gpt4_no_rag_response: 字符串类型
- 新增特征
- 训练集:
- 字节数: 826180
- 示例数: 100
- 下载大小: 507376
- 数据集大小: 826180
- 特征:
-
GPT4带RAG配置 (config_name: gpt4_rag)
- 特征:
- 新增特征
gpt4_rag_response: 字符串类型 - 新增特征
retrieval: 字符串序列
- 新增特征
- 训练集:
- 字节数: 993139
- 示例数: 100
- 下载大小: 528640
- 数据集大小: 993139
- 特征:
-
Llama2无RAG配置 (config_name: llama2_no_rag)
- 特征:
- 新增特征
llama2_no_rag_response: 字符串类型
- 新增特征
- 训练集:
- 字节数: 756132
- 示例数: 100
- 下载大小: 452395
- 数据集大小: 756132
- 特征:
-
Llama2带RAG配置 (config_name: llama2_rag)
- 特征:
- 新增特征
llama2_rag_response: 字符串类型 - 新增特征
retrieval: 字符串序列
- 新增特征
- 训练集:
- 字节数: 1056362
- 示例数: 100
- 下载大小: 558257
- 数据集大小: 1056362
- 特征:
数据文件路径
- 默认配置:
data/train-* - 微调Llama2无RAG配置:
finetune_llama2_no_rag/train-* - 微调Llama2带RAG配置:
finetune_llama2_rag/train-* - GPT3无RAG配置:
gpt3_no_rag/train-* - GPT3带RAG配置:
gpt3_rag/train-* - GPT4无RAG配置:
gpt4_no_rag/train-* - GPT4带RAG配置:
gpt4_rag/train-* - Llama2无RAG配置:
llama2_no_rag/train-* - Llama2带RAG配置:
llama2_rag/train-*



