zhangyanbo/fiqa
收藏Hugging Face2024-06-24 更新2024-06-29 收录
下载链接:
https://hf-mirror.com/datasets/zhangyanbo/fiqa
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含三个主要配置:corpus、main和ragas_eval。corpus配置包含一个名为doc的字符串特征,主要用于存储文档数据,包含57,638个示例。main配置包含question和ground_truths两个字符串特征,适用于问答系统或类似任务,包含6,648个示例,分为训练集、测试集和验证集。ragas_eval配置包含question、ground_truths、answer和contexts四个字符串特征,可能用于评估问答系统的性能,包含30个示例。
The dataset consists of three main configurations: corpus, main, and ragas_eval. The corpus configuration includes a string feature named doc, primarily used for storing document data, containing 57,638 examples. The main configuration includes two string features, question and ground_truths, suitable for question-answering systems or similar tasks, containing 6,648 examples divided into training, test, and validation sets. The ragas_eval configuration includes four string features: question, ground_truths, answer, and contexts, likely used for evaluating the performance of question-answering systems, containing 30 examples.
提供机构:
zhangyanbo
原始信息汇总
数据集概述
数据集配置
配置名称:corpus
- 特征:
doc:类型为string
- 分割:
corpus:- 字节数:44510862
- 样本数:57638
- 下载大小:28094463 字节
- 数据集大小:44510862 字节
配置名称:main
- 特征:
question:类型为stringground_truths:类型为string
- 分割:
train:- 字节数:15036287
- 样本数:5500
test:- 字节数:1829956
- 样本数:648
validation:- 字节数:1356926
- 样本数:500
- 下载大小:10791714 字节
- 数据集大小:18223169 字节
配置名称:ragas_eval
- 特征:
question:类型为stringground_truths:类型为stringanswer:类型为stringcontexts:类型为string
- 分割:
baseline:- 字节数:114900
- 样本数:30
- 下载大小:81929 字节
- 数据集大小:114900 字节
数据文件路径
配置名称:corpus
- 分割:
corpus:路径为corpus/corpus-*
配置名称:main
- 分割:
train:路径为main/train-*test:路径为main/test-*validation:路径为main/validation-*
配置名称:ragas_eval
- 分割:
baseline:路径为ragas_eval/baseline-*



