facebook/babi_qa
收藏Hugging Face2023-01-25 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/facebook/babi_qa
下载链接
链接失效反馈官方服务:
资源简介:
BabiQa数据集是一个机器生成的、单语(英语)问答数据集,采用CC-BY-3.0许可。该数据集包含多个配置,每个配置包含不同大小的训练和测试集。数据集中的故事由上下文和问题序列组成,每个问题都有支持ID和答案。数据集分为训练集和测试集,每个集的大小和示例数量都有详细记录。
The BabiQa dataset is a machine-generated, monolingual (English) question answering dataset licensed under CC-BY-3.0. It includes multiple configurations, each containing training and test sets of varying sizes. The stories in the dataset consist of context and question sequences, with each question paired with supporting IDs and answers. The dataset is divided into training and test sets, with the sizes and the number of examples for each set fully documented.
提供机构:
facebook
原始信息汇总
BabiQa数据集概述
基本信息
- 数据集名称: BabiQa
- 语言: 英语(en)
- 多语言性: 单语
- 许可证: CC-BY-3.0
- 标注创建者: 机器生成
- 语言创建者: 机器生成
- 任务类别: 问答(question-answering)
- 数据集大小:
- 小于1K
- 1K至10K
- 10K至100K
数据集配置
- 配置名称:
- en-10k-qa1至en-10k-qa20
- en-qa1至en-qa20
- en-valid-10k-qa1至en-valid-10k-qa20
- en-valid-qa1至en-valid-qa20
- hn-10k-qa1至hn-10k-qa20
- hn-qa1至hn-qa20
- shuffled-10k-qa1至shuffled-10k-qa20
- shuffled-qa1至shuffled-qa20
数据集特征
- 特征名称: story
- 特征结构:
- id: 字符串
- type: 分类标签(context, question)
- text: 字符串
- supporting_ids: 字符串序列
- answer: 字符串
数据集分割
- 分割名称: train, test
- 示例:
- 配置名称: en-qa1
- 训练集: 200个示例,165386字节
- 测试集: 200个示例,165517字节
- 配置名称: en-qa2
- 训练集: 200个示例,302888字节
- 测试集: 200个示例,306631字节
- 配置名称: en-qa3
- 训练集: 200个示例,887756字节
- 测试集: 200个示例,883187字节
- 配置名称: en-qa4
- 训练集: 1000个示例,205510字节
- 测试集: 1000个示例,205434字节
- 配置名称: en-qa5
- 训练集: 200个示例,337349字节
- 测试集: 200个示例,350457字节
- 配置名称: en-qa6
- 训练集: 200个示例,173053字节
- 测试集: 200个示例,172249字节
- 配置名称: en-qa7
- 训练集: 200个示例,224778字节
- 测试集: 200个示例,215512字节
- 配置名称: en-qa8
- 训练集: 200个示例,212517字节
- 测试集: 200个示例,216244字节
- 配置名称: en-qa9
- 训练集: 200个示例,168350字节
- 测试集: 200个示例,168248字节
- 配置名称: en-qa10
- 训练集: 200个示例,170257字节
- 测试集: 200个示例,170672字节
- 配置名称: en-qa11
- 训练集: 200个示例,178560字节
- 测试集: 200个示例,178840字节
- 配置名称: en-qa12
- 训练集: 200个示例,185600字节
- 测试集: 200个示例,185529字节
- 配置名称: en-qa13
- 训练集: 200个示例,190556字节
- 测试集: 200个示例,190484字节
- 配置名称: en-qa14
- 训练集: 200个示例,234355字节
- 测试集: 200个示例,233204字节
- 配置名称: en-qa15
- 训练集: 250个示例,163728字节
- 测试集: 250个示例,163809字节
- 配置名称: en-qa16
- 训练集: 1000个示例,456374字节
- 测试集: 1000个示例,456248字节
- 配置名称: en-qa17
- 训练集: 125个示例,103636字节
- 测试集: 125个示例,103618字节
- 配置名称: en-qa18
- 训练集: 198个示例,162875字节
- 测试集: 199个示例,161266字节
- 配置名称: en-qa19
- 训练集: 1000个示例,404536字节
- 测试集: 1000个示例,404489字节
- 配置名称: en-qa20
- 训练集: 94个示例,115812字节
- 测试集: 93个示例,115863字节
- 配置名称: hn-qa1
- 训练集: 200个示例,168605字节
- 测试集: 200个示例,168572字节
- 配置名称: hn-qa2
- 训练集: 200个示例,296391字节
- 测试集: 200个示例,288429字节
- 配置名称: hn-qa3
- 训练集: 167个示例,842184字节
- 测试集: 167个示例,808460字节
- 配置名称: hn-qa4
- 训练集: 1000个示例,231303字节
- 测试集: 1000个示例,231230字节
- 配置名称: hn-qa5
- 训练集: 200个示例,320859字节
- 测试集: 200个示例,315396字节
- 配置名称: hn-qa6
- 训练集: 200个示例,170796字节
- 测试集: 200个示例,171360字节
- 配置名称: hn-qa7
- 训练集: 200个示例,206981字节
- 测试集: 200个示例,208080字节
- 配置名称: hn-qa8
- 训练集: 200个示例,211584字节
- 测试集: 200个示例,222232字节
- 配置名称: hn-qa9
- 训练集: 200个示例,187718字节
- 测试集: 200个示例,187341字节
- 配置名称: hn-qa10
- 训练集: 200个示例,183583字节
- 测试集: 200个示例,182932字节
- 配置名称: hn-qa11
- 训练集: 200个示例,179698字节
- 测试集: 200个示例,180461字节
- 配置名称: hn-qa12
- 训练集: 200个示例,187731字节
- 测试集: 200个示例,187954字节
- 配置名称: hn-qa13
- 训练集: 125个示例,191395字节
- 测试集: 125个示例,191747字节
- 配置名称: en-qa1
搜集汇总
数据集介绍

背景与挑战
背景概述
babi_qa数据集包含20个问答任务,旨在评估阅读理解能力,支持多种语言和格式,适用于对话系统的训练和评估。
以上内容由遇见数据集搜集并总结生成



