the-coorporation/the_squad_qg
收藏Hugging Face2023-04-23 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/the-coorporation/the_squad_qg
下载链接
链接失效反馈官方服务:
资源简介:
The SQuAD QG Dataset是基于Stanford Question Answering Dataset (SQuAD)的修改版本,旨在用于问题生成。该数据集包含两个配置(v1和v2),每个配置都有训练集和验证集。每个数据实例包含一个上下文(context)和与之相关的问题(questions)。数据集的字段包括context和questions,均为字符串类型。数据集的结构和内容详细描述了每个配置的训练集和验证集的样本数量和字节大小。
The SQuAD QG Dataset是基于Stanford Question Answering Dataset (SQuAD)的修改版本,旨在用于问题生成。该数据集包含两个配置(v1和v2),每个配置都有训练集和验证集。每个数据实例包含一个上下文(context)和与之相关的问题(questions)。数据集的字段包括context和questions,均为字符串类型。数据集的结构和内容详细描述了每个配置的训练集和验证集的样本数量和字节大小。
提供机构:
the-coorporation
原始信息汇总
数据集概述
数据集名称
- 名称: The SQuAD QG Dataset
数据集版本
-
版本 v1:
- 训练集: 18891 个样本,占用 20391081 字节
- 验证集: 2067 个样本,占用 2389185 字节
- 下载大小: 25308169 字节
- 数据集大小: 22780266 字节
-
版本 v2:
- 训练集: 18877 个样本,占用 20328952 字节
- 验证集: 1204 个样本,占用 1419411 字节
- 下载大小: 24163282 字节
- 数据集大小: 21748363 字节
数据集特征
- context: 字符串类型
- questions: 字符串类型
数据集语言
- 语言: 英语 (en)



