derek-thomas/squad-v1.1-t5-question-generation
收藏Hugging Face2023-03-09 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/derek-thomas/squad-v1.1-t5-question-generation
下载链接
链接失效反馈官方服务:
资源简介:
这是一个基于斯坦福问答数据集(SQuAD)修改的数据集,专门用于T5模型的问答生成任务。数据集的结构包括上下文和问题两个字段,数据分割为训练集和验证集。数据集的目的是生成问题,前缀为`generate questions:`,以便训练模型时任务唯一。数据集的语言为英语,许可证为CC-BY-4.0。
提供机构:
derek-thomas
原始信息汇总
数据集概述
数据集基本信息
- 名称: squad-v1.1-t5-question-generation
- 别名: Question Generation for T5 based on Squad V1.1
- 语言: 英语 (en)
- 许可证: cc-by-4.0
- 多语言性: 单语种
- 大小类别: 10K<n<100K
数据集结构
数据特征
- context: 字符串类型
- questions: 字符串类型
数据分割
| 名称 | 训练集 | 验证集 |
|---|---|---|
| 数量 | 18896 | 2067 |
| 字节数 | 20293805 | 2376313 |
数据集大小
- 下载大小: 12600387 字节
- 数据集总大小: 22670118 字节
数据集来源与创建
- 注释创建者: 众包
- 语言创建者: 众包
- 源数据集: 扩展自 squad
任务与标签
- 任务类别: 文本到文本生成
- 标签:
- questiongeneration
- question-generation
- text2text-generation



