five

derek-thomas/squad-v1.1-t5-question-generation

收藏
Hugging Face2023-03-09 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/derek-thomas/squad-v1.1-t5-question-generation
下载链接
链接失效反馈
官方服务:
资源简介:
这是一个基于斯坦福问答数据集(SQuAD)修改的数据集,专门用于T5模型的问答生成任务。数据集的结构包括上下文和问题两个字段,数据分割为训练集和验证集。数据集的目的是生成问题,前缀为`generate questions:`,以便训练模型时任务唯一。数据集的语言为英语,许可证为CC-BY-4.0。
提供机构:
derek-thomas
原始信息汇总

数据集概述

数据集基本信息

  • 名称: squad-v1.1-t5-question-generation
  • 别名: Question Generation for T5 based on Squad V1.1
  • 语言: 英语 (en)
  • 许可证: cc-by-4.0
  • 多语言性: 单语种
  • 大小类别: 10K<n<100K

数据集结构

数据特征

  • context: 字符串类型
  • questions: 字符串类型

数据分割

名称 训练集 验证集
数量 18896 2067
字节数 20293805 2376313

数据集大小

  • 下载大小: 12600387 字节
  • 数据集总大小: 22670118 字节

数据集来源与创建

  • 注释创建者: 众包
  • 语言创建者: 众包
  • 源数据集: 扩展自 squad

任务与标签

  • 任务类别: 文本到文本生成
  • 标签:
    • questiongeneration
    • question-generation
    • text2text-generation
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作