five

pszemraj/SQuALITY-v1.3

收藏
Hugging Face2023-02-27 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/pszemraj/SQuALITY-v1.3
下载链接
链接失效反馈
官方服务:
资源简介:
SQuALITY v1.3是一个文本处理数据集,专注于文本摘要和文本生成任务。该数据集包含约5000字的长文档,并提供了详细的元数据、文档内容以及相关问题和回答。数据集通过JSON lines格式存储,分为训练、测试和验证集,确保了数据的质量和完整性。

SQuALITY v1.3是一个文本处理数据集,专注于文本摘要和文本生成任务。该数据集包含约5000字的长文档,并提供了详细的元数据、文档内容以及相关问题和回答。数据集通过JSON lines格式存储,分为训练、测试和验证集,确保了数据的质量和完整性。
提供机构:
pszemraj
原始信息汇总

SQuALITY v1.3 数据集概述

基本信息

  • 许可证: Apache-2.0
  • 语言: 英语
  • 任务类别:
    • 摘要生成
    • 文本到文本生成
  • 标签:
    • 摘要生成
    • 长文档
  • 数据集名称: SQuALITY v1.3
  • 大小类别: 小于1000条记录

数据集内容

  • 文件格式: JSON lines (.jsonl)
  • 数据结构:
    • metadata: 包含Gutenberg故事ID、内部UID和Project Gutenberg许可证
    • document: Gutenberg故事文本
    • questions: 问题列表,每个问题包含:
      • 问题文本
      • 问题编号
      • 响应列表,每个响应包含:
        • 匿名工作者ID
        • 内部UID
        • 对问题的回答

数据集划分

  • 训练集: 50条记录
  • 测试集: 52条记录
  • 验证集: 25条记录
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作