pszemraj/SQuALITY-v1.3
收藏Hugging Face2023-02-27 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/pszemraj/SQuALITY-v1.3
下载链接
链接失效反馈官方服务:
资源简介:
SQuALITY v1.3是一个文本处理数据集,专注于文本摘要和文本生成任务。该数据集包含约5000字的长文档,并提供了详细的元数据、文档内容以及相关问题和回答。数据集通过JSON lines格式存储,分为训练、测试和验证集,确保了数据的质量和完整性。
SQuALITY v1.3是一个文本处理数据集,专注于文本摘要和文本生成任务。该数据集包含约5000字的长文档,并提供了详细的元数据、文档内容以及相关问题和回答。数据集通过JSON lines格式存储,分为训练、测试和验证集,确保了数据的质量和完整性。
提供机构:
pszemraj
原始信息汇总
SQuALITY v1.3 数据集概述
基本信息
- 许可证: Apache-2.0
- 语言: 英语
- 任务类别:
- 摘要生成
- 文本到文本生成
- 标签:
- 摘要生成
- 长文档
- 数据集名称: SQuALITY v1.3
- 大小类别: 小于1000条记录
数据集内容
- 文件格式: JSON lines (.jsonl)
- 数据结构:
- metadata: 包含Gutenberg故事ID、内部UID和Project Gutenberg许可证
- document: Gutenberg故事文本
- questions: 问题列表,每个问题包含:
- 问题文本
- 问题编号
- 响应列表,每个响应包含:
- 匿名工作者ID
- 内部UID
- 对问题的回答
数据集划分
- 训练集: 50条记录
- 测试集: 52条记录
- 验证集: 25条记录



