Hellisotherpeople/DebateSum
收藏Hugging Face2022-12-03 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/Hellisotherpeople/DebateSum
下载链接
链接失效反馈官方服务:
资源简介:
DebateSum是一个大规模的辩论挖掘和摘要数据集,包含187328个辩论文档、论点(可视为抽象摘要或查询)、词级摘要、引用和相关元数据,按主题年份组织。该数据集适用于自然语言处理系统的分析,主要用于问题回答、摘要、文本检索和文本生成等任务。数据集以CSV文件格式分发,并提供了下载链接和重新生成数据集的步骤。
提供机构:
Hellisotherpeople
原始信息汇总
DebateSum数据集概述
基本信息
- 名称: DebateSum
- 描述: 一个大规模的论点挖掘和摘要数据集
- 语言: 英语 (en-US)
- 许可证: MIT
- 多语言性: 单语
- 大小: 100K<n<1M
- 来源: 原始数据
数据内容
- 包含: 187,328个辩论文档,论点(可视为摘要或查询),词级抽取摘要,引用和相关元数据,按主题-年份组织
任务类别
- 问题回答
- 摘要
- 文本检索
- 文本生成
具体任务
- 抽象问答 (abstractive-qa)
- 文档检索 (document-retrieval)
- 抽取问答 (extractive-qa)
下载
- 数据格式: CSV
- 下载链接: 这里
标签
- 条件文本生成 (conditional-text-generation)
搜集汇总
数据集介绍

背景与挑战
背景概述
DebateSum是一个大规模论证挖掘和摘要数据集,专注于英语辩论文档,包含超过24万行数据,涵盖完整文档、提取摘要、抽象摘要和引用信息。该数据集适用于自然语言处理任务,如问答、摘要和文本检索,并提供了丰富的元数据(如辩论营、标签和年份)以支持深入分析。其特点在于结合了论证挖掘与摘要生成,为研究辩论结构和内容总结提供了结构化资源。
以上内容由遇见数据集搜集并总结生成



