five

Hellisotherpeople/DebateSum

收藏
Hugging Face2022-12-03 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/Hellisotherpeople/DebateSum
下载链接
链接失效反馈
官方服务:
资源简介:
DebateSum是一个大规模的辩论挖掘和摘要数据集,包含187328个辩论文档、论点(可视为抽象摘要或查询)、词级摘要、引用和相关元数据,按主题年份组织。该数据集适用于自然语言处理系统的分析,主要用于问题回答、摘要、文本检索和文本生成等任务。数据集以CSV文件格式分发,并提供了下载链接和重新生成数据集的步骤。
提供机构:
Hellisotherpeople
原始信息汇总

DebateSum数据集概述

基本信息

  • 名称: DebateSum
  • 描述: 一个大规模的论点挖掘和摘要数据集
  • 语言: 英语 (en-US)
  • 许可证: MIT
  • 多语言性: 单语
  • 大小: 100K<n<1M
  • 来源: 原始数据

数据内容

  • 包含: 187,328个辩论文档,论点(可视为摘要或查询),词级抽取摘要,引用和相关元数据,按主题-年份组织

任务类别

  • 问题回答
  • 摘要
  • 文本检索
  • 文本生成

具体任务

  • 抽象问答 (abstractive-qa)
  • 文档检索 (document-retrieval)
  • 抽取问答 (extractive-qa)

下载

  • 数据格式: CSV
  • 下载链接: 这里

标签

  • 条件文本生成 (conditional-text-generation)
搜集汇总
数据集介绍
main_image_url
背景与挑战
背景概述
DebateSum是一个大规模论证挖掘和摘要数据集,专注于英语辩论文档,包含超过24万行数据,涵盖完整文档、提取摘要、抽象摘要和引用信息。该数据集适用于自然语言处理任务,如问答、摘要和文本检索,并提供了丰富的元数据(如辩论营、标签和年份)以支持深入分析。其特点在于结合了论证挖掘与摘要生成,为研究辩论结构和内容总结提供了结构化资源。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作