five

biu-nlp/sentence_union_generation

收藏
Hugging Face2023-08-24 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/biu-nlp/sentence_union_generation
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集是论文《Revisiting Sentence Union Generation as a Testbed for Text Consolidation》的官方数据集,旨在通过句子联合生成任务来评估文本整合能力。数据集支持多文档摘要、长形式问答和基于文档的对话等任务,并提供了丰富的注释方法和工具,以及全面的评估协议。数据集还包含了对最先进语言模型的基线评估,分析了它们在多文本整合挑战中的能力和局限性。

该数据集是论文《Revisiting Sentence Union Generation as a Testbed for Text Consolidation》的官方数据集,旨在通过句子联合生成任务来评估文本整合能力。数据集支持多文档摘要、长形式问答和基于文档的对话等任务,并提供了丰富的注释方法和工具,以及全面的评估协议。数据集还包含了对最先进语言模型的基线评估,分析了它们在多文本整合挑战中的能力和局限性。
提供机构:
biu-nlp
原始信息汇总

数据集概述

基本信息

  • 许可证: cc-by-nc-4.0
  • 任务类别:
    • 文本到文本生成
    • 文本生成
  • 语言: 英语
  • 标签:
    • 融合
    • 联合
    • 多文档
    • 摘要生成
    • 长形式问答
    • 文档基础对话
  • 大小类别: 1K<n<10K

数据集描述

  • 数据集名称: Revisiting Sentence Union Generation as a Testbed for Text Consolidation
  • 研究机构:
    • Bar-Ilan University
    • One AI
  • 数据集目的: 作为评估文本整合能力的测试平台,专注于句子联合生成任务,旨在分离整合挑战与主观内容选择。

数据集内容

  • 注释方法: 提供精细化的注释方法和工具,用于众包句子联合。
  • 数据集规模: 创建了迄今为止最大的联合数据集。
  • 评估协议: 提出全面的评估协议,包括人类评估和自动评估。
  • 基线模型: 评估了当前最先进的语言模型在该任务上的表现,并进行了详细的能力和限制分析。
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作