five

allenai/multinews_sparse_oracle

收藏
Hugging Face2022-11-12 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/allenai/multinews_sparse_oracle
下载链接
链接失效反馈
官方服务:
资源简介:
Multi-News数据集的副本,其中测试集的输入源文档已被稀疏检索器替换。数据集主要用于新闻文章摘要任务,包含训练、验证和测试三个分割。检索管道使用了BM25算法,并通过PyTerrier实现,检索策略为oracle,即检索的文档数量k设置为每个示例的原始输入文档数量。
提供机构:
allenai
原始信息汇总

数据集概述

基本信息

  • 名称: Multi-News
  • 语言: 英语 (en)
  • 许可证: 其他 (other)
  • 多语言性: 单语 (monolingual)
  • 大小: 10K<n<100K
  • 来源: 原始 (original)

任务与结构

  • 任务类别: 摘要 (summarization)
  • 任务ID: news-articles-summarization
  • 训练与评估配置:
    • 配置: 默认
    • 任务: 摘要
    • 任务ID: 摘要
    • 分割:
      • 训练分割: train
      • 评估分割: test
    • 列映射:
      • 文档: text
      • 摘要: target
    • 评估指标:
      • 类型: rouge
      • 名称: Rouge

创建者信息

  • 标注创建者: 专家生成 (expert-generated)
  • 语言创建者: 专家生成 (expert-generated)
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作