allenai/multinews_sparse_oracle
收藏Hugging Face2022-11-12 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/allenai/multinews_sparse_oracle
下载链接
链接失效反馈官方服务:
资源简介:
Multi-News数据集的副本,其中测试集的输入源文档已被稀疏检索器替换。数据集主要用于新闻文章摘要任务,包含训练、验证和测试三个分割。检索管道使用了BM25算法,并通过PyTerrier实现,检索策略为oracle,即检索的文档数量k设置为每个示例的原始输入文档数量。
提供机构:
allenai
原始信息汇总
数据集概述
基本信息
- 名称: Multi-News
- 语言: 英语 (
en) - 许可证: 其他 (
other) - 多语言性: 单语 (
monolingual) - 大小: 10K<n<100K
- 来源: 原始 (
original)
任务与结构
- 任务类别: 摘要 (
summarization) - 任务ID: news-articles-summarization
- 训练与评估配置:
- 配置: 默认
- 任务: 摘要
- 任务ID: 摘要
- 分割:
- 训练分割: train
- 评估分割: test
- 列映射:
- 文档: text
- 摘要: target
- 评估指标:
- 类型: rouge
- 名称: Rouge
创建者信息
- 标注创建者: 专家生成 (
expert-generated) - 语言创建者: 专家生成 (
expert-generated)



