five

DUC 2004

收藏
OpenDataLab2026-05-17 更新2024-05-09 收录
下载链接:
https://opendatalab.org.cn/OpenDataLab/DUC_2004
下载链接
链接失效反馈
官方服务:
资源简介:
DUC2004 数据集是用于文档摘要的数据集。仅为测试而设计和使用。它由 500 篇新闻文章组成,每篇文章都配有四个人工撰写的摘要。具体来说,它由来自以下集合的 50 个文本检索会议 (TREC) 文档集群组成:AP 新闻专线,1998-2000;纽约时报通讯社,1998-2000;新华社(英文版),1996-2000。每个集群平均包含 10 个文档。
提供机构:
OpenDataLab
创建时间:
2022-08-16
搜集汇总
数据集介绍
main_image_url
背景与挑战
背景概述
DUC 2004是一个专为测试设计的文档摘要数据集,包含500篇新闻文章,每篇配有4个人工撰写的摘要。该数据集由50个文档集群组成,每个集群平均10个文档,来源包括AP新闻专线、纽约时报通讯社和新华社的英文报道。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作