five

NEWSROOM Dataset

收藏
paperswithcode.com2025-03-22 收录
下载链接:
https://paperswithcode.com/dataset/newsroom
下载链接
链接失效反馈
官方服务:
资源简介:
CORNELL NEWSROOM is a large dataset for training and evaluating summarization systems. It contains 1.3 million articles and summaries written by authors and editors in the newsrooms of 38 major publications. The summaries are obtained from search and social metadata between 1998 and 2017 and use a variety of summarization strategies combining extraction and abstraction.

CORNELL NEWSROOM 是一个用于训练与评估摘要系统的庞大数据集。该数据集汇集了来自38家主要新闻机构新闻编辑室中作者及编辑撰写的130万篇文章及其摘要。这些摘要基于1998年至2017年间搜集的搜索与社会元数据,并采用了多种结合抽取与抽象的摘要策略。
提供机构:
Papers with Code
搜集汇总
数据集介绍
main_image_url
背景与挑战
背景概述
NEWSROOM是一个包含130万篇新闻文章和摘要的大型数据集,专为训练和评估摘要系统设计,提供丰富的文本特征和摘要质量指标。数据集由38家主要新闻机构的内容构成,仅限非商业研究和教育用途。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作