five

NorGLM/NO-CNN-DailyMail

收藏
Hugging Face2024-03-10 更新2024-06-22 收录
下载链接:
https://hf-mirror.com/datasets/NorGLM/NO-CNN-DailyMail
下载链接
链接失效反馈
官方服务:
资源简介:
NO-CNN-DailyMail是一个挪威语新闻摘要数据集,部分内容是从英文版的CNN Dailymail数据集机器翻译而来。该数据集包含由CNN和DailyMail的记者撰写的新闻文章及其摘要,适用于机器阅读理解和摘要生成任务。数据集被分为训练集和测试集,分别包含61181和15287个样本。

NO-CNN-DailyMail是一个挪威语新闻摘要数据集,部分内容是从英文版的CNN Dailymail数据集机器翻译而来。该数据集包含由CNN和DailyMail的记者撰写的新闻文章及其摘要,适用于机器阅读理解和摘要生成任务。数据集被分为训练集和测试集,分别包含61181和15287个样本。
提供机构:
NorGLM
原始信息汇总

数据集卡片

数据集概述

NO-CNN-DailyMail 是一个挪威语新闻摘要数据集,部分内容由英文版的 CNN Dailymail Dataset 机器翻译而来。摘要由CNN和DailyMail的记者撰写。该数据集可用于机器阅读理解和抽象摘要任务。

数据实例

每个实例包含一个 article 字符串和一个 positive_sample 字符串,分别代表新闻文章和该文章的抽象摘要。

数据分割

数据集分为训练集和测试集。

#samples
train 61181
test 15287

引用信息

请引用原始的 CNN/Daily Mail 数据集:

@article{nallapati2016abstractive, title={Abstractive text summarization using sequence-to-sequence rnns and beyond}, author={Nallapati, Ramesh and Zhou, Bowen and Gulcehre, Caglar and Xiang, Bing and others}, journal={arXiv preprint arXiv:1602.06023}, year={2016} }

5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作