NorGLM/NO-CNN-DailyMail
收藏Hugging Face2024-03-10 更新2024-06-22 收录
下载链接:
https://hf-mirror.com/datasets/NorGLM/NO-CNN-DailyMail
下载链接
链接失效反馈官方服务:
资源简介:
NO-CNN-DailyMail是一个挪威语新闻摘要数据集,部分内容是从英文版的CNN Dailymail数据集机器翻译而来。该数据集包含由CNN和DailyMail的记者撰写的新闻文章及其摘要,适用于机器阅读理解和摘要生成任务。数据集被分为训练集和测试集,分别包含61181和15287个样本。
NO-CNN-DailyMail是一个挪威语新闻摘要数据集,部分内容是从英文版的CNN Dailymail数据集机器翻译而来。该数据集包含由CNN和DailyMail的记者撰写的新闻文章及其摘要,适用于机器阅读理解和摘要生成任务。数据集被分为训练集和测试集,分别包含61181和15287个样本。
提供机构:
NorGLM
原始信息汇总
数据集卡片
数据集概述
NO-CNN-DailyMail 是一个挪威语新闻摘要数据集,部分内容由英文版的 CNN Dailymail Dataset 机器翻译而来。摘要由CNN和DailyMail的记者撰写。该数据集可用于机器阅读理解和抽象摘要任务。
数据实例
每个实例包含一个 article 字符串和一个 positive_sample 字符串,分别代表新闻文章和该文章的抽象摘要。
数据分割
数据集分为训练集和测试集。
| #samples | |
|---|---|
| train | 61181 |
| test | 15287 |
引用信息
请引用原始的 CNN/Daily Mail 数据集:
@article{nallapati2016abstractive, title={Abstractive text summarization using sequence-to-sequence rnns and beyond}, author={Nallapati, Ramesh and Zhou, Bowen and Gulcehre, Caglar and Xiang, Bing and others}, journal={arXiv preprint arXiv:1602.06023}, year={2016} }



