thors/RRN
收藏Hugging Face2023-05-25 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/thors/RRN
下载链接
链接失效反馈官方服务:
资源简介:
RÚV Radio News (RRN) 是一个冰岛语的抽象摘要数据集,包含来自冰岛国家广播服务(RÚV)的约4k条新闻故事,这些故事收集自2021年和2022年。每个故事通常包括三个部分:介绍、主要故事和摘要,但并非所有故事都包含这三部分。数据集可用于多种摘要任务,如从介绍和主要故事生成摘要,或从主要故事生成介绍。数据集中有大量关于COVID-19和国内新闻的故事。
RÚV Radio News (RRN) 是一个冰岛语的抽象摘要数据集,包含来自冰岛国家广播服务(RÚV)的约4k条新闻故事,这些故事收集自2021年和2022年。每个故事通常包括三个部分:介绍、主要故事和摘要,但并非所有故事都包含这三部分。数据集可用于多种摘要任务,如从介绍和主要故事生成摘要,或从主要故事生成介绍。数据集中有大量关于COVID-19和国内新闻的故事。
提供机构:
thors
原始信息汇总
数据集概述
基本信息
- 许可证: cc-by-4.0
- 任务类别: 摘要生成
- 语言: 冰岛语
- 数据集大小: 1K<n<10K
数据集描述
- 名称: RÚV Radio News (RRN)
- 内容: 包含约4,000个来自冰岛国家广播服务(RÚV)的新闻故事,收集自2021年和2022年。每个新闻故事通常包括三部分:引言、主要内容和摘要,但并非所有故事都包含这三部分。
- 应用: 适用于多种摘要生成任务,如引言+主要内容生成摘要,以及主要内容生成引言。引言和摘要通常概述了故事的关键点,有时两者内容相同。
- 特点: 数据集中包含大量关于COVID-19和国内新闻的故事。
引用信息
@inproceedings{sverrisson2023abstractive, title={Abstractive Text Summarization for Icelandic}, author={Sverrisson, {TH}{o}r and Einarsson, Hafsteinn}, booktitle={Proceedings of the 24th Nordic Conference on Computational Linguistics (NoDaLiDa)}, pages={17--31}, year={2023} }



