SZTAKI-HLT/HunSum-2-abstractive
收藏Hugging Face2024-03-22 更新2024-06-11 收录
下载链接:
https://hf-mirror.com/datasets/SZTAKI-HLT/HunSum-2-abstractive
下载链接
链接失效反馈官方服务:
资源简介:
HunSum-2-abstractive数据集是一个匈牙利语的数据集,包含了超过180万篇独特的新闻文章,每篇文章都包含正文、导语、标题、URL、域名、创建日期和标签等信息。该数据集主要用于摘要生成和标题生成任务,并分为训练集、验证集和测试集三个部分。
HunSum-2-abstractive数据集是一个匈牙利语的数据集,包含了超过180万篇独特的新闻文章,每篇文章都包含正文、导语、标题、URL、域名、创建日期和标签等信息。该数据集主要用于摘要生成和标题生成任务,并分为训练集、验证集和测试集三个部分。
提供机构:
SZTAKI-HLT
原始信息汇总
HunSum-2-abstractive 数据集概述
数据集描述
数据集总结
- 语言: 匈牙利语
- 数据量: 包含超过1.8M篇独特新闻文章
- 来源: 来自27个主要匈牙利新闻网站
- 内容: 每篇文章包含导语、标题及其他元数据
支持的任务和排行榜
- 摘要生成
- 标题生成
数据字段
uuid: 唯一标识符,字符串类型article: 新闻文章主体,字符串类型lead: 文章导语,字符串类型title: 文章标题,字符串类型url: 文章URL,字符串类型domain: URL域名,字符串类型date_of_creation: 文章创建日期,时间戳类型tags: 文章标签,序列类型
数据分割
- 训练集: 1,813,854篇
- 验证集: 1998篇
- 测试集: 1998篇



