harouzie/vietnews
收藏Hugging Face2023-07-18 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/harouzie/vietnews
下载链接
链接失效反馈官方服务:
资源简介:
该数据集是一个越南语新闻数据集,主要用于摘要生成任务。数据集包含标题、摘要和文章内容,分为训练集、验证集和测试集,分别包含99134、22184和22498个样本。数据集的语言为越南语,涉及金融和法律领域,大小类别为100K<n<1M。
提供机构:
harouzie
原始信息汇总
数据集概述
许可证
- Apache 2.0
数据集信息
特征
- guid: 数据类型为
int64 - title: 数据类型为
string - abstract: 数据类型为
string - article: 数据类型为
string
数据分割
- train: 字节数为 325418455,样本数为 99134
- validation: 字节数为 73397317,样本数为 22184
- test: 字节数为 74536959,样本数为 22498
数据大小
- 下载大小: 246782373 字节
- 数据集大小: 473352731 字节
语言
- 越南语 (vi)
数据集名称
- vietnews
任务类别
- 摘要生成 (summarization)
标签
- 金融 (finance)
- 法律 (legal)
数据集大小类别
- 100K < n < 1M



