Yuhthe/vietnews
收藏Hugging Face2023-07-26 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/Yuhthe/vietnews
下载链接
链接失效反馈官方服务:
资源简介:
数据集vietnews包含训练集、验证集和测试集,每个集都有对应的文件路径和大小。数据集的特征包括guid、title、abstract和article,数据类型分别为int64和string。数据集的任务类别是摘要生成,语言为越南语。
提供机构:
Yuhthe
原始信息汇总
数据集概述
数据集配置
- 默认配置 (
config_name: default)- 训练数据 (
split: train):path: data/train-* - 验证数据 (
split: validation):path: data/validation-* - 测试数据 (
split: test):path: data/test-*
- 训练数据 (
数据集信息
-
特征
- guid:
dtype: int64 - title:
dtype: string - abstract:
dtype: string - article:
dtype: string
- guid:
-
数据分割
- 训练集 (
name: train)- 大小: 325418455 字节
- 样本数: 99134
- 验证集 (
name: validation)- 大小: 73397317 字节
- 样本数: 22184
- 测试集 (
name: test)- 大小: 74536959 字节
- 样本数: 22498
- 训练集 (
-
数据集大小
- 下载大小: 241345943 字节
- 总大小: 473352731 字节
任务类别
- 摘要生成 (
summarization)
语言
- 越南语 (
vi)



