Yuhthe/samsum
收藏Hugging Face2023-07-26 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/Yuhthe/samsum
下载链接
链接失效反馈官方服务:
资源简介:
该数据集是一个用于摘要生成任务的越南语数据集,包含训练集、测试集和验证集。每个数据集的特征包括id、dialogue和summary,数据类型均为字符串。训练集包含14732个示例,测试集包含819个示例,验证集包含818个示例。数据集的总大小为10530016字节,下载大小为6737195字节。
该数据集是一个用于摘要生成任务的越南语数据集,包含训练集、测试集和验证集。每个数据集的特征包括id、dialogue和summary,数据类型均为字符串。训练集包含14732个示例,测试集包含819个示例,验证集包含818个示例。数据集的总大小为10530016字节,下载大小为6737195字节。
提供机构:
Yuhthe
原始信息汇总
数据集概述
数据集配置
- 默认配置 (
config_name: default) 包含以下数据文件:- 训练集 (
split: train,path: data/train-*) - 测试集 (
split: test,path: data/test-*) - 验证集 (
split: validation,path: data/validation-*)
- 训练集 (
数据集信息
-
特征:
id: 数据类型为stringdialogue: 数据类型为stringsummary: 数据类型为string
-
数据集分割:
- 训练集:
- 字节数:9479117
- 样本数:14732
- 测试集:
- 字节数:534480
- 样本数:819
- 验证集:
- 字节数:516419
- 样本数:818
- 训练集:
-
数据集大小:
- 下载大小:6737195字节
- 数据集总大小:10530016字节
任务类别
- 摘要生成 (
summarization)
语言
- 越南语 (
vi)



