arubenruben/cnn_dailymail_azure_pt_pt
收藏Hugging Face2023-06-06 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/arubenruben/cnn_dailymail_azure_pt_pt
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含文档和摘要两个特征,数据类型均为字符串。数据集分为训练集、验证集和测试集,分别包含7729、3810和7298个样本。数据集的总下载大小为48224108字节,总数据集大小为81060061字节。数据集的任务类别包括摘要生成和翻译,语言为葡萄牙语,标签为机器翻译,数据集的名称为Portuguese CNN-Dailymail-Azure。
该数据集包含文档和摘要两个特征,数据类型均为字符串。数据集分为训练集、验证集和测试集,分别包含7729、3810和7298个样本。数据集的总下载大小为48224108字节,总数据集大小为81060061字节。数据集的任务类别包括摘要生成和翻译,语言为葡萄牙语,标签为机器翻译,数据集的名称为Portuguese CNN-Dailymail-Azure。
提供机构:
arubenruben
原始信息汇总
数据集概述
数据集名称
- 名称:Portuguese CNN-Dailymail-Azure
数据集特征
- 特征1:document
- 数据类型:string
- 特征2:summary
- 数据类型:string
数据集划分
- 训练集
- 样本数量:7729
- 数据大小:33317736字节
- 验证集
- 样本数量:3810
- 数据大小:14690610字节
- 测试集
- 样本数量:7298
- 数据大小:33051715字节
数据集大小
- 下载大小:48224108字节
- 数据集总大小:81060061字节
任务类别
- 摘要生成
- 翻译
语言
- 葡萄牙语(pt)
标签
- Machine Translation



