Joshua-Abok/preprocessed_samsum_and_dialogsum
收藏Hugging Face2024-01-29 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/Joshua-Abok/preprocessed_samsum_and_dialogsum
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含对话和摘要两个主要特征,分别存储为字符串类型。数据集被划分为训练集、验证集和测试集,其中训练集包含20000个样本,验证集包含1318个样本,测试集包含2319个样本。数据集的总下载大小为12309269字节,总数据集大小为22841750字节。
该数据集包含对话和摘要两个主要特征,分别存储为字符串类型。数据集被划分为训练集、验证集和测试集,其中训练集包含20000个样本,验证集包含1318个样本,测试集包含2319个样本。数据集的总下载大小为12309269字节,总数据集大小为22841750字节。
提供机构:
Joshua-Abok
原始信息汇总
数据集信息
特征
- 名称: dialogue
- 数据类型: string
- 名称: summary
- 数据类型: string
数据分割
- 训练集
- 字节数: 19792641
- 样本数: 20000
- 验证集
- 字节数: 1035442
- 样本数: 1318
- 测试集
- 字节数: 2013667
- 样本数: 2319
数据大小
- 下载大小: 12309269
- 数据集大小: 22841750
配置
- 配置名称: default
- 数据文件路径:
- 训练集: data/train-*
- 验证集: data/valid-*
- 测试集: data/test-*
- 数据文件路径:



