longAtSJSU/reversedDataset
收藏Hugging Face2024-02-14 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/longAtSJSU/reversedDataset
下载链接
链接失效反馈官方服务:
资源简介:
SAMSum Corpus是一个用于对话摘要任务的英语数据集,包含对话和对应的摘要。数据集规模在10K到100K之间,特征包括id、dialogue和summary,分别表示对话的唯一标识、对话内容和摘要内容。数据集分为训练集和验证集,训练集包含14732个样本,验证集包含818个样本。数据集的创建方式为专家生成,来源为原始数据,且为单语言(英语)数据集。
SAMSum Corpus是一个用于对话摘要任务的英语数据集,包含对话和对应的摘要。数据集规模在10K到100K之间,特征包括id、dialogue和summary,分别表示对话的唯一标识、对话内容和摘要内容。数据集分为训练集和验证集,训练集包含14732个样本,验证集包含818个样本。数据集的创建方式为专家生成,来源为原始数据,且为单语言(英语)数据集。
提供机构:
longAtSJSU
原始信息汇总
数据集概述
基本信息
- 数据集名称: SAMSum Corpus
- 许可证: CC BY-NC-ND 4.0
- 语言: 英语
- 多语言性: 单语种
- 数据规模: 10K<n<100K
任务类别
- 文本摘要
数据集特征
- 特征列表:
- id: 字符串类型
- dialogue: 字符串类型
- summary: 字符串类型
数据集配置
- 配置名称: samsum
数据集分割
- 训练集:
- 字节数: 9479141
- 样本数: 14732
- 验证集:
- 字节数: 516431
- 样本数: 818
数据集大小
- 下载大小: 2944100
- 数据集大小: 10530064
训练与评估索引
- 配置: samsum
- 任务: 文本摘要
- 任务ID: 文本摘要
- 评估分割: 测试集
- 列映射:
- dialogue: text
- summary: target



