tollefj/xsum-en-no-transfer
收藏Hugging Face2023-08-15 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/tollefj/xsum-en-no-transfer
下载链接
链接失效反馈官方服务:
资源简介:
该数据集名为XSUM - English to Norwegian Bokmål,主要用于联合翻译和摘要任务。数据集包含训练、测试和验证三个分割,每个分割包含文档、ID和摘要三个特征。数据集的语言为挪威语(bokmål)和英语,数据集的大小类别为100K<n<1M。
提供机构:
tollefj
原始信息汇总
数据集概述
数据集配置
- 默认配置:
- 训练集:路径为
data/train-* - 测试集:路径为
data/test-* - 验证集:路径为
data/validation-*
- 训练集:路径为
数据集信息
- 特征:
document:类型为stringid:类型为stringsummary:类型为string
- 分割:
- 训练集:
- 字节数:479736366
- 样本数:204045
- 测试集:
- 字节数:26786028
- 样本数:11334
- 验证集:
- 字节数:26319794
- 样本数:11332
- 训练集:
- 下载大小:338414434 字节
- 数据集大小:532842188 字节
任务类别
- 摘要生成
- 翻译
语言
- 挪威语(bokmål)
- 英语
数据集名称
- XSUM - English to Norwegian Bokmål
数据集规模
- 100K < n < 1M



