tollefj/norwegian-xsum-nob
收藏Hugging Face2023-08-15 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/tollefj/norwegian-xsum-nob
下载链接
链接失效反馈官方服务:
资源简介:
XSUM Norwegian Bokmål数据集是一个用于摘要生成任务的数据集,包含挪威博克马尔语的文档和摘要。数据集分为训练集、测试集和验证集,分别包含204045、11334和11332个示例。数据集的下载大小为301349675字节,总大小为473606421字节。数据集来源于https://huggingface.co/datasets/NbAiLab/norwegian-xsum,由于通过数据集API访问原始数据集时出现错误,因此从提供的gzips文件重新加载并上传。
提供机构:
tollefj
原始信息汇总
XSUM Norwegian Bokmål 数据集概述
基本信息
- 语言: 挪威语(Bokmål)
- 许可: CC BY-SA 4.0
- 数据规模: 100K<n<1M
- 任务类别: 摘要生成
- 数据集别名: XSUM Norwegian Bokmål
配置信息
- 配置名称: default
- 数据文件:
- 测试集: data/test-*
- 训练集: data/train-*
- 验证集: data/validation-*
数据集详情
- 特征:
- 文档: 字符串类型
- 摘要: 字符串类型
- ID: 字符串类型
- 数据分割:
- 测试集:
- 字节数: 23794328
- 样本数: 11334
- 训练集:
- 字节数: 426389147
- 样本数: 204045
- 验证集:
- 字节数: 23422946
- 样本数: 11332
- 测试集:
- 下载大小: 301349675
- 数据集大小: 473606421



