cl-nagoya/min-wikisplit
收藏Hugging Face2024-04-19 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/cl-nagoya/min-wikisplit
下载链接
链接失效反馈官方服务:
资源简介:
MinWikiSplit数据集的预处理版本,用于文本到文本生成任务。该数据集包含复杂和简单的文本对,适用于英语语言。详细信息可参考相关仓库和论文。
MinWikiSplit数据集的预处理版本,用于文本到文本生成任务。该数据集包含复杂和简单的文本对,适用于英语语言。详细信息可参考相关仓库和论文。
提供机构:
cl-nagoya
原始信息汇总
数据集概述
数据集名称
- 名称: MinWikiSplit
数据集特征
- 特征列表:
id: 数据类型为int64complex: 数据类型为stringsimple: 数据类型为string
数据集分割
- 分割详情:
train: 大小为 60695793 字节,包含 154582 个样本validation: 大小为 7569490 字节,包含 19322 个样本test: 大小为 7546266 字节,包含 19322 个样本all: 大小为 75811549 字节,包含 193226 个样本
数据集大小
- 下载大小: 99574719 字节
- 数据集大小: 151623098 字节
数据集配置
- 配置名称: default
- 数据文件路径:
train: data/train-*validation: data/validation-*test: data/test-*all: data/all-*
许可证
- 许可证: cc-by-sa-4.0
任务类别
- 任务类别: text2text-generation
语言
- 语言: en



