pyRis/wikinewssum
收藏Hugging Face2023-11-22 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/pyRis/wikinewssum
下载链接
链接失效反馈官方服务:
资源简介:
---
license: mit
configs:
- config_name: default
data_files:
- split: train
path: data/train-*
- split: test
path: data/test-*
- split: validation
path: data/validation-*
dataset_info:
features:
- name: lang_src
dtype: string
- name: text
dtype: string
- name: lang_tgt
dtype: string
- name: summary
dtype: string
splits:
- name: train
num_bytes: 286852471
num_examples: 62543
- name: test
num_bytes: 41437935
num_examples: 8977
- name: validation
num_bytes: 81600711
num_examples: 17996
download_size: 199887304
dataset_size: 409891117
---
许可证:MIT
配置:
- 配置名称:默认
数据文件:
- 分割:训练集
路径:data/train-*
- 分割:测试集
路径:data/test-*
- 分割:验证集
路径:data/validation-*
数据集信息:
特征:
- 名称:源语言(lang_src)
数据类型:字符串
- 名称:文本
数据类型:字符串
- 名称:目标语言(lang_tgt)
数据类型:字符串
- 名称:摘要
数据类型:字符串
分割:
- 名称:训练集
字节数:286852471
样本数:62543
- 名称:测试集
字节数:41437935
样本数:8977
- 名称:验证集
字节数:81600711
样本数:17996
下载大小:199887304
数据集大小:409891117
提供机构:
pyRis
原始信息汇总
数据集概述
许可证
- MIT许可证
配置
- 默认配置
- 数据文件:
- 训练集:
data/train-* - 测试集:
data/test-* - 验证集:
data/validation-*
- 训练集:
- 数据文件:
数据集信息
特征
lang_src:源语言,数据类型为字符串text:文本内容,数据类型为字符串lang_tgt:目标语言,数据类型为字符串summary:摘要,数据类型为字符串
分割
- 训练集:
- 字节数:286852471
- 样本数:62543
- 测试集:
- 字节数:41437935
- 样本数:8977
- 验证集:
- 字节数:81600711
- 样本数:17996
大小
- 下载大小:199887304字节
- 数据集大小:409891117字节



