AnhTong/wikipedia
收藏Hugging Face2024-01-23 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/AnhTong/wikipedia
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
- config_name: en
features:
- name: id
dtype: string
- name: revid
dtype: string
- name: url
dtype: string
- name: title
dtype: string
- name: text
dtype: string
splits:
- name: train
num_bytes: 18018761534
num_examples: 14208911
download_size: 10329862748
dataset_size: 18018761534
- config_name: vi
features:
- name: id
dtype: string
- name: revid
dtype: string
- name: url
dtype: string
- name: title
dtype: string
- name: text
dtype: string
splits:
- name: train
num_bytes: 1480386957
num_examples: 1569734
download_size: 674677545
dataset_size: 1480386957
configs:
- config_name: en
data_files:
- split: train
path: en/train-*
- config_name: vi
data_files:
- split: train
path: vi/train-*
---
提供机构:
AnhTong
原始信息汇总
数据集详情
配置名称:en
- 特征:
id: 类型为stringrevid: 类型为stringurl: 类型为stringtitle: 类型为stringtext: 类型为string
- 分割:
train:- 字节数: 18018761534
- 样本数: 14208911
- 下载大小: 10329862748 字节
- 数据集大小: 18018761534 字节
- 数据文件:
train: 路径为en/train-*
配置名称:vi
- 特征:
id: 类型为stringrevid: 类型为stringurl: 类型为stringtitle: 类型为stringtext: 类型为string
- 分割:
train:- 字节数: 1480386957
- 样本数: 1569734
- 下载大小: 674677545 字节
- 数据集大小: 1480386957 字节
- 数据文件:
train: 路径为vi/train-*



