systemk/wiki-ja
收藏Hugging Face2024-02-13 更新2024-06-22 收录
下载链接:
https://hf-mirror.com/datasets/systemk/wiki-ja
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
- config_name: 100k
features:
- name: text
dtype: string
splits:
- name: train
num_bytes: 433303565.0
num_examples: 100000
download_size: 254929227
dataset_size: 433303565.0
- config_name: 500k
features:
- name: text
dtype: string
splits:
- name: train
num_bytes: 2548437114.0
num_examples: 500000
download_size: 1487557534
dataset_size: 2548437114.0
configs:
- config_name: 100k
data_files:
- split: train
path: 100k/train-*
- config_name: 500k
data_files:
- split: train
path: 500k/train-*
---
数据集信息(dataset_info):
- 配置名称(config_name): 100k
特征(features):
- 字段名称(name): text
数据类型(dtype): 字符串
拆分(splits):
- 拆分名称(name): train
字节数(num_bytes): 433303565.0
样本数量(num_examples): 100000
下载大小(download_size): 254929227
数据集总大小(dataset_size): 433303565.0
- 配置名称(config_name): 500k
特征(features):
- 字段名称(name): text
数据类型(dtype): 字符串
拆分(splits):
- 拆分名称(name): train
字节数(num_bytes): 2548437114.0
样本数量(num_examples): 500000
下载大小(download_size): 1487557534
数据集总大小(dataset_size): 2548437114.0
配置项(configs):
- 配置名称(config_name): 100k
数据文件(data_files):
- 拆分(split): train
文件路径(path): 100k/train-*
- 配置名称(config_name): 500k
数据文件(data_files):
- 拆分(split): train
文件路径(path): 500k/train-*
提供机构:
systemk
原始信息汇总
数据集概述
数据集配置
配置 100k
- 特征:
- 名称: text
- 数据类型: string
- 分割:
- 名称: train
- 字节数: 433303565.0
- 样本数: 100000
- 下载大小: 254929227
- 数据集大小: 433303565.0
- 数据文件:
- 分割: train
- 路径: 100k/train-*
配置 500k
- 特征:
- 名称: text
- 数据类型: string
- 分割:
- 名称: train
- 字节数: 2548437114.0
- 样本数: 500000
- 下载大小: 1487557534
- 数据集大小: 2548437114.0
- 数据文件:
- 分割: train
- 路径: 500k/train-*



