hpprc/jawiki-books
收藏Hugging Face2024-04-11 更新2024-04-19 收录
下载链接:
https://hf-mirror.com/datasets/hpprc/jawiki-books
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
config_name: '2024-04-01'
features:
- name: id
dtype: int64
- name: title
dtype: string
- name: text
dtype: string
- name: paragraphs
list:
- name: paragraph_id
dtype: int64
- name: tag
dtype: string
- name: text
dtype: string
- name: title
dtype: string
- name: abstract
dtype: string
- name: wikitext
dtype: string
- name: date_created
dtype: string
- name: date_modified
dtype: string
- name: templates
sequence: string
- name: url
dtype: string
splits:
- name: train
num_bytes: 172222533.07899398
num_examples: 13490
download_size: 74095911
dataset_size: 172222533.07899398
configs:
- config_name: '2024-04-01'
data_files:
- split: train
path: 2024-04-01/train-*
license: cc-by-sa-3.0
language:
- ja
---
提供机构:
hpprc
原始信息汇总
数据集概述
数据集信息
- 配置名称: 2024-04-01
- 特征:
- id: 数据类型为 int64
- title: 数据类型为 string
- text: 数据类型为 string
- paragraphs: 列表类型,包含以下子特征:
- paragraph_id: 数据类型为 int64
- tag: 数据类型为 string
- text: 数据类型为 string
- title: 数据类型为 string
- abstract: 数据类型为 string
- wikitext: 数据类型为 string
- date_created: 数据类型为 string
- date_modified: 数据类型为 string
- templates: 序列类型,数据类型为 string
- url: 数据类型为 string
数据分割
- 训练集:
- 名称: train
- 字节数: 172222533.07899398
- 样本数: 13490
数据集大小
- 下载大小: 74095911
- 数据集大小: 172222533.07899398
配置
- 配置名称: 2024-04-01
- 数据文件:
- 分割: train
- 路径: 2024-04-01/train-*
许可
- 许可证: cc-by-sa-3.0
语言
- 语言: 日语 (ja)



