Team-PIXEL/bigrams_wiki-en_529
收藏Hugging Face2023-10-02 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/Team-PIXEL/bigrams_wiki-en_529
下载链接
链接失效反馈官方服务:
资源简介:
---
license: apache-2.0
configs:
- config_name: default
data_files:
- split: train
path: data/train-*
dataset_info:
features:
- name: title
dtype: string
- name: data
dtype: string
splits:
- name: train
num_bytes: 12552650836
num_examples: 18376812
download_size: 6490731290
dataset_size: 12552650836
---
许可证:Apache-2.0
数据集配置项:
- 配置名称:default
数据文件:
- 数据划分:训练集,文件路径:data/train-*
数据集信息:
数据特征:
- 字段名称:title,数据类型:字符串
- 字段名称:data,数据类型:字符串
数据划分详情:
- 划分名称:train,总字节数:12552650836,样本总数:18376812
下载总大小:6490731290
数据集总大小:12552650836
提供机构:
Team-PIXEL
原始信息汇总
数据集概述
许可证
- Apache 2.0
配置
- 默认配置
- 数据文件路径:
data/train-*
- 数据文件路径:
数据集信息
-
特征
- 名称:
title- 数据类型:
string
- 数据类型:
- 名称:
data- 数据类型:
string
- 数据类型:
- 名称:
-
数据划分
- 名称:
train- 字节数: 12552650836
- 样本数: 18376812
- 名称:
-
下载大小: 6490731290
-
数据集大小: 12552650836



