whu9/wiki_20220301flatten
收藏Hugging Face2023-03-05 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/whu9/wiki_20220301flatten
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
features:
- name: sentences
dtype: string
splits:
- name: train
num_bytes: 1224908657
num_examples: 22874571
download_size: 778259253
dataset_size: 1224908657
---
# Dataset Card for "wiki_20220301flatten"
[More Information needed](https://github.com/huggingface/datasets/blob/main/CONTRIBUTING.md#how-to-contribute-to-the-dataset-cards)
---
dataset_info:
特征字段:
- 字段名:sentences,数据类型:字符串(string)
数据划分:
- 划分名:训练集(train),字节大小:1224908657,样本数量:22874571
下载大小:778259253
数据集总大小:1224908657
---
# 「wiki_20220301flatten」数据集卡片
【需补充更多信息】(https://github.com/huggingface/datasets/blob/main/CONTRIBUTING.md#how-to-contribute-to-the-dataset-cards)
提供机构:
whu9
原始信息汇总
数据集概述
数据集名称
- 名称: wiki_20220301flatten
数据集特征
- 特征名称: sentences
- 数据类型: string
数据集分割
- 分割名称: train
- 示例数量: 22874571
- 数据大小: 1224908657 字节
数据集大小
- 下载大小: 778259253 字节
- 总数据集大小: 1224908657 字节



