MartinKu/wikipedia_stage2_coverage_20230331
收藏Hugging Face2023-04-02 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/MartinKu/wikipedia_stage2_coverage_20230331
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
features:
- name: text
dtype: string
- name: S_V_position
sequence: int64
- name: O_C_position
sequence: int64
- name: start_point_list
sequence: int64
splits:
- name: train
num_bytes: 60121841137
num_examples: 1089628
download_size: 18558792841
dataset_size: 60121841137
---
# Dataset Card for "wikipedia_stage2_coverage_20230331"
[More Information needed](https://github.com/huggingface/datasets/blob/main/CONTRIBUTING.md#how-to-contribute-to-the-dataset-cards)
数据集信息:
特征字段:
- 名称:text,数据类型:字符串
- 名称:S_V_position,数据类型:64位整数序列
- 名称:O_C_position,数据类型:64位整数序列
- 名称:start_point_list,数据类型:64位整数序列
数据集拆分:
- 拆分名称:训练集(train),字节占用量:60121841137,样本总数:1089628
下载体积:18558792841
数据集总占用体积:60121841137
# 「wikipedia_stage2_coverage_20230331」数据集卡片
[需补充更多信息](https://github.com/huggingface/datasets/blob/main/CONTRIBUTING.md#how-to-contribute-to-the-dataset-cards)
提供机构:
MartinKu
原始信息汇总
数据集概述
数据集名称
wikipedia_stage2_coverage_20230331
数据集特征
- text:字符串类型
- S_V_position:整数序列类型
- O_C_position:整数序列类型
- start_point_list:整数序列类型
数据集分割
- train:
- 示例数量:1089628
- 数据大小:60121841137字节
数据集大小
- 下载大小:18558792841字节
- 数据集大小:60121841137字节



