Saibo-creator/bookcorpus_compact_256_test_meta
收藏Hugging Face2023-01-23 更新2024-06-15 收录
下载链接:
https://hf-mirror.com/datasets/Saibo-creator/bookcorpus_compact_256_test_meta
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
features:
- name: text
dtype: string
- name: concept_with_offset
dtype: string
- name: cid_arrangement
sequence: int32
- name: schema_lengths
sequence: int64
- name: topic_entity_mask
sequence: int64
- name: text_lengths
sequence: int64
splits:
- name: train
num_bytes: 214680900
num_examples: 6160
download_size: 47705450
dataset_size: 214680900
---
# Dataset Card for "bookcorpus_compact_256_test_meta"
[More Information needed](https://github.com/huggingface/datasets/blob/main/CONTRIBUTING.md#how-to-contribute-to-the-dataset-cards)
数据集信息:
特征项:
- 名称:文本(text),数据类型:字符串
- 名称:带偏移量的概念(concept_with_offset),数据类型:字符串
- 名称:概念ID排列(cid_arrangement),数据类型:int32整数序列
- 名称:模式长度(schema_lengths),数据类型:int64整数序列
- 名称:主题实体掩码(topic_entity_mask),数据类型:int64整数序列
- 名称:文本长度(text_lengths),数据类型:int64整数序列
数据集划分:
- 名称:训练集(train),字节数:214680900,样本数量:6160
下载大小:47705450
数据集总大小:214680900
---
# 数据集卡片:"bookcorpus_compact_256_test_meta"
[需补充更多信息](https://github.com/huggingface/datasets/blob/main/CONTRIBUTING.md#how-to-contribute-to-the-dataset-cards)
提供机构:
Saibo-creator
原始信息汇总
数据集概述
数据集名称
- 名称: bookcorpus_compact_256_test_meta
数据特征
- 特征列表:
- text: 字符串类型
- concept_with_offset: 字符串类型
- cid_arrangement: 整数序列类型 (int32)
- schema_lengths: 整数序列类型 (int64)
- topic_entity_mask: 整数序列类型 (int64)
- text_lengths: 整数序列类型 (int64)
数据分割
- 训练集:
- 名称: train
- 字节数: 214680900
- 样本数: 6160
数据集大小
- 下载大小: 47705450 字节
- 数据集大小: 214680900 字节



