Hack90/ncbi_bert_chunk_2kbp
收藏Hugging Face2024-01-02 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/Hack90/ncbi_bert_chunk_2kbp
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
features:
- name: id
dtype: string
- name: name
dtype: string
- name: text
dtype: string
- name: chunk_length
dtype: int64
- name: __index_level_0__
dtype: int64
splits:
- name: train
num_bytes: 627269700.9490794
num_examples: 155080
- name: test
num_bytes: 78412757.43228562
num_examples: 19386
- name: valid
num_bytes: 78408712.61863492
num_examples: 19385
download_size: 327525008
dataset_size: 784091171.0
configs:
- config_name: default
data_files:
- split: train
path: data/train-*
- split: test
path: data/test-*
- split: valid
path: data/valid-*
---
提供机构:
Hack90
原始信息汇总
数据集概述
数据集特征
- id: 字符串类型
- name: 字符串类型
- text: 字符串类型
- chunk_length: 64位整数类型
- index_level_0: 64位整数类型
数据集分割
- train:
- 字节数: 627269700.9490794
- 样本数: 155080
- test:
- 字节数: 78412757.43228562
- 样本数: 19386
- valid:
- 字节数: 78408712.61863492
- 样本数: 19385
数据集大小
- 下载大小: 327525008 字节
- 数据集大小: 784091171.0 字节
配置
- 配置名称: default
- 数据文件:
- train: data/train-*
- test: data/test-*
- valid: data/valid-*
- 数据文件:



