as-cle-bert/scerevisiae-transcripts-biotypes
收藏Hugging Face2024-03-31 更新2024-06-11 收录
下载链接:
https://hf-mirror.com/datasets/as-cle-bert/scerevisiae-transcripts-biotypes
下载链接
链接失效反馈官方服务:
资源简介:
---
license: mit
dataset_info:
features:
- name: label
dtype:
class_label:
names:
'0': pseudogene
'1': Uncharacterized_ORF
'2': transposable_element_gene
'3': Verified_ORF
'4': Dubious_ORF
'5': blocked_reading_frame
- name: text
dtype: string
splits:
- name: train
num_bytes: 7394643
num_examples: 5372
- name: test
num_bytes: 1762809
num_examples: 1344
download_size: 4320921
dataset_size: 9157452
configs:
- config_name: default
data_files:
- split: train
path: data/train-*
- split: test
path: data/test-*
---
提供机构:
as-cle-bert
原始信息汇总
数据集概述
数据集特征
-
label
- 数据类型: 类别标签
- 类别名称:
- 0: pseudogene
- 1: Uncharacterized_ORF
- 2: transposable_element_gene
- 3: Verified_ORF
- 4: Dubious_ORF
- 5: blocked_reading_frame
-
text
- 数据类型: 字符串
数据集分割
-
训练集 (train)
- 样本数量: 5372
- 数据大小: 7394643 字节
-
测试集 (test)
- 样本数量: 1344
- 数据大小: 1762809 字节
数据集大小
- 下载大小: 4320921 字节
- 数据集总大小: 9157452 字节
配置信息
- 默认配置 (default)
- 训练数据路径:
data/train-* - 测试数据路径:
data/test-*
- 训练数据路径:



