yangyz1230/promoter_all
收藏Hugging Face2024-04-15 更新2024-06-11 收录
下载链接:
https://hf-mirror.com/datasets/yangyz1230/promoter_all
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
features:
- name: name
dtype: string
- name: sequence
dtype: string
- name: chrom
dtype: string
- name: start
dtype: int64
- name: end
dtype: int64
- name: strand
dtype: string
- name: label
dtype: int64
splits:
- name: train
num_bytes: 9329227
num_examples: 26634
- name: test
num_bytes: 1033934
num_examples: 2960
download_size: 4956053
dataset_size: 10363161
configs:
- config_name: default
data_files:
- split: train
path: data/train-*
- split: test
path: data/test-*
---
数据集信息:
特征列表:
- 字段名:样本名称(name),数据类型:字符串
- 字段名:序列(sequence),数据类型:字符串
- 字段名:染色体标识(chrom),数据类型:字符串
- 字段名:起始位置(start),数据类型:64位整数
- 字段名:终止位置(end),数据类型:64位整数
- 字段名:链方向(strand),数据类型:字符串
- 字段名:标签(label),数据类型:64位整数
数据集拆分:
- 训练集(train):占用存储空间9329227字节,样本总数26634
- 测试集(test):占用存储空间1033934字节,样本总数2960
下载总大小:4956053字节,数据集总存储大小:10363161字节
配置项:
- 默认配置(default):数据文件路径配置如下:
- 训练集划分:对应路径为data/train-*
- 测试集划分:对应路径为data/test-*
提供机构:
yangyz1230
原始信息汇总
数据集概述
数据集特征
- name:字符串类型
- sequence:字符串类型
- chrom:字符串类型
- start:整数类型(int64)
- end:整数类型(int64)
- strand:字符串类型
- label:整数类型(int64)
数据集分割
- 训练集:
- 大小:9329227字节
- 样本数:26634
- 测试集:
- 大小:1033934字节
- 样本数:2960
数据集大小
- 下载大小:4956053字节
- 数据集总大小:10363161字节
数据文件配置
- 默认配置:
- 训练集路径:data/train-*
- 测试集路径:data/test-*



