Ezi/Human_gene_HGNC
收藏Hugging Face2024-05-07 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/Ezi/Human_gene_HGNC
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含了基因相关的多种信息,如HGNC ID、批准符号、批准名称、状态、先前符号、别名符号、染色体、登录号、RefSeq ID、基因座类型、先前名称、OMIM ID、NCBI Gene ID、LNCipedia ID、RefSeq、别名名称、基因座组、批准日期、酶ID和基因组ID等。数据集分为训练集和测试集,分别包含15407和3852个样本。下载大小为2728261字节,数据集总大小为6103131字节。
提供机构:
Ezi
原始信息汇总
数据集概述
数据集特征
- HGNC ID: 整数类型
- Approved symbol: 字符串类型
- Approved name: 字符串类型
- Status: 字符串类型
- Previous symbols: 字符串类型
- Alias symbols: 字符串类型
- Chromosome: 字符串类型
- Accession numbers: 字符串类型
- RefSeq IDs: 字符串类型
- Locus type: 字符串类型
- Previous name: 字符串类型
- OMIM ID(supplied by OMIM): 字符串类型
- NCBI Gene ID(supplied by NCBI): 整数类型
- LNCipedia ID (supplied by LNCipedia): 字符串类型
- RefSeq(supplied by NCBI): 字符串类型
- Alias names: 字符串类型
- Locus group: 字符串类型
- Date approved: 字符串类型
- Enzyme IDs: 字符串类型
- Gene group ID: 字符串类型
数据集分割
- 训练集:
- 字节数: 4883453
- 示例数: 15407
- 测试集:
- 字节数: 1219678
- 示例数: 3852
数据集大小
- 下载大小: 2728261字节
- 数据集总大小: 6103131字节
配置文件
- 默认配置:
- 训练数据路径: data/train-*
- 测试数据路径: data/test-*



