TerminatorJ/relabel_output-XETG00048__0003817__VUILD107MF__20230308__003731
收藏Hugging Face2024-07-15 更新2024-07-22 收录
下载链接:
https://hf-mirror.com/datasets/TerminatorJ/relabel_output-XETG00048__0003817__VUILD107MF__20230308__003731
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含基因表达数据、细胞标识符、基因名称、基因排名、全标记序列和基因-基因矩阵等多个特征。数据集分为训练集、测试集和验证集,分别包含38638、12074和9661个样本。数据集的总大小为2396679652字节,下载大小为32232063字节。
The dataset includes multiple features such as Expression, Split, Cell_id, Gene, Cell_Ids, Ranked_Gene_Names, Full_Tokens, and Gene_Gene_Matrix. These features involve gene expression data, cell identifiers, gene names, gene rankings, full token sequences, and gene-gene matrices. The dataset is divided into training, test, and validation sets, containing 38638, 12074, and 9661 samples respectively. The total size of the dataset is 2396679652 bytes, with a download size of 32232063 bytes.
提供机构:
TerminatorJ
原始信息汇总
数据集概述
数据集特征
- Expression: 数值序列,数据类型为
float64 - Split: 字符串类型
- Cell_id: 字符串类型
- Gene: 字符串序列
- Cell_Ids: 字符串类型
- Ranked_Gene_Names: 字符串序列
- Full_Tokens: 整数序列,数据类型为
int64 - Gene_Gene_Matrix: 嵌套数值序列,数据类型为
float64
数据集分割
- train: 包含 38638 个样本,占用 1534515033 字节
- test: 包含 12074 个样本,占用 479657170 字节
- validation: 包含 9661 个样本,占用 382507449 字节
数据集大小
- 下载大小: 32232063 字节
- 总数据集大小: 2396679652 字节
配置
- default:
- train: 数据路径为
data/train-* - test: 数据路径为
data/test-* - validation: 数据路径为
data/validation-*
- train: 数据路径为



