TerminatorJ/relabel_output-XETG00048__0003817__VUHD116A__20230308__003730
收藏Hugging Face2024-07-15 更新2024-07-22 收录
下载链接:
https://hf-mirror.com/datasets/TerminatorJ/relabel_output-XETG00048__0003817__VUHD116A__20230308__003730
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含多个特征,包括表达数据(Expression)、分割信息(Split)、细胞ID(Cell_id)、基因信息(Gene)、细胞ID列表(Cell_Ids)、排名基因名称(Ranked_Gene_Names)、完整标记(Full_Tokens)和基因-基因矩阵(Gene_Gene_Matrix)。数据集被分为训练集、测试集和验证集,分别包含6984、2182和1748个样本。数据集的下载大小为5960889字节,总大小为502549298字节。
This dataset includes multiple features such as Expression data, Split information, Cell_id, Gene information, Cell_Ids, Ranked_Gene_Names, Full_Tokens, and Gene_Gene_Matrix. The dataset is divided into training, test, and validation sets, containing 6984, 2182, and 1748 samples respectively. The download size of the dataset is 5960889 bytes, and the total size is 502549298 bytes.
提供机构:
TerminatorJ
原始信息汇总
数据集概述
数据集特征
- Expression: 序列类型,数据类型为float64。
- Split: 字符串类型。
- Cell_id: 字符串类型。
- Gene: 序列类型,数据类型为字符串。
- Cell_Ids: 字符串类型。
- Ranked_Gene_Names: 序列类型,数据类型为字符串。
- Full_Tokens: 序列类型,数据类型为int64。
- Gene_Gene_Matrix: 嵌套序列类型,内部数据类型为float64。
数据集分割
- train: 包含6984个样本,占用321041907字节。
- test: 包含2182个样本,占用101071397字节。
- validation: 包含1748个样本,占用80435994字节。
数据集大小
- 下载大小: 5960889字节。
- 总数据集大小: 502549298字节。
配置
- default:
- train: 数据路径为
data/train-*。 - test: 数据路径为
data/test-*。 - validation: 数据路径为
data/validation-*。
- train: 数据路径为
搜集汇总
数据集介绍

以上内容由遇见数据集搜集并总结生成



