TerminatorJ/relabel_output-XETG00048__0003400__VUILD78LF__20230313__191400
收藏Hugging Face2024-07-15 更新2024-07-22 收录
下载链接:
https://hf-mirror.com/datasets/TerminatorJ/relabel_output-XETG00048__0003400__VUILD78LF__20230313__191400
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含多个特征,如Expression(表达量)、Split(分割类型)、Cell_id(细胞ID)、Gene(基因)、Cell_Ids(细胞ID列表)、Ranked_Gene_Names(排名基因名称)、Full_Tokens(完整标记)和Gene_Gene_Matrix(基因-基因矩阵)。数据集被分为训练集、测试集和验证集,分别包含10426、3258和2608个示例。数据集的下载大小为7630569字节,总大小为524673842字节。
The dataset contains multiple features such as Expression, Split, Cell_id, Gene, Cell_Ids, Ranked_Gene_Names, Full_Tokens, and Gene_Gene_Matrix. The dataset is divided into train, test, and validation sets, containing 10426, 3258, and 2608 examples respectively. The download size of the dataset is 7630569 bytes, and the total size is 524673842 bytes.
提供机构:
TerminatorJ
原始信息汇总
数据集概述
数据集特征
- Expression: 序列类型,数据类型为float64。
- Split: 字符串类型。
- Cell_id: 字符串类型。
- Gene: 序列类型,数据类型为字符串。
- Cell_Ids: 字符串类型。
- Ranked_Gene_Names: 序列类型,数据类型为字符串。
- Full_Tokens: 序列类型,数据类型为int64。
- Gene_Gene_Matrix: 序列类型,内部序列数据类型为float64。
数据集分割
- train: 包含10426个样本,占用336394500字节。
- test: 包含3258个样本,占用103953960字节。
- validation: 包含2608个样本,占用84325382字节。
数据集大小
- 下载大小: 7630569字节。
- 总数据集大小: 524673842字节。
配置信息
- default:
- train: 数据路径为
data/train-*。 - test: 数据路径为
data/test-*。 - validation: 数据路径为
data/validation-*。
- train: 数据路径为



