TerminatorJ/relabel_output-XETG00048__0003789__VUHD113__20230308__003731
收藏Hugging Face2024-07-15 更新2024-07-22 收录
下载链接:
https://hf-mirror.com/datasets/TerminatorJ/relabel_output-XETG00048__0003789__VUHD113__20230308__003731
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含多个特征,如Expression(表达量)、Split(分割)、Cell_id(细胞ID)、Gene(基因)等,每个特征都有其特定的数据类型。数据集被分为训练集、测试集和验证集三个部分,每个部分都有相应的字节大小和示例数量。数据集的下载大小为6199159字节,总大小为518566249字节。配置信息部分指定了每个分割数据文件的路径。
The dataset includes multiple features such as Expression, Split, Cell_id, etc., each with specific data types or sequence types. The dataset is divided into train, test, and validation parts, each with corresponding file paths and sample counts. The total download size of the dataset is 6199159 bytes, and the actual size is 518566249 bytes.
提供机构:
TerminatorJ
原始信息汇总
数据集概述
数据集特征
- Expression: 数值序列,类型为
float64 - Split: 字符串类型
- Cell_id: 字符串类型
- Gene: 字符串序列
- Cell_Ids: 字符串类型
- Ranked_Gene_Names: 字符串序列
- Full_Tokens: 整数序列,类型为
int64 - Gene_Gene_Matrix: 嵌套数值序列,类型为
float64
数据集分割
- train: 包含 7517 个样本,占用 331786227 字节
- test: 包含 2349 个样本,占用 103393026 字节
- validation: 包含 1880 个样本,占用 83386996 字节
数据集大小
- 下载大小: 6199159 字节
- 总数据集大小: 518566249 字节
配置信息
- default:
- train: 数据路径为
data/train-* - test: 数据路径为
data/test-* - validation: 数据路径为
data/validation-*
- train: 数据路径为



