five

TerminatorJ/relabel_output-XETG00048__0003817__VUILD96MF__20230308__003730

收藏
Hugging Face2024-07-15 更新2024-07-22 收录
下载链接:
https://hf-mirror.com/datasets/TerminatorJ/relabel_output-XETG00048__0003817__VUILD96MF__20230308__003730
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含基因表达数据、细胞ID、基因名称、基因-基因矩阵等信息。数据集被分为训练集、测试集和验证集三个部分,分别包含32322、10100和8082个示例。数据集的下载大小为27611210字节,总大小为2162713197字节。

This dataset contains gene expression data, cell IDs, gene names, gene-gene matrices, and more. The dataset is divided into three parts: training set, test set, and validation set, containing 32,322, 10,100, and 8,082 examples respectively. The download size of the dataset is 27,611,210 bytes, and the total size is 2,162,713,197 bytes.
提供机构:
TerminatorJ
原始信息汇总

数据集概述

数据集特征

  • Expression: 序列类型,数据类型为 float64
  • Split: 字符串类型
  • Cell_id: 字符串类型
  • Gene: 序列类型,数据类型为 string
  • Cell_Ids: 字符串类型
  • Ranked_Gene_Names: 序列类型,数据类型为 string
  • Full_Tokens: 序列类型,数据类型为 int64
  • Gene_Gene_Matrix: 嵌套序列类型,内部数据类型为 float64

数据集分割

  • train: 包含 32322 个样本,占用 1385554456 字节
  • test: 包含 10100 个样本,占用 433533375 字节
  • validation: 包含 8082 个样本,占用 343625366 字节

数据集大小

  • 下载大小: 27611210 字节
  • 总数据集大小: 2162713197 字节

配置

  • default:
    • train: 数据路径为 data/train-*
    • test: 数据路径为 data/test-*
    • validation: 数据路径为 data/validation-*
二维码
社区交流群
二维码
科研交流群
商业服务