lhallee/cds_euk
收藏Hugging Face2024-07-11 更新2024-07-13 收录
下载链接:
https://hf-mirror.com/datasets/lhallee/cds_euk
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含三个主要特征:seqs(序列)、ids(标识符)和species(物种)。数据被分割为一批(batch1),包含3,953,935个例子,总大小为1,874,420,101字节。数据集的总下载大小为1,612,434,833字节。这些特征表明数据集可能用于生物信息学或基因组学研究,特别是与物种相关的序列数据分析。
The dataset includes three main features: seqs (sequences), ids (identifiers), and species (species). The data is divided into one batch (batch1), containing 3,953,935 examples with a total size of 1,874,420,101 bytes. The total download size of the dataset is 1,612,434,833 bytes. These features suggest that the dataset may be used for bioinformatics or genomic studies, particularly for sequence data analysis related to species.
提供机构:
lhallee
原始信息汇总
数据集概述
数据特征
- seqs: 数据类型为字符串。
- ids: 数据类型为字符串。
- species: 数据类型为字符串。
数据分割
- batch1:
- 字节数: 1874420101
- 样本数: 3953935
数据集大小
- 下载大小: 1612434833 字节
- 数据集大小: 1874420101 字节
配置
- default:
- 数据文件路径:
data/batch1-*
- 数据文件路径:



