jzshared/openGenome.v2
收藏Hugging Face2024-07-10 更新2024-07-22 收录
下载链接:
https://hf-mirror.com/datasets/jzshared/openGenome.v2
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含字符串类型的序列数据,分为验证集、训练集和测试集三个部分。验证集包含1988434个样本,训练集包含16059435个样本,测试集包含2031448个样本。数据集的下载大小为184704599743字节,总大小为397605505257字节。数据文件分别存储在data/val-*、data/train-*和data/test-*路径下。
The dataset contains sequence data of string type, divided into three parts: validation set, training set, and test set. The validation set contains 1988434 samples, the training set contains 16059435 samples, and the test set contains 2031448 samples. The download size of the dataset is 184704599743 bytes, and the total size is 397605505257 bytes. The data files are stored in the paths data/val-*, data/train-*, and data/test-*.
提供机构:
jzshared
原始信息汇总
数据集概述
数据特征
- 名称: sequence
- 数据类型: string
数据划分
- 验证集 (val)
- 字节数: 39,834,227,684
- 样本数: 1,988,434
- 训练集 (train)
- 字节数: 317,647,036,334
- 样本数: 16,059,435
- 测试集 (test)
- 字节数: 40,124,241,239
- 样本数: 2,031,448
数据集大小
- 下载大小: 184,704,599,743 字节
- 总大小: 397,605,505,257 字节
配置
- 配置名称: default
- 数据文件路径:
- 验证集: data/val-*
- 训练集: data/train-*
- 测试集: data/test-*
- 数据文件路径:



