jirvine/doric_from_plsdb_split
收藏Hugging Face2024-05-22 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/jirvine/doric_from_plsdb_split
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含多个特征,如OriC序列、ori_id、plasmid_id、pfamid_fast、物种、cluster_id、supercluster、split和source。数据集分为训练集和验证集,训练集包含903个样本,验证集包含306个样本。数据集的下载大小为434825字节,总大小为1209687字节。
该数据集包含多个特征,如OriC序列、ori_id、plasmid_id、pfamid_fast、物种、cluster_id、supercluster、split和source。数据集分为训练集和验证集,训练集包含903个样本,验证集包含306个样本。数据集的下载大小为434825字节,总大小为1209687字节。
提供机构:
jirvine
原始信息汇总
数据集概述
数据集特征
- OriC sequence:数据类型为字符串。
- ori_id:数据类型为字符串。
- plasmid_id:数据类型为字符串。
- pfamid_fast:数据类型为字符串。
- species:数据类型为字符串。
- cluster_id:数据类型为字符串。
- supercluster:数据类型为整数。
- split:数据类型为字符串。
- source:数据类型为字符串。
- index_level_0:数据类型为整数。
数据集分割
- 训练集:包含903个样本,总大小为894262字节。
- 验证集:包含306个样本,总大小为315425字节。
数据集大小
- 下载大小:434825字节。
- 数据集总大小:1209687字节。
配置文件
- 默认配置:包含训练集和验证集的数据文件路径。
- 训练集路径:
data/train-* - 验证集路径:
data/validation-*
- 训练集路径:



