mahdibaghbanzadeh/GUE_virus_covid
收藏Hugging Face2024-03-19 更新2024-06-11 收录
下载链接:
https://hf-mirror.com/datasets/mahdibaghbanzadeh/GUE_virus_covid
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含两个主要特征:sequence和labels。sequence特征的数据类型为字符串,labels特征是一个分类标签,包含从0到8的类别。数据集分为训练集、验证集和测试集,分别包含73335、9166和9168个样本。数据集的总下载大小为40997725字节,总大小为92677359字节。
该数据集包含两个主要特征:sequence和labels。sequence特征的数据类型为字符串,labels特征是一个分类标签,包含从0到8的类别。数据集分为训练集、验证集和测试集,分别包含73335、9166和9168个样本。数据集的总下载大小为40997725字节,总大小为92677359字节。
提供机构:
mahdibaghbanzadeh
原始信息汇总
数据集概述
数据集特征
- sequence:字符串类型
- labels:分类标签,包含以下类别:
- 0: 0
- 1: 1
- 2: 2
- 3: 3
- 4: 4
- 5: 5
- 6: 6
- 7: 7
- 8: 8
数据集划分
- train:
- 数据量:73335个样本
- 大小:74141685字节
- val:
- 数据量:9166个样本
- 大小:9266826字节
- test:
- 数据量:9168个样本
- 大小:9268848字节
数据集大小
- 下载大小:40997725字节
- 总大小:92677359字节
数据文件配置
- default 配置:
- train:路径为
data/train-* - val:路径为
data/val-* - test:路径为
data/test-*
- train:路径为



