mahdibaghbanzadeh/dna_sample_30000
收藏Hugging Face2024-02-14 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/mahdibaghbanzadeh/dna_sample_30000
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
features:
- name: source_read
dtype: string
- name: sample_read
dtype: string
- name: score
dtype: float32
splits:
- name: train
num_bytes: 49860000
num_examples: 30000
- name: validation
num_bytes: 1662000
num_examples: 1000
- name: test
num_bytes: 1662000
num_examples: 1000
download_size: 12575180
dataset_size: 53184000
configs:
- config_name: default
data_files:
- split: train
path: data/train-*
- split: validation
path: data/validation-*
- split: test
path: data/test-*
---
数据集信息:
特征列表:
- 字段名:源读取(source_read),数据类型:字符串(string)
- 字段名:样本读取(sample_read),数据类型:字符串(string)
- 字段名:评分(score),数据类型:32位浮点数(float32)
数据划分:
- 划分名称:训练集(train),字节占用量:49860000,样本数量:30000
- 划分名称:验证集(validation),字节占用量:1662000,样本数量:1000
- 划分名称:测试集(test),字节占用量:1662000,样本数量:1000
下载大小:12575180
数据集总大小:53184000
配置项:
- 配置名称:默认配置(default),数据文件路径:
- 训练集(train):data/train-*
- 验证集(validation):data/validation-*
- 测试集(test):data/test-*
提供机构:
mahdibaghbanzadeh
原始信息汇总
数据集信息
特征
- source_read: 数据类型为字符串(string)
- sample_read: 数据类型为字符串(string)
- score: 数据类型为浮点数(float32)
数据分割
- train: 字节数为49860000,样本数为30000
- validation: 字节数为1662000,样本数为1000
- test: 字节数为1662000,样本数为1000
数据大小
- 下载大小: 12575180字节
- 数据集大小: 53184000字节
配置
- config_name: default
- data_files:
- train: 路径为
data/train-* - validation: 路径为
data/validation-* - test: 路径为
data/test-*
- train: 路径为
- data_files:



