mahdibaghbanzadeh/dna_sample_30000

Name: mahdibaghbanzadeh/dna_sample_30000
Creator: mahdibaghbanzadeh
Published: 2024-02-14 03:25:04
License: 暂无描述

Hugging Face2024-02-14 更新2024-03-04 收录

下载链接：

https://hf-mirror.com/datasets/mahdibaghbanzadeh/dna_sample_30000

下载链接

链接失效反馈

官方服务：

资源简介：

--- dataset_info: features: - name: source_read dtype: string - name: sample_read dtype: string - name: score dtype: float32 splits: - name: train num_bytes: 49860000 num_examples: 30000 - name: validation num_bytes: 1662000 num_examples: 1000 - name: test num_bytes: 1662000 num_examples: 1000 download_size: 12575180 dataset_size: 53184000 configs: - config_name: default data_files: - split: train path: data/train-* - split: validation path: data/validation-* - split: test path: data/test-* ---

数据集信息：特征列表： - 字段名：源读取（source_read），数据类型：字符串（string） - 字段名：样本读取（sample_read），数据类型：字符串（string） - 字段名：评分（score），数据类型：32位浮点数（float32）数据划分： - 划分名称：训练集（train），字节占用量：49860000，样本数量：30000 - 划分名称：验证集（validation），字节占用量：1662000，样本数量：1000 - 划分名称：测试集（test），字节占用量：1662000，样本数量：1000 下载大小：12575180 数据集总大小：53184000 配置项： - 配置名称：默认配置（default），数据文件路径： - 训练集（train）：data/train-* - 验证集（validation）：data/validation-* - 测试集（test）：data/test-*

提供机构：

mahdibaghbanzadeh

原始信息汇总

数据集信息

特征

source_read: 数据类型为字符串（string）
sample_read: 数据类型为字符串（string）
score: 数据类型为浮点数（float32）

数据分割

train: 字节数为49860000，样本数为30000
validation: 字节数为1662000，样本数为1000
test: 字节数为1662000，样本数为1000

数据大小

下载大小: 12575180字节
数据集大小: 53184000字节

配置

config_name: default
- data_files:
  - train: 路径为data/train-*
  - validation: 路径为data/validation-*
  - test: 路径为data/test-*

5,000+

优质数据集

54 个

任务类型

进入经典数据集