five

Gurveer05/maize-nam-gene-expression-data

收藏
Hugging Face2024-01-14 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/Gurveer05/maize-nam-gene-expression-data
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含26个玉米NAM品系的启动子序列和对应的基因表达数据(以TPM值表示),并用于Florabert模型的微调步骤。数据集被分为训练、测试和评估数据,比例为70-20-10,总共有约700,000条数据。数据集的标签对应于不同组织的TPM值,包括花穗、基部、花药、中部、穗、芽、尖和根。使用的序列是那些至少有一个组织的TPM值大于1的玉米NAM品系基因的启动子序列。

该数据集包含26个玉米NAM品系的启动子序列和对应的基因表达数据(以TPM值表示),并用于Florabert模型的微调步骤。数据集被分为训练、测试和评估数据,比例为70-20-10,总共有约700,000条数据。数据集的标签对应于不同组织的TPM值,包括花穗、基部、花药、中部、穗、芽、尖和根。使用的序列是那些至少有一个组织的TPM值大于1的玉米NAM品系基因的启动子序列。
提供机构:
Gurveer05
原始信息汇总

玉米NAM品系的启动子序列及相应基因表达数据

数据集描述

该数据集包含26个玉米NAM品系的启动子序列及其相应的基因表达数据,以TPM值表示。这些数据已被用于Florabert模型的微调步骤,以进行下游的基因表达预测任务。

数据划分

数据被分为训练集、测试集和评估集,比例为70-20-10。总共约有700,000条记录。获取这些数据的步骤可在Github Repository中找到。

标签说明

标签对应于不同组织类型的TPM值,顺序为:

  • tassel
  • base
  • anther
  • middle
  • ear
  • shoot
  • tip
  • root

所使用的序列是至少有一个组织的TPM值大于1的玉米NAM品系基因的启动子序列。

5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作