five

suke-sho/plant-genome-corpus

收藏
Hugging Face2024-03-03 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/suke-sho/plant-genome-corpus
下载链接
链接失效反馈
官方服务:
资源简介:
该语料库包含来自不同物种的植物基因组,包括拟南芥、番茄、水稻、玉米、高粱和大豆。基因组数据来源于NCBI和Ensemble等权威数据库。这个多样化和全面的数据集适合用于预训练旨在理解和解释植物基因组信息的模型。

该语料库包含来自不同物种的植物基因组,包括拟南芥、番茄、水稻、玉米、高粱和大豆。基因组数据来源于NCBI和Ensemble等权威数据库。这个多样化和全面的数据集适合用于预训练旨在理解和解释植物基因组信息的模型。
提供机构:
suke-sho
原始信息汇总

Plant Genome Corpus

关于

该语料库包含来自多种植物物种的基因组,包括拟南芥(Arabidopsis thaliana)、番茄(Solanum lycopersicum)、水稻(Oryza sativa)、玉米(Zea mays)、高粱(Sorghum bicolor)和大豆(Glycine max)。基因组数据来源于NCBI和Ensemble等知名数据库。这个多样化和全面的数据集适用于旨在理解和解释植物基因组信息的预训练模型。

内容(plant-genome-corpus)

物种 来源 版本
拟南芥 NCBI TAIR10
番茄 NCBI SL3.1
水稻 Ensemble IRGSP-1.0
玉米 Ensemble AGPv3
高粱 Ensemble Sbi1
大豆 Ensemble Gm01

内容(plant-genome-multi-versions-corpus)

物种 来源 版本
拟南芥 NCBI build9.1
拟南芥 NCBI TAIR10
拟南芥 Ensemble TAIR9
水稻 Ensemble IRGSP-1.0
水稻 Ensemble MSU6
玉米 Ensemble AGPv2
玉米 Ensemble AGPv3
高粱 Ensemble Sbi1
大豆 Ensemble Gm01
番茄 NCBI SL3.1
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作