suke-sho/plant-genome-corpus
收藏Hugging Face2024-03-03 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/suke-sho/plant-genome-corpus
下载链接
链接失效反馈官方服务:
资源简介:
该语料库包含来自不同物种的植物基因组,包括拟南芥、番茄、水稻、玉米、高粱和大豆。基因组数据来源于NCBI和Ensemble等权威数据库。这个多样化和全面的数据集适合用于预训练旨在理解和解释植物基因组信息的模型。
该语料库包含来自不同物种的植物基因组,包括拟南芥、番茄、水稻、玉米、高粱和大豆。基因组数据来源于NCBI和Ensemble等权威数据库。这个多样化和全面的数据集适合用于预训练旨在理解和解释植物基因组信息的模型。
提供机构:
suke-sho
原始信息汇总
Plant Genome Corpus
关于
该语料库包含来自多种植物物种的基因组,包括拟南芥(Arabidopsis thaliana)、番茄(Solanum lycopersicum)、水稻(Oryza sativa)、玉米(Zea mays)、高粱(Sorghum bicolor)和大豆(Glycine max)。基因组数据来源于NCBI和Ensemble等知名数据库。这个多样化和全面的数据集适用于旨在理解和解释植物基因组信息的预训练模型。
内容(plant-genome-corpus)
| 物种 | 来源 | 版本 |
|---|---|---|
| 拟南芥 | NCBI | TAIR10 |
| 番茄 | NCBI | SL3.1 |
| 水稻 | Ensemble | IRGSP-1.0 |
| 玉米 | Ensemble | AGPv3 |
| 高粱 | Ensemble | Sbi1 |
| 大豆 | Ensemble | Gm01 |
内容(plant-genome-multi-versions-corpus)
| 物种 | 来源 | 版本 |
|---|---|---|
| 拟南芥 | NCBI | build9.1 |
| 拟南芥 | NCBI | TAIR10 |
| 拟南芥 | Ensemble | TAIR9 |
| 水稻 | Ensemble | IRGSP-1.0 |
| 水稻 | Ensemble | MSU6 |
| 玉米 | Ensemble | AGPv2 |
| 玉米 | Ensemble | AGPv3 |
| 高粱 | Ensemble | Sbi1 |
| 大豆 | Ensemble | Gm01 |
| 番茄 | NCBI | SL3.1 |



