Complete mitogenome and phylogenetic analysis of Brassica oleracea L. var. italica Plenck|基因组学数据集|生物分类学数据集

DataCite Commons2025-04-30 更新2025-05-07 收录

基因组学

生物分类学

下载链接：

https://tandf.figshare.com/articles/dataset/Complete_mitogenome_and_phylogenetic_analysis_of_i_Brassica_oleracea_i_L_var_i_italica_i_Plenck/28714340

下载链接

链接失效反馈

资源简介：

In this study, we assembled and annotated the mitochondrial genome (mitogenome) of B. oleracea L. var. italica Plenck. This mitogenome was found to span 219 964 bp, with a GC content of 45.25%. It comprised 61 genes, including 35 protein-coding, 23 transfer RNA, and three ribosomal RNA genes. Among these, only 11 genes contained introns. Codon preference analysis revealed a bias toward codons ending in A/U bases. A phylogenetic analysis demonstrated a close relationship between B. oleracea L. var. italica Plenck, B. oleracea L. botrytis, and B. oleracea var. capitata. This reference mitogenome provides a basis for research on genetic conservation, phylogenetic relationships, and molecular breeding strategies among members of the Brassica genus.

提供机构：

Taylor & Francis

创建时间：

2025-04-02

用户留言

有没有相关的论文或文献参考？

这个数据集是基于什么背景创建的？

数据集的作者是谁？

能帮我联系到这个数据集的作者吗？

这个数据集如何下载？

点击留言

数据主题

具身智能

数据集 4098个

机构 8个

大模型

数据集 439个

机构 10个

无人机

数据集 37个

机构 6个

指令微调

数据集 36个

机构 6个

蛋白质结构

数据集 50个

机构 8个

空间智能

数据集 21个

机构 5个

5,000+

优质数据集

54 个

任务类型

进入经典数据集

热门数据集

CatMeows

该数据集包含440个声音样本，由21只属于两个品种（缅因州库恩猫和欧洲短毛猫）的猫在三种不同情境下发出的喵声组成。这些情境包括刷毛、在陌生环境中隔离和等待食物。每个声音文件都遵循特定的命名约定，包含猫的唯一ID、品种、性别、猫主人的唯一ID、录音场次和发声计数。此外，还有一个额外的zip文件，包含被排除的录音（非喵声）和未剪辑的连续发声序列。

huggingface 收录

UniProt

UniProt（Universal Protein Resource）是全球公认的蛋白质序列与功能信息权威数据库，由欧洲生物信息学研究所（EBI）、瑞士生物信息学研究所（SIB）和美国蛋白质信息资源中心（PIR）联合运营。该数据库以其广度和深度兼备的蛋白质信息资源闻名，整合了实验验证的高质量数据与大规模预测的自动注释内容，涵盖从分子序列、结构到功能的全面信息。UniProt核心包括注释详尽的UniProtKB知识库（分为人工校验的Swiss-Prot和自动生成的TrEMBL），以及支持高效序列聚类分析的UniRef和全局蛋白质序列归档的UniParc。其卓越的数据质量和多样化的检索工具，为基础研究和药物研发提供了无可替代的支持，成为生物学研究中不可或缺的资源。

www.uniprot.org 收录

GME Data

关于2021年GameStop股票活动的数据，包括每日合并的GME短期成交量数据、每日失败交付数据、可借股数、期权链数据以及不同时间框架的开盘/最高/最低/收盘/成交量条形图。

github 收录

CIFAR-10

CIFAR-10 数据集由 10 个类别的 60000 个 32x32 彩色图像组成，每个类别包含 6000 个图像。有 50000 个训练图像和 10000 个测试图像。数据集分为五个训练批次和一个测试批次，每个批次有 10000 张图像。测试批次恰好包含来自每个类别的 1000 个随机选择的图像。训练批次包含随机顺序的剩余图像，但一些训练批次可能包含来自一个类的图像多于另一个。在它们之间，训练批次恰好包含来自每个类别的 5000 张图像。

OpenDataLab 收录

UniMed

UniMed是一个大规模、开源的多模态医学数据集，包含超过530万张图像-文本对，涵盖六种不同的医学成像模态：X射线、CT、MRI、超声、病理学和眼底。该数据集通过利用大型语言模型（LLMs）将特定模态的分类数据集转换为图像-文本格式，并结合现有的医学领域的图像-文本数据，以促进可扩展的视觉语言模型（VLM）预训练。

github 收录

Complete mitogenome and phylogenetic analysis of <i>Brassica oleracea</i> L. var. <i>italica</i> Plenck|基因组学数据集|生物分类学数据集