five

Rove-Tree-11

收藏
github2022-12-12 更新2024-05-31 收录
下载链接:
https://github.com/robertahunt/Rove-Tree-11
下载链接
链接失效反馈
官方服务:
资源简介:
Rove-Tree-11数据集用于进一步研究使用深度学习自动生成系统发育树(显示物种亲缘关系的树)的图像。该数据集提供了来自丹麦自然历史博物馆收藏的215种Rove甲虫的13,887个标本的分割图像,以及当前的黄金标准系统发育。

The Rove-Tree-11 dataset is utilized for further research into the automatic generation of phylogenetic trees (trees that display the genetic relationships among species) using deep learning. This dataset provides segmented images of 13,887 specimens from 215 species of Rove beetles, collected from the Natural History Museum of Denmark, along with the current gold-standard phylogeny.
创建时间:
2022-09-27
原始信息汇总

数据集概述

数据集名称

Rove-Tree-11

数据集目的

用于进一步研究从图像自动生成系统发育树(显示物种亲缘关系的树)的深度学习技术。数据集包含来自丹麦自然历史博物馆收藏的215种Rove甲虫的13,887个标本的分割图像。

数据集内容

  • 13,887个甲虫标本的分割图像
  • 当前的黄金标准系统发育树

数据集下载

地址:https://erda.ku.dk/archives/118d9022feb67f8eb7f7bc8bce71187f/published-archive.html DOI:http://doi.org/10.17894/ucph.39619bba-4569-4415-9f25-d6a0ff64f0e3

使用方法

  • 运行深度度量学习模型:通过命令行运行python main.py,具体参数配置参考README文件。
  • 生成对齐分数:使用RevBayes程序从连续特征生成系统发育树,并与真实系统发育树进行比较。

引用信息

@InProceedings{Hunt_2022_ACCV, author = {Hunt, Roberta and Pedersen, Kim Steenstrup}, title = {Rove-Tree-11: The not-so-Wild Rover, A hierarchically structured image dataset for deep metric learning research}, booktitle = {Proceedings of the Asian Conference on Computer Vision (ACCV)}, month = {December}, year = {2022}, pages = {2967-2983} }

许可证

MIT许可证

搜集汇总
数据集介绍
main_image_url
构建方式
Rove-Tree-11数据集的构建基于丹麦自然历史博物馆的收藏,涵盖了215种不同种类的隐翅虫(Staphylinidae科)的13,887个标本的细分图像。这些图像被用于深度学习研究中,旨在通过图像自动生成系统发育树(phylogenetic trees)。数据集还提供了一个当前的金标准系统发育树,作为研究中的参考。
特点
Rove-Tree-11数据集的特点在于其层次化结构,专门设计用于深度度量学习研究。数据集不仅提供了大量的隐翅虫图像,还包含了每个标本的详细分类信息,使得研究者能够在深度学习模型中探索物种间的亲缘关系。此外,数据集的图像经过精心分割,确保了图像质量的一致性,为深度学习模型的训练提供了高质量的数据基础。
使用方法
使用Rove-Tree-11数据集时,研究者首先需要下载数据集并安装相关的Python依赖项。通过命令行运行主代码,可以启动深度学习模型的训练过程。数据集的使用还包括生成对齐分数(align scores),这一过程涉及将潜在特征通过RevBayes程序进行贝叶斯推断,生成系统发育树,并与金标准系统发育树进行对比。研究者可以通过修改Jupyter笔记本中的路径来运行这些步骤,从而获得研究结果。
背景与挑战
背景概述
Rove-Tree-11数据集由Roberta Hunt和Kim Steenstrup Pedersen于2022年创建,旨在推动基于深度学习的系统发育树自动生成研究。该数据集包含来自丹麦自然历史博物馆的13,887个标本图像,涵盖215种隐翅虫科(Staphylinidae)甲虫。数据集的核心研究问题是通过图像数据生成系统发育树,从而揭示物种间的亲缘关系。Rove-Tree-11的发布为深度学习在生物信息学中的应用提供了重要支持,特别是在深度度量学习领域,推动了图像特征提取与系统发育分析相结合的研究。
当前挑战
Rove-Tree-11数据集面临的挑战主要集中在两个方面。首先,在领域问题方面,如何从高维图像数据中提取有效的特征以准确反映物种间的系统发育关系,是一个复杂的任务。这需要模型能够捕捉细微的形态学差异,并将其映射到系统发育树的结构中。其次,在数据集构建过程中,挑战包括图像分割的准确性、数据标注的复杂性以及系统发育树的标准化问题。此外,由于数据集规模较大,计算资源的限制和模型训练的优化也是实际应用中的主要障碍。这些挑战共同构成了Rove-Tree-11在推动深度学习与生物信息学交叉研究中的关键问题。
常用场景
经典使用场景
Rove-Tree-11数据集在深度学习领域中的经典使用场景主要集中在其用于生成系统发育树的研究。该数据集通过提供来自丹麦自然历史博物馆的13,887个甲虫标本的细分图像,涵盖了215种不同的Rove甲虫(Staphylinidae科)。这些图像被用于训练深度度量学习模型,以自动生成反映物种间亲缘关系的系统发育树。
解决学术问题
Rove-Tree-11数据集解决了在生物信息学和计算机视觉交叉领域中,如何从图像数据中自动推断物种间系统发育关系的学术问题。通过提供高质量的图像数据和相应的系统发育树标准,该数据集为研究人员提供了一个可靠的基准,用于开发和验证新的深度学习算法,特别是在深度度量学习和系统发育树生成方面。
衍生相关工作
Rove-Tree-11数据集衍生了一系列相关的研究工作,特别是在深度度量学习和系统发育树生成领域。例如,基于该数据集的研究提出了新的深度学习模型,用于提高系统发育树的生成精度。此外,该数据集还启发了其他类似数据集的创建,推动了生物信息学和计算机视觉领域的交叉研究。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作