five

Narwhal dataset

收藏
arXiv2025-03-08 更新2025-03-11 收录
下载链接:
https://github.com/jmlipman/CoLeTra
下载链接
链接失效反馈
官方服务:
资源简介:
Narwhal数据集是一组同步辐射3D图像,来源于独角鲸的长牙,目的是对牙本质小管进行分割。该数据集包含20个训练补丁、1个验证补丁和3个测试补丁,是从单个扫描的不同部分提取的。这个数据集是为了评估和促进图像分割方法中拓扑准确性的研究而公开发布的。
提供机构:
丹麦技术大学DTU Compute,芬兰东芬兰大学A.I. Virtanen Institute,丹麦奥胡斯大学Department of Chemistry and iNANO
创建时间:
2025-03-08
搜集汇总
数据集介绍
main_image_url
构建方式
Narwhal数据集旨在为图像分割方法提供一个专注于拓扑准确性的评估平台。该数据集由20个来自单个扫描的牙本质小管区域的图像块组成,这些区域是从独角鲸的牙质中提取的。为了便于研究,研究人员对独角鲸的牙质进行径向切割,然后使用同步辐射X射线纳米断层扫描技术对切割后的棒状物进行成像。每个扫描包含2000个投影,覆盖180°,能量为18 keV,曝光时间为150 ms。图像重建使用GridRec算法和标准环去除技术,并使用Parzen滤波器进行去噪。最终数据集以16位灰度图像的形式输出,每个扫描的尺寸为2560 × 2560 × 2160体素。
特点
Narwhal数据集的特点在于其专注于牙本质小管的分割,这些小管是细长的管状结构,类似于血管。数据集的图像是通过同步辐射X射线纳米断层扫描技术获得的,这提供了高分辨率的三维图像,非常适合评估分割算法对细长结构的分割能力。此外,由于手动标注图像的成本非常高,因此数据集使用伪标签进行标注,这些伪标签是通过阈值分割和距离变换得到的。这种方法虽然不如手动标注准确,但足以可靠地测量拓扑准确性,例如计算小管数量。
使用方法
使用Narwhal数据集的方法包括将数据集分为训练集、验证集和测试集。训练集由64个重叠的图像块组成,每个块大约为591 × 530 × 583体素。验证集和测试集分别来自不同的扫描,每个集包含一个500 × 500 × 500体素的图像块。数据集的使用通常涉及训练分割模型,这些模型旨在识别和分割牙本质小管。评估模型性能的指标包括Dice系数、Hausdorff距离、中心线Dice系数和Betti误差,这些指标可以衡量分割的像素级、距离级和拓扑级特征。
背景与挑战
背景概述
图像分割技术在医学影像分析、材料科学等领域具有广泛的应用前景。然而,对于薄而细长的结构(如血管、神经轴突)的准确分割一直是一个难题。现有的图像分割模型通常采用像素级别的分类方式,即使是微小的分类错误也可能导致分割结果的断续,从而影响对结构拓扑结构的量化。为了解决这一问题,研究人员提出了拓扑损失函数等方法,但这些方法需要非常精确的拓扑结构标签,这在实际应用中往往难以获得。因此,需要一种新的数据增强方法来提高图像分割中拓扑结构的准确性。
当前挑战
Narwhal数据集面临的挑战主要包括:1)如何准确地分割薄而细长的结构,如血管、神经轴突等;2)如何获得精确的拓扑结构标签,以便于模型训练;3)如何有效地利用数据增强技术来提高图像分割中拓扑结构的准确性。为了解决这些问题,研究人员提出了CoLeTra数据增强方法,通过创建具有断开结构外观的图像,同时保持原始标签,使模型学习到即使结构外观断开,实际上仍然是连接的。实验结果表明,CoLeTra能够显著提高图像分割的拓扑结构准确性,同时也能提高Dice系数和Hausdorff距离等指标。
常用场景
经典使用场景
Narwhal数据集主要被用于评估图像分割方法在拓扑准确性方面的表现。该数据集通过提供具有连续性和复杂拓扑结构的图像,帮助研究人员评估和改进图像分割算法。通过在训练过程中引入CoLeTra数据增强方法,可以训练模型更好地识别和连接图像中看似断开的结构,从而提高分割的拓扑准确性。
解决学术问题
Narwhal数据集解决了图像分割中薄壁管状结构的精确分割难题。传统的深度学习模型在处理此类结构时容易产生断裂,导致拓扑结构不准确。Narwhal数据集通过引入CoLeTra数据增强方法,帮助模型学习连接看似断开的结构,从而提高了拓扑准确性。这对于医学影像、材料科学等领域具有重要意义,因为这些领域中的图像分割通常需要高精度的拓扑结构信息。
衍生相关工作
Narwhal数据集的发布促进了图像分割领域的研究,特别是针对拓扑准确性的研究。基于Narwhal数据集,研究人员可以开发出更先进的图像分割算法,并与其他拓扑增强策略相结合,如拓扑损失函数、可变形卷积神经网络等,进一步提高图像分割的拓扑准确性。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作