five

TopoMortar

收藏
arXiv2025-03-05 更新2025-03-07 收录
下载链接:
https://www.github.com/ jmlipman/TopoMortar
下载链接
链接失效反馈
官方服务:
资源简介:
TopoMortar是一个砖墙数据集,由丹麦技术大学等机构创建,专为评估关注拓扑准确性的图像分割方法而设计。该数据集包含420张512×512像素的RGB图像,用于砂浆分割任务。数据集分为训练集、验证集和测试集,提供了精准标注、伪标签和噪声标签,并针对不同挑战设计了分布式的测试集,旨在解决图像分割中的拓扑准确性问题。

TopoMortar is a brick wall dataset created by institutions including the Technical University of Denmark, which is specifically designed to evaluate image segmentation methods focusing on topological accuracy. This dataset contains 420 RGB images with a resolution of 512×512 pixels for mortar segmentation tasks. It is split into training, validation and test sets, and provides precise annotations, pseudo-labels and noisy labels. In addition, distributed test sets tailored for different challenges are designed, aiming to address the issue of topological accuracy in image segmentation.
提供机构:
丹麦技术大学应用数学与计算机科学系,芬兰东芬兰大学A.I. Virtanen研究所,日本索桥大学建筑学院
创建时间:
2025-03-05
搜集汇总
数据集介绍
main_image_url
构建方式
TopoMortar数据集的构建旨在评估拓扑准确性为焦点的图像分割方法。该数据集包括三种类型的标签(准确标签、伪标签和噪声标签),两个固定的训练集(大和小),以及分布内和分布外的测试集图像。为了消除现实世界数据中的挑战,如小训练集、噪声标签和分布外测试集图像,该数据集提供了评估拓扑损失函数有效性的可能性。同时,它允许在同一数据集上评估拓扑准确性,从而将数据集相关的影响与引入先验拓扑知识的影响隔离开来。TopoMortar数据集的构建确保了在评估拓扑损失函数时,可以将拓扑准确性提高归因于对先验拓扑知识的成功引入。
特点
TopoMortar数据集的特点在于其专门设计用于评估拓扑准确性,并提供了多种挑战来测试模型对不同数据集挑战的鲁棒性。它包括手动标注的准确标签、伪标签和噪声标签,以及分布内和分布外的测试集图像。这些特点使得TopoMortar数据集能够有效地评估图像分割方法对拓扑准确性的影响,并确定是否引入了先验拓扑知识。此外,该数据集还提供了两种固定大小的训练集,方便研究者进行不同规模的实验。
使用方法
使用TopoMortar数据集的方法包括将模型在数据集上进行训练和测试,并使用提供的准确标签、伪标签和噪声标签来评估模型的拓扑准确性。研究者可以使用两种固定大小的训练集来研究不同训练规模对模型性能的影响。此外,数据集还提供了分布内和分布外的测试集图像,用于评估模型在不同数据集挑战下的鲁棒性。为了确保评估的准确性,研究者可以使用提供的标签来计算Betti误差、Dice系数和Hausdorff距离等指标。
背景与挑战
背景概述
图像分割技术在计算机视觉领域扮演着关键角色,而拓扑准确性的考量则对于确保分割结果的连通性和结构完整性尤为重要。TopoMortar数据集的创建正是为了评估专注于拓扑准确性的图像分割方法,如拓扑损失函数。该数据集由丹麦技术大学应用数学与计算机科学系、芬兰东部芬兰大学A.I. Virtanen研究所和日本宗像大学建筑学部的研究人员共同设计,于2025年首次发布。TopoMortar数据集的独特之处在于其专门针对拓扑准确性进行评估,通过消除现实世界数据中的常见挑战,如小训练集、噪声标签和分布外测试图像,从而揭示了拓扑损失函数在真实场景下的表现。此外,TopoMortar还提供了多种标签类型(准确、伪标签和噪声标签),以及大小不同的训练集,使得研究者能够评估模型在各种数据挑战下的鲁棒性。TopoMortar数据集的发布不仅填补了该领域的空白,还为拓扑损失函数的研究提供了新的基准。
当前挑战
尽管TopoMortar数据集为拓扑准确性评估提供了宝贵的资源,但其构建过程中也面临了诸多挑战。首先,数据集的构建需要大量手动标注,这不仅耗时而且成本高昂。其次,如何设计能够全面评估拓扑准确性的指标和方法也是一个挑战。此外,数据集的多样性对于评估模型在不同场景下的表现至关重要,而收集和标注这些多样化的数据同样面临挑战。最后,数据集的发布和使用需要遵循一定的规范和标准,以确保研究的可重复性和可靠性。
常用场景
经典使用场景
TopoMortar数据集是首个专门设计用于评估拓扑准确性图像分割方法的砖墙数据集,其经典使用场景包括评估不同拓扑损失函数在拓扑准确性方面的表现。通过比较不同拓扑损失函数在TopoMortar数据集上的性能,研究者可以深入理解这些方法在实际应用中的表现和局限性,并据此优化算法设计。
衍生相关工作
TopoMortar数据集的发布,衍生了一系列相关的研究工作。研究者们基于TopoMortar数据集,提出了多种新的拓扑损失函数和图像分割算法,并在该数据集上进行了评估。这些研究成果进一步推动了图像分割领域的发展,为解决实际图像分割问题提供了新的思路和方法。
数据集最近研究
最新研究方向
TopoMortar数据集是首个专门设计用于评估拓扑精度图像分割方法的砖墙数据集。它通过消除真实世界数据中的挑战,例如小训练集、噪声标签和分布外的测试集图像,以及通过在同一个数据集上评估拓扑精度,来研究方法是否包含先验拓扑知识。此外,TopoMortar还提供了三种类型的标签(准确标签、伪标签和噪声标签)、两个固定的训练集(大和小)以及分布内和分布外的测试集图像。通过比较八种损失函数,研究发现clDice通常能够实现最拓扑准确的分割,Skeleton Recall损失在噪声标签的情况下表现最佳,而其他损失函数的优势则取决于实验设置。此外,还表明数据增强和自蒸馏等简单方法可以提高交叉熵Dice损失的性能,使其超过大多数拓扑损失函数,并且这些简单方法也可以增强拓扑损失函数。clDice和Skeleton Recall损失,这两种基于骨架化的损失函数,也是训练最快的,这使得这种类型的损失函数成为一个有希望的研究方向。
相关研究论文
  • 1
    TopoMortar: A dataset to evaluate image segmentation methods focused on topology accuracy丹麦技术大学应用数学与计算机科学系,芬兰东芬兰大学A.I. Virtanen研究所,日本索桥大学建筑学院 · 2025年
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作