ToothFairy2 dataset

github2025-06-15 更新2025-06-24 收录

下载链接：

https://github.com/AImageLab-zip/ToothFairy2-Benchmark

下载链接

链接失效反馈

官方服务：

资源简介：

ToothFairy2数据集是一个大规模、公开可用的CBCT扫描集合，包含42个颌面结构的体素级3D注释，包括牙齿、颌骨、鼻窦和牙槽管。

The ToothFairy2 Dataset is a large-scale, publicly available collection of CBCT scans, containing voxel-level 3D annotations for 42 maxillofacial structures, including teeth, jaws, sinuses, and alveolar canals.

创建时间：

2025-06-11

原始信息汇总

ToothFairy2数据集概述

数据集简介

名称：ToothFairy2
类型：CBCT扫描数据集
标注内容：42种颌面部结构的体素级3D标注（包括牙齿、颌骨、鼻窦和牙槽管等）
用途：用于评估最先进的3D分割方法（包括CNN、Transformer和Mamba-based模型）

数据集特点

规模：大规模公开数据集
格式：支持nnU-Net框架的标准格式
官方链接：https://ditto.ing.unimore.it/toothfairy2/

数据准备

文件夹结构要求
- 必须创建三个基础文件夹：
  - nnUNet_raw
  - nnUNet_preprocessed
  - nnUNet_results
- 需设置对应的环境变量
文件命名规范
- 训练图像：caseID_0000.nii.gz
- 对应标签：caseID.nii.gz
配置文件
- 需包含dataset.json文件
- 可使用命令自动生成

训练方法

支持模型：
- 标准nnUNet（3D全分辨率）
- ResEncL nnUNet版本
- nnFormer
- SwinUMamba（2D）
- VMamba（2D）
- UMamba（3D全分辨率）
训练命令：所有模型均通过nnUNetv2_train命令启动，需指定：
- 数据集ID
- 分辨率配置（2D/3D_fullres）
- 训练器名称
- 计划文件

预置资源

提供预生成的计划文件
存放路径：nnUNetplans_files文件夹

搜集汇总

数据集介绍

构建方式

ToothFairy2数据集作为口腔颌面结构分割领域的重要资源，其构建过程体现了严谨的医学影像处理流程。该数据集通过收集大量锥形束CT（CBCT）扫描数据，采用专业医学标注工具对42种颌面结构进行体素级三维标注，涵盖牙齿、颌骨、鼻窦及牙槽管等关键解剖区域。数据预处理阶段严格遵循DICOM标准转换，并依据nnU-Net框架要求将原始数据转换为NIfTI格式，确保与主流深度学习框架兼容。标注工作由经验丰富的放射科医师团队完成，并通过交叉验证保证标注一致性，最终形成结构化存储的医学影像数据集。

特点

ToothFairy2数据集在口腔医学影像分析领域具有显著优势。其最突出的特点是包含42类精细标注的颌面解剖结构，这种全场景覆盖为多目标分割研究提供了理想平台。数据集采用高分辨率CBCT扫描数据，体素标注精度达到0.2mm³，能清晰呈现复杂解剖结构的三维空间关系。数据分布方面，该集涵盖了不同年龄层、牙列状态及病理特征的样本，具有较好的临床代表性。特别值得注意的是，数据集提供标准化的评估指标和基线模型，支持从传统CNN到Transformer、Mamba等前沿架构的公平比较。

使用方法

该数据集的使用需遵循规范的医学影像分析流程。研究者首先需配置nnU-Net环境，按照指定目录结构组织数据，其中训练图像需以caseID_0000.nii.gz格式存放于imagesTr目录，对应标注文件以caseID.nii.gz命名置于labelsTr目录。通过自动生成的dataset.json文件描述数据集元信息后，运行nnUNetv2_plan_and_preprocess命令完成数据指纹计算和预处理。训练阶段支持多种网络架构选择，包括3D全分辨率nnU-Net、nnFormer等模型，通过修改-t参数切换不同训练器。为提升模型泛化性，建议结合镜像增强等策略进行数据扩增。

背景与挑战

背景概述

ToothFairy2数据集由AImageLab团队于2025年推出，旨在为口腔颌面结构的精确分割提供高质量的三维标注数据。该数据集包含大量锥形束计算机断层扫描（CBCT）影像，涵盖42种颌面解剖结构，如牙齿、颌骨、鼻窦及牙槽管等。作为首个公开的大规模CBCT标注数据集，ToothFairy2通过标准化评估框架推动了医学影像分析领域的发展，尤其为牙科诊断、正畸规划和外科手术导航等临床应用提供了重要基准。其创新性体现在采用nnU-Net框架集成Transformer与Mamba等前沿模型，显著提升了复杂解剖结构的识别精度。

当前挑战

该数据集面临的领域挑战主要源于CBCT影像固有的低对比度与金属伪影干扰，导致细小结构如牙根管的分割准确率难以突破。在构建过程中，研究团队需解决三维标注的专家共识难题——不同解剖结构的边界界定需要多名放射科医师协同标注，而颌面区域复杂的空间重叠特征进一步增加了标注复杂度。此外，数据异构性表现为扫描设备参数差异导致的体素间距不一致，要求预处理流程具备鲁棒的标准化能力。这些挑战促使后续研究聚焦于多模态融合与域适应方法的创新。

常用场景

经典使用场景

在口腔医学影像分析领域，ToothFairy2数据集为研究者提供了精确分割颌面部结构的标准化平台。该数据集通过42个解剖结构的体素级标注，支持从传统卷积神经网络到Transformer和Mamba架构的多种模型训练与评估，成为三维CBCT影像分割领域的基准测试集。其多结构标注特性尤其适合研究复杂解剖区域的联合分割算法，为算法鲁棒性验证提供了理想场景。

解决学术问题

该数据集有效解决了颌面部医学影像分析中的关键难题：跨模态解剖结构的分割一致性。通过提供大规模标注数据，显著降低了牙齿、颌骨与窦道等微小结构的分割误差，推动了解剖拓扑关系建模的算法发展。其标准化评估体系为比较不同网络架构在复杂生物医学图像中的性能提供了科学依据，填补了口腔CBCT细分领域基准数据的空白。

衍生相关工作

基于该数据集的基准测试催生了多项创新研究，如SwinUMamba等混合架构在医学图像分割中的适应性改进。相关成果发表在CVPR等顶会，推动了nnU-Net框架在颌面解剖领域的定制化发展。部分工作探索了镜像对称性约束、小样本迁移学习等方向，为跨中心医疗数据协同分析提供了方法论参考。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集