five

AlphaDent

收藏
arXiv2025-07-30 更新2025-08-08 收录
下载链接:
https://zenodo.org/records/16582489
下载链接
链接失效反馈
官方服务:
资源简介:
AlphaDent是一个全新的牙科研究数据集,基于295名患者的牙齿DSLR相机照片,包含超过1200张图像。该数据集标记用于解决实例分割问题,分为9个类别。数据集采用公开许可发布,并提供训练/推理代码和模型权重。该数据集主要用于解决实例分割问题,并通过实验证明,使用该数据集训练的神经网络在实例分割任务上取得了高质量的预测结果。

AlphaDent is a novel dental research dataset constructed from DSLR camera images of teeth collected from 295 patients, containing over 1200 images. Annotated for instance segmentation tasks, this dataset encompasses 9 distinct categories. It is released under an open license, and provides accompanying training/inference code and model weights. Primarily designed for instance segmentation applications, experiments have demonstrated that neural networks trained on AlphaDent yield high-quality prediction results on instance segmentation tasks.
提供机构:
莫斯科国立谢切诺夫第一医科大学, 俄罗斯莫斯科
创建时间:
2025-07-30
搜集汇总
数据集介绍
main_image_url
构建方式
AlphaDent数据集的构建基于295名患者的牙齿DSLR相机照片,共包含超过1200张图像。数据采集过程中使用了口腔内镜、佳能6D mark II相机和佳能100mm f/2.8L macro is usm镜头,确保了图像的高分辨率与清晰度。所有照片均通过CVAT标注平台进行人工标注,涵盖了9种牙齿病理类别,包括磨损、充填物、牙冠及6类龋齿。数据集按照患者划分,分为训练集(273名患者)和验证集(22名患者),并额外提供了未公开标注的测试集(135张图像)以模拟实际应用场景。
特点
AlphaDent数据集以其高分辨率的牙齿照片(多数超过5000×3000像素)和精细的实例分割标注著称。其独特之处在于覆盖了多样化的病理类型(如6类龋齿的细分)和临床常见修复体(如金属陶瓷冠),且标注包含多边形掩膜与边界框,支持复杂的计算机视觉任务。数据集严格遵循伦理规范,所有患者信息匿名化,并公开了患者性别、年龄分布等元数据。此外,它是目前少数完全开源的口腔内摄影数据集之一,附带了训练代码、预训练模型及标准化评估流程。
使用方法
该数据集专为实例分割任务设计,可直接用于YOLOv8等模型的训练与验证。用户需按照提供的目录结构加载图像与标注文件(文本格式描述类别索引及归一化坐标),并通过配套的YAML配置文件定义类别。测试集标签未公开,需通过Kaggle Leaderboard提交预测结果以评估模型性能(以mAP@50为核心指标)。研究者还可利用公开的预训练权重进行迁移学习,或结合数据增强策略优化对小样本病理类别(如第6类龋齿)的识别效果。数据格式兼容常见深度学习框架,便于与其他口腔影像数据集进行联合分析。
背景与挑战
背景概述
AlphaDent数据集由Sechenov大学、AlphaChip LLC和HSE大学的研究团队于2024年联合创建,旨在推动口腔医学中的人工智能应用。该数据集基于295名患者的1200余张高分辨率牙齿照片,专注于实例分割任务,涵盖9类牙科病理特征,包括龋齿、填充物和牙冠等。作为首个完全开放的牙科影像数据集,其采用标准化标注格式并公开训练代码与模型权重,显著填补了牙科AI研究中高质量开放数据的空白,为自动化牙科诊断系统的开发提供了重要基础。
当前挑战
该数据集面临双重挑战:在领域问题层面,牙科病理的复杂形态(如龋齿的亚型差异)和牙齿间的结构重叠导致实例分割精度受限,尤其对Caries 3/4/6类小样本病理的识别表现较弱;在构建过程中,单一标注专家的主观性和单相机采集的局限性可能引入偏差,且需平衡患者隐私保护与数据开放性。此外,牙科影像的强反射特性和解剖结构多样性对标注一致性提出了更高要求。
常用场景
经典使用场景
AlphaDent数据集在牙科研究领域中被广泛应用于实例分割任务,特别是在牙齿病理检测方面。该数据集包含1200多张高分辨率的牙齿照片,涵盖了9种不同的病理类别,如龋齿、填充物、牙冠等。研究人员利用这些标注数据训练深度学习模型,如YOLOv8,以实现对牙齿病理的自动检测和分类,显著提高了诊断效率和准确性。
解决学术问题
AlphaDent数据集解决了牙科研究中数据稀缺和标注标准不统一的问题。通过提供高质量的标注数据,该数据集为研究人员提供了一个可靠的基准,用于开发和验证实例分割算法。此外,数据集的开源性质促进了学术界的合作与共享,推动了人工智能在牙科诊断中的应用。
衍生相关工作
AlphaDent数据集衍生了一系列相关研究,包括改进的实例分割算法和新的牙科诊断模型。例如,一些研究利用该数据集开发了多任务学习框架,同时处理牙齿分割和病理分类。此外,该数据集还被用于评估不同深度学习架构在牙科图像分析中的性能,进一步推动了该领域的技术进步。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作