five

DENTEX|牙科诊断数据集|医学影像分析数据集

收藏
arXiv2023-05-30 更新2024-06-21 收录
牙科诊断
医学影像分析
下载链接:
https://github.com/ibrahimethemhamamci/DENTEX
下载链接
链接失效反馈
资源简介:
DENTEX数据集是由苏黎世大学定量生物医学系创建,专注于牙科全景X射线中的异常牙齿检测。该数据集包含1005条全景牙科X射线,这些X射线来自三个不同的机构,涵盖了多种牙科诊断,如龋齿、深龋、尖周病变和阻生牙。数据集的创建过程经过精心设计,由牙科专家进行标注,确保了数据的高质量和准确性。DENTEX数据集的应用领域主要集中在牙科诊断和治疗规划,旨在通过人工智能技术提高诊断的精确性和效率。
提供机构:
苏黎世大学定量生物医学系
创建时间:
2023-05-30
AI搜集汇总
数据集介绍
main_image_url
构建方式
DENTEX数据集的构建基于全景X光片的层次化标注,涵盖了三种不同层次的标注数据:部分标注的四分之一区域数据、部分标注的四分之一区域和牙齿编号数据,以及完全标注的四分之一区域、牙齿编号和诊断数据。这些数据由牙科专家团队精心标注,确保了数据的高质量和准确性。此外,数据集还包括1571张未标注的全景X光片,用于潜在的预训练。所有数据均遵循国际牙科联合会(FDI)系统进行标注,确保了全球范围内的标准化应用。
特点
DENTEX数据集的显著特点在于其层次化的标注结构,这使得数据集能够支持从简单的四分之一区域检测到复杂的异常牙齿检测和诊断的多任务学习。数据集的多样性体现在来自不同机构的X光片,反映了临床实践中的异质性。此外,数据集的高质量标注和丰富的未标注数据为研究者提供了广泛的应用潜力,特别是在开发和评估自动化牙科诊断算法方面。
使用方法
DENTEX数据集的使用方法灵活多样,适用于多种机器学习任务。研究者可以利用部分标注的数据进行训练和开发,而完全标注的数据则用于最终的评估。数据集的层次化结构允许研究者逐步提升模型的复杂度,从简单的区域检测到复杂的牙齿编号和诊断。此外,未标注的数据可用于预训练模型,以提高模型的泛化能力。研究者在使用外部数据时需确保其公开可用,并在最终提交的论文中详细说明数据来源和使用情况。
背景与挑战
背景概述
DENTEX数据集由苏黎世大学量化生物医学系、伊斯坦布尔梅迪波尔大学国际医学院等多个机构的研究人员共同创建,旨在解决全景X光片在牙科诊断中的应用难题。该数据集于2023年与国际医学图像计算与计算机辅助干预会议(MICCAI)联合发布,主要目标是推动人工智能在牙科全景X光片分析中的应用,特别是异常牙齿的检测、牙齿编号和诊断。数据集包含了三种层次化的标注数据,分别用于象限检测、牙齿检测和异常牙齿检测,涵盖了四种不同的诊断类别。通过提供高质量的标注数据,DENTEX为开发更精确和高效的牙科诊断工具奠定了基础,对牙科领域的研究和临床实践具有重要意义。
当前挑战
DENTEX数据集的构建面临多重挑战。首先,全景X光片的解剖结构变异性较大,导致自动化算法的设计复杂。其次,公开可用的标注数据稀缺,限制了算法的训练和验证。此外,数据集的标注过程涉及多个层次,包括象限、牙齿编号和诊断,这增加了标注的复杂性和难度。尽管如此,DENTEX数据集通过提供层次化的标注数据和未标注数据,为研究者提供了丰富的资源,但如何有效利用这些数据进行模型训练和评估仍是一个挑战。最后,数据集的评估指标如平均精度(AP)和平均召回率(AR)在处理类别不平衡和阈值选择时存在局限性,可能影响模型性能的准确评估。
常用场景
经典使用场景
DENTEX数据集的经典使用场景主要集中在牙科全景X光片的异常牙齿检测、牙齿编号和诊断任务上。该数据集通过提供层次化的标注数据,支持多标签检测算法的发展,涵盖了从简单的象限检测到复杂的牙齿编号和诊断分析。这些任务不仅有助于提高牙科诊断的准确性,还能为治疗计划提供更精确的支持。
实际应用
DENTEX数据集在实际应用中具有广泛的潜力,特别是在牙科诊疗和治疗计划中。通过自动化检测异常牙齿、进行牙齿编号和诊断,该数据集可以帮助牙医更快速、准确地识别和处理牙科问题,从而提高治疗效果和患者满意度。此外,该数据集还可以用于开发智能牙科诊疗工具,辅助牙医进行更高效的诊断和治疗规划,减少人为错误和时间成本。
衍生相关工作
DENTEX数据集的发布催生了一系列相关的经典工作,特别是在牙科全景X光片的自动化分析领域。基于该数据集,研究者们开发了多种多标签检测算法,如HierarchicalDet等,这些算法利用层次化的标注数据,显著提升了异常牙齿检测的准确性。此外,该数据集还激发了在牙科放射学中应用扩散模型等先进技术的研究,进一步推动了AI在牙科领域的应用和发展。
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

中国区域交通网络数据集

该数据集包含中国各区域的交通网络信息,包括道路、铁路、航空和水路等多种交通方式的网络结构和连接关系。数据集详细记录了各交通节点的位置、交通线路的类型、长度、容量以及相关的交通流量信息。

data.stats.gov.cn 收录

GME Data

关于2021年GameStop股票活动的数据,包括每日合并的GME短期成交量数据、每日失败交付数据、可借股数、期权链数据以及不同时间框架的开盘/最高/最低/收盘/成交量条形图。

github 收录

中国1km分辨率逐月降水量数据集(1901-2023)

该数据集为中国逐月降水量数据,空间分辨率为0.0083333°(约1km),时间为1901.1-2023.12。数据格式为NETCDF,即.nc格式。该数据集是根据CRU发布的全球0.5°气候数据集以及WorldClim发布的全球高分辨率气候数据集,通过Delta空间降尺度方案在中国降尺度生成的。并且,使用496个独立气象观测点数据进行验证,验证结果可信。本数据集包含的地理空间范围是全国主要陆地(包含港澳台地区),不含南海岛礁等区域。为了便于存储,数据均为int16型存于nc文件中,降水单位为0.1mm。 nc数据可使用ArcMAP软件打开制图; 并可用Matlab软件进行提取处理,Matlab发布了读入与存储nc文件的函数,读取函数为ncread,切换到nc文件存储文件夹,语句表达为:ncread (‘XXX.nc’,‘var’, [i j t],[leni lenj lent]),其中XXX.nc为文件名,为字符串需要’’;var是从XXX.nc中读取的变量名,为字符串需要’’;i、j、t分别为读取数据的起始行、列、时间,leni、lenj、lent i分别为在行、列、时间维度上读取的长度。这样,研究区内任何地区、任何时间段均可用此函数读取。Matlab的help里面有很多关于nc数据的命令,可查看。数据坐标系统建议使用WGS84。

国家青藏高原科学数据中心 收录

中国逐日降水数据集(1961-2022,0.1°/0.25°/0.5°)

CHM_PRE数据集基于中国境内及周边1961至今共2839个站点的日降水观测,在传统的“降水背景场 + 降水比值场”的数据集构建思路上,尝试应用月值降水约束和地形特征校正,并依据中国范围内约4万个高密度站点2015–2019年的日降水量插值后数据进行精度评价。经评估认为,CHM_PRE可以较好的表征降水的空间变异性,其日值时间序列与高密度站点日值降水观测结果之间的相关系数中位数为0.78,均方根误差中位数为8.8 mm/d,KGE值中位数为0.69,与目前常用的降水数据集(CGDPA、CN05.1、CMA V2.0)有很好的一致性。 数据集的时间范围为1961年至今,空间分辨率为0.1°、0.25°和0.5°,经纬度范围为18°N–54°N, 72°E–136°E。

国家青藏高原科学数据中心 收录

TT100K - Tsinghua-Tencent 100K

TT100K数据集是一个用于交通标志检测和识别的大规模数据集,包含100,000张标注的交通标志图像。该数据集主要用于计算机视觉和自动驾驶领域的研究。

cg.cs.tsinghua.edu.cn 收录