five

CTooth|牙科医疗数据集|计算机辅助技术数据集

收藏
arXiv2022-06-17 更新2024-08-06 收录
牙科医疗
计算机辅助技术
下载链接:
http://arxiv.org/abs/2206.08778v1
下载链接
链接失效反馈
资源简介:
CTooth是首个开放源代码的3D牙科CT数据集,包含完整的牙齿标注。该数据集由杭州电子科技大学等机构创建,旨在为计算机辅助牙科诊断和治疗提供支持。数据集包含5504个标注的CBCT图像,来自22名患者,涵盖了牙齿位置、数量、修复、植入物和颌骨大小等结构变异。CTooth数据集的创建过程涉及使用ITKSNAP软件手动标注牙齿区域,并经过精细调整,整个过程耗时约10个月。该数据集主要应用于3D牙齿分割研究,解决手动标注主观性和耗时性的问题。
提供机构:
杭州电子科技大学
创建时间:
2022-06-17
AI搜集汇总
数据集介绍
main_image_url
构建方式
CTooth数据集的构建基于锥形束计算机断层扫描(CBCT)技术,旨在为3D牙齿分割研究提供高质量的数据支持。数据集包含22个CBCT扫描体积,共计7363张切片,所有牙齿区域均由经验丰富的放射科医生进行精细标注。为确保数据的多样性和代表性,CTooth涵盖了牙齿缺失和修复等多种情况。数据采集过程中,所有CBCT图像均来自同一型号的设备,并经过标准化处理,以确保数据的一致性和可比性。
特点
CTooth数据集的特点在于其高分辨率的3D牙齿标注,涵盖了牙齿的多种形态和结构变化。数据集中的每个CBCT扫描均经过严格的质量控制,确保标注的准确性和一致性。此外,CTooth还提供了丰富的元数据,包括牙齿数量、修复情况等信息,为研究者提供了多维度的分析视角。数据集的多样性和高质量标注使其成为3D牙齿分割领域的基准数据集。
使用方法
CTooth数据集的使用方法主要包括数据预处理、模型训练和性能评估。研究者可以通过加载CBCT图像和对应的标注数据,进行3D牙齿分割模型的训练。数据预处理步骤通常包括图像归一化、对比度增强等操作,以提高模型的训练效果。在模型训练过程中,可以使用多种深度学习框架,如PyTorch或TensorFlow,结合3D U-Net等网络结构进行分割任务。性能评估则通过Dice系数、IoU等指标来衡量模型的准确性。
背景与挑战
背景概述
CTooth数据集是由杭州电子科技大学、伦敦玛丽女王大学、浙江传媒大学、莱斯特大学和中国电子科技大学的研究团队于2022年共同创建的一个三维锥形束计算机断层扫描(CBCT)牙齿分割数据集。该数据集旨在解决牙齿体积分割问题,为计算机辅助牙科诊断和治疗提供基础。CTooth包含22个CBCT扫描体积(共7363张切片),并由经验丰富的放射科医生进行精细标注。数据集中涵盖了牙齿缺失和修复等多样化的牙齿结构,确保了数据的广泛代表性。该数据集的发布填补了三维牙齿分割领域公开数据集的空白,并为深度学习模型提供了高质量的标注数据,推动了牙齿分割技术的发展。
当前挑战
CTooth数据集面临的挑战主要包括两个方面。首先,牙齿分割任务本身具有较高的复杂性,尤其是在CBCT图像中,牙齿与周围组织的对比度较低,且牙齿的形态和位置存在较大差异,导致分割精度难以提升。其次,数据集的构建过程中也面临诸多挑战,如CBCT图像的高分辨率和大数据量使得标注工作极为耗时,且需要专业的牙科知识。此外,数据集中包含的牙齿缺失和修复等复杂情况进一步增加了标注的难度。尽管深度学习模型在牙齿分割任务中表现出色,但如何有效利用有限的标注数据,提升模型在小样本和复杂情况下的泛化能力,仍然是当前研究的主要挑战之一。
常用场景
经典使用场景
CTooth数据集在牙科医学影像分析领域具有重要应用,特别是在3D牙齿体积分割任务中。该数据集通过提供高质量的锥形束计算机断层扫描(CBCT)图像,为研究人员提供了一个标准化的基准,用于开发和评估深度学习模型。这些模型能够自动分割牙齿区域,从而减少人工标注的时间和主观性。CTooth数据集的使用场景主要集中在牙齿分割算法的性能评估和优化上,尤其是在处理复杂的牙齿结构时,如缺失牙齿和牙科修复体。
衍生相关工作
CTooth数据集的发布推动了多个相关研究工作的进展。基于该数据集,研究人员提出了多种改进的3D分割模型,如结合注意力机制的3D UNet变体,这些模型在牙齿分割任务中表现出色。此外,CTooth数据集还激发了其他领域的研究兴趣,如多器官分割和医学影像中的注意力机制应用。一些经典工作,如SKNet和CBAM,也在CTooth数据集上进行了验证和优化,进一步推动了深度学习在医学影像分析中的应用。
数据集最近研究
最新研究方向
在口腔医学领域,3D牙齿分割技术是计算机辅助诊断和治疗的关键步骤。CTooth数据集的发布为这一领域的研究提供了重要的资源。该数据集包含22个CBCT扫描体积,共计7363张切片,每张切片均由经验丰富的放射科医生进行精细标注。CTooth数据集不仅填补了3D牙齿分割领域公开数据集的空白,还为深度学习模型的训练提供了高质量的标注数据。近年来,基于注意力机制的3D UNet变体在CTooth数据集上表现出色,特别是在牙齿区域的响应增强和背景噪声抑制方面取得了显著进展。SKNet注意力模块的引入使得模型在Dice系数和IoU指标上分别达到了88.04%和78.71%的优异表现。这一成果不仅为牙齿体积分割任务设立了新的基准,也为未来多器官分割研究提供了重要的参考。
相关研究论文
  • 1
    CTooth: A Fully Annotated 3D Dataset and Benchmark for Tooth Volume Segmentation on Cone Beam Computed Tomography Images杭州电子科技大学 · 2022年
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

中国区域交通网络数据集

该数据集包含中国各区域的交通网络信息,包括道路、铁路、航空和水路等多种交通方式的网络结构和连接关系。数据集详细记录了各交通节点的位置、交通线路的类型、长度、容量以及相关的交通流量信息。

data.stats.gov.cn 收录

Natural Scene Braille Character Recognition Dataset

There are a total of 1157 Braille segment images in this dataset, including 925 in the training set and 232 in the testing set. There are two folders in the directory of this dataset: character_label and segment_label. The character_rabel file contains three formats of Braille segment images: (1) Braille segment images and label files stored in ICDAR-2015 format, each. jpg file corresponds to a. txt file, where each line stores the position and recognition label of a braille character rectangle box. The data corresponds to the coordinates of the four points in the rectangle box and the recognized numerical label; (2) The original format of the data is stored in the folder org. Each .jpg file in this folder corresponds to a .json file which marked by labelme software; (3) VOC format, stored in voc-data folder. This folder stores images and corresponding .xml files in VOC format, and marks the position of each braille character rectangle box and its corresponding numerical label information in the .xml file. In addition, the original Braille images of natural scenes and the corresponding Braille segment markings .json files are stored in the folder segment_label.

DataCite Commons 收录

LinkedIn Salary Insights Dataset

LinkedIn Salary Insights Dataset 提供了全球范围内的薪资数据,包括不同职位、行业、地理位置和经验水平的薪资信息。该数据集旨在帮助用户了解薪资趋势和市场行情,支持职业规划和薪资谈判。

www.linkedin.com 收录

中国行政区划数据

本项目为中国行政区划数据,包括省级、地级、县级、乡级和村级五级行政区划数据。数据来源于国家统计局,存储格式为sqlite3 db文件,支持直接使用数据库连接工具打开。

github 收录

AISHELL/AISHELL-1

Aishell是一个开源的中文普通话语音语料库,由北京壳壳科技有限公司发布。数据集包含了来自中国不同口音地区的400人的录音,录音在安静的室内环境中使用高保真麦克风进行,并下采样至16kHz。通过专业的语音标注和严格的质量检查,手动转录的准确率超过95%。该数据集免费供学术使用,旨在为语音识别领域的新研究人员提供适量的数据。

hugging_face 收录