five

OMNI 数据集

收藏
arXiv2025-05-21 更新2025-05-24 收录
下载链接:
https://github.com/RoundFaceJ/OMNI
下载链接
链接失效反馈
官方服务:
资源简介:
OMNI 数据集是一个包含 4166 张多视图口腔颌面自然图像的数据集,由 384 名参与者的数据收集并由专业牙医标注。该数据集旨在推动对口腔颌面畸形问题的研究,提供了一种新的基准,以评估深度学习模型在自动化诊断中的应用。数据集包含了来自不同角度的图像,包括前牙咬合、左牙咬合、右牙咬合、上颌面和下颌面的图像,为自动化诊断研究提供了全面的数据支持。

The OMNI dataset is a collection of 4,166 natural multi-view oral and maxillofacial images, collected from 384 participants and annotated by professional dentists. This dataset aims to advance research on oral and maxillofacial deformities, and provides a novel benchmark for evaluating the application of deep learning models in automated diagnosis. The dataset contains images from various perspectives, including those of anterior dental occlusion, left dental occlusion, right dental occlusion, maxillary surface, and mandibular surface, providing comprehensive data support for automated diagnosis research.
提供机构:
河海大学人工智能与自动化学院
创建时间:
2025-05-21
原始信息汇总

OMNI数据集概述

数据集简介

  • 数据集名称:OMNI Dataset
  • 用途:用于错颌畸形问题评估的口腔影像分析
  • 特点:
    • 包含4166张RGB口腔图像
    • 图像由标准RGB相机拍摄
    • 包含多种视角:正面咬合、左侧咬合、右侧咬合、上颌颅面、下颌颅面
    • 所有图像由专业牙医标注多种错颌畸形问题

数据集统计信息

  • 参与者:
    • 总数:384名中国参与者
    • 性别分布:153名男性,231名女性
    • 年龄分布:3-48岁(平均10.4岁,标准差5.63)
  • 图像分布:
    • 正面咬合照片:903张
    • 左侧咬合照片:841张
    • 右侧咬合照片:843张
    • 上颌颅面照片:820张
    • 下颌颅面照片:759张

数据集结构

  • 目录结构:
    • annotations:COCO格式标注文件
      • instances_test.json
      • instances_train.json
      • instances_val.json
    • test:测试集图像(828张)
    • train:训练集图像(2481张)
    • val:验证集图像(857张)
  • 存储路径:data/OMNI_COCO

基准模型

  • 包含6种深度学习模型:
    • 3种基于CNN的模型
    • 2种基于Transformer的模型
    • 1种基于GNN的模型

引用信息

bibtex @article{xue2025oral, title={Oral Imaging for Malocclusion Issues Assessments: OMNI Dataset, Deep Learning Baselines and Benchmarking}, author={Xue, Pujun and Ge, Junyi and Jiang, Xiaotong and Song, Siyang and Wu, Zijian and Huo, Yupeng and Xie, Weicheng and Shen, Linlin and Zhou, Xiaoqin and Liu, Xiaofeng and others}, journal={arXiv preprint arXiv:2505.15637}, year={2025} }

搜集汇总
数据集介绍
main_image_url
构建方式
OMNI数据集是首个专注于错颌畸形诊断的多视角口腔颌面部医学图像数据集,其构建过程严格遵循临床规范。研究团队在苏州大学附属第三医院口腔科专业医师监督下,采用标准化数据采集流程:使用佳能EOS 550D相机在自然光条件下采集4166张RGB图像(分辨率512×341),涵盖前牙合、左右侧合、上颌颌面及下颌颌面五个视角。所有图像均经过专业牙医进行三级标注流程:首先通过Makesense.ai工具进行牙齿定位标注,随后基于《口腔正畸学》第七版标准标注10类错颌畸形特征,最终由资深牙医团队采用ABO分类标准进行标注校验,确保标注质量。数据集包含384名3-48岁受试者(男女比例153:231)的连续就诊影像,严格遵循《赫尔辛基宣言》伦理准则并签署知情同意书。
特点
OMNI数据集的突出特点体现在三个维度:多视角覆盖性方面,其包含前牙合(903张)、左右侧合(各840+张)、上下颌颌面(1600+张)的全方位影像,完整呈现牙齿三维空间关系;临床多样性方面,标注涵盖健康牙齿(HT)及扭转牙(TT)、深覆盖(DO)等9类错颌畸形,平均每图含1.03个病理特征,其中单病症图像2945例、多病症复合图像656例;技术兼容性方面,数据采用COCO标准格式存储,并经过双盲质量筛选,剔除模糊或结构不完整图像,确保与主流深度学习框架无缝对接。这种多维度、高精度的特性使其成为目前最具临床实用价值的错颌畸形研究数据集。
使用方法
该数据集支持端到端的错颌畸形智能诊断研究,具体应用包含三个层级:基础任务层,可直接用于牙齿定位(检测框与分割掩码预测)及病理分类(10类多标签分类),研究者可采用提供的Faster R-CNN等6个基准模型进行迁移学习;算法验证层,其多视角特性支持开发跨视角特征融合算法,mAP@0.5等指标可量化评估模型对复杂错颌关系的捕捉能力;临床研究层,通过分析不同年龄/性别亚组的模型表现(数据集含10.4±5.63岁年龄分布),可探究发育因素对诊断的影响。使用建议将2481张训练集用于模型开发,857张验证集用于超参数优化,828张测试集作为最终性能评估标准。
背景与挑战
背景概述
OMNI数据集是由苏州大学第三附属医院和河海大学等机构的研究团队于2025年提出的首个专注于错颌畸形诊断的多视角口腔医学图像数据集。该数据集包含4166张RGB图像,涵盖384名患者的五种不同视角(正面、左侧、右侧、上颌和下颌咬合面),并由专业牙医标注了10类错颌畸形问题。作为口腔正畸学领域的重要资源,OMNI数据集解决了该领域缺乏大规模标注数据的瓶颈问题,为基于深度学习的自动化错颌诊断研究提供了关键数据支持。其创新性体现在多视角采集方案、临床级标注标准以及覆盖多种常见错颌类型的全面性,显著推动了牙科影像智能分析领域的发展。
当前挑战
在解决错颌畸形自动诊断这一核心问题上,OMNI数据集面临三大挑战:首先,错颌畸形的临床表现具有高度复杂性,如牙齿扭转、深覆盖等多类型病变的共存性,要求模型具备细粒度分类能力;其次,构建过程中需克服多视角图像配准困难、牙齿边缘模糊等技术难题,且专业标注需要牙医团队耗时数月的协同工作;最后,数据分布不均衡(如健康牙齿样本占比过高)可能影响模型对罕见错颌类型的识别性能。这些挑战既反映了错颌诊断任务的特殊性,也凸显了高质量医学数据集构建的技术壁垒。
常用场景
经典使用场景
OMNI 数据集作为首个专注于错颌畸形诊断的多视角口腔影像数据集,其经典使用场景主要围绕深度学习模型的训练与评估展开。在口腔正畸学领域,该数据集通过提供4166张包含五种视角(正面、左右侧、上下颌)的RGB图像,为研究者构建自动化诊断系统提供了标准化数据基础。专业牙医标注的10类错颌问题标签,使得该数据集特别适用于开发能够识别牙齿扭转、深覆盖、隐形矫治附件等复杂病例的算法模型。
解决学术问题
OMNI 数据集有效解决了口腔医学影像分析领域长期存在的三大核心问题:缺乏大规模专业标注数据导致的模型泛化能力不足、单视角影像限制全局特征提取的瓶颈,以及传统人工诊断中主观性较强的问题。通过提供多视角、多标签的高质量数据,该数据集支持研究者探索卷积神经网络、Transformer和图神经网络等架构在牙齿定位与错颌分类任务中的性能边界,尤其为处理临床中常见的复合型错颌病例(如同时存在牙齿错位与下颌后缩)提供了数据支撑。
衍生相关工作
该数据集已催生多个具有影响力的衍生研究:基于Deformable DETR的错颌分级系统通过可变形注意力机制提升了小牙齿目标的检测精度;GraphTeethNet利用多维边缘特征建模牙齿间生物力学关系,开创了图神经网络在正畸力系分析中的新应用;另有研究将OMNI与CBCT三维数据融合,开发出跨模态的颌骨发育预测模型。这些工作共同推动了从二维影像到三维治疗规划的学术演进。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作