five

DentalProbe

收藏
arXiv2026-03-06 更新2026-03-10 收录
下载链接:
https://github.com/isbrycee/OralGPT
下载链接
链接失效反馈
官方服务:
资源简介:
DentalProbe是由香港科技大学等机构联合构建的牙科影像数据集,包含5000张高分辨率全景X光图像,覆盖50余种牙科疾病。数据集整合了来自美国、中国等地的多源公开数据,通过专家标注的诊疗轨迹(含8000轮诊断记录)提供结构化监督。其构建过程采用病灶聚类生成区域提案,并融合镜像比对工具实现对称性分析,最终经多智能体质量优化和临床医生评估验证。该数据集支持口腔疾病的多步骤推理和双侧对比诊断,为智能牙科影像分析提供关键训练基准。

DentalProbe is a dental imaging dataset jointly constructed by The Hong Kong University of Science and Technology and other institutions. It comprises 5,000 high-resolution panoramic X-ray images covering over 50 dental diseases. The dataset integrates multi-source public data from regions including the United States and China, and provides structured supervision via expert-annotated clinical trajectories containing 8,000 rounds of diagnostic records. Its construction pipeline adopts lesion clustering to generate region proposals, and integrates mirror alignment tools to perform symmetry analysis, and is finally validated through multi-agent quality optimization and clinical physician assessment. This dataset supports multi-step reasoning and bilateral comparative diagnosis of oral diseases, serving as a critical training benchmark for intelligent dental image analysis.
提供机构:
香港科技大学·广州; 香港大学·牙科学院; 北京大学·计算机学院; 上海交通大学; 中国科学院·自动化研究所; 深圳大学·计算机与软件工程学院
创建时间:
2026-03-06
原始信息汇总

OralGPT 数据集概述

数据集基本信息

  • 数据集名称: OralGPT 系列
  • 核心内容: 一系列专注于数字牙科的多模态大语言模型及相关基准数据集。
  • 主要关联数据集:
    • MMOral-OPG-Bench: 用于全景X射线分析的基准数据集,已发布。
    • MMOral-Uni-Bench: 统一的基准数据集,即将发布。

数据集详情

1. 数据模态与范围

数据集支持多样化的牙科成像模态,包括:

  • 口内图像和视频
  • 照片
  • 全景X射线
  • 根尖周X射线片
  • 头颅侧位X射线片
  • 组织病理学图像
  • 文本问答与会话

2. 核心基准数据集:MMOral-OPG-Bench

  • 发布状态: 已发布。
  • 获取地址: https://huggingface.co/datasets/OralGPT/MMOral-OPG-Bench
  • 数据类型: 用于评估多模态大语言模型在全景X射线分析上性能的基准数据。
  • 数据质量: 所有基准数据均经过专业临床牙医审查和验证,确保准确性和临床可靠性。
  • 评估格式: 包含开放式和封闭式两种评估格式,并提供相应的TSV文件。

3. 评估工具与方法

  • 评估套件: 提供VLMEvalkit(支持多种预配置的视觉语言模型)和通用评估脚本。
  • 通用评估脚本: 包括 eval_MMOral_VQA_Closed.pyeval_MMOral_VQA_Open.py,允许用户为任何视觉语言模型添加推理方法进行评估。
  • 评估流程: 用户可通过指定基准文件路径、输出目录、API密钥等参数运行脚本,对模型进行基准测试。

4. 已发布的相关模型与材料

  1. 牙科视觉专家模型: 发布在 https://huggingface.co/Bryceee/Teeth_Visual_Experts_Models,涵盖全景/根尖周X射线图像中的检测、分割和分类任务。
  2. 牙科图像描述多模态大语言模型: 支持7种模态,发布在 https://huggingface.co/OralGPT/OralGPT-Captioning-4B-Base。
  3. OralGPT-Omni-7B-Instruct 模型: 发布在 https://huggingface.co/OralGPT/OralGPT-Omni-7B-Instruct。

5. 未来更新计划

  • MMOral-Bench v2: 将包含更多牙科成像模态、专业牙科考试问题以及对数字牙科中多个多模态大语言模型性能的综合评估。
  • MMOral-Uni Benchmark: 即将发布。
  • 扩展的指令数据集: 将包含更多样化的牙科成像模态。
  • OralGPT-Plus 模型: 即将发布。

相关论文与引用

  • OralGPT 论文: https://arxiv.org/abs/2509.09254
  • OralGPT-Omni 论文: https://arxiv.org/abs/2511.22055
  • MMOral 基准论文: 发表于NeurIPS 2025。
  • OralGPT-Omni 与 OralGPT-Plus 论文: 被CVPR 2026接收。
  • 引用信息: 提供了三篇相关工作的BibTeX引用格式。
搜集汇总
数据集介绍
main_image_url
构建方式
在口腔放射学领域,全景X光影像的分析需要精细的空间推理与对称性理解,DentalProbe数据集的构建正是为了支撑这一临床需求。该数据集整合了来自多个公开数据库的五千余张全景X光影像,覆盖了美国、中国、瑞士和罗马尼亚等多个地区的样本,确保了数据的代表性与多样性。通过专家标注与多智能体轨迹精炼流程,数据集生成了超过八千轮诊断轨迹,模拟了从全局检查、病灶定位、局部放大到对称性验证的完整临床推理过程。这一构建方式不仅融合了区域级病变标注,还引入了基于聚类的病灶提议生成机制,为模型提供了结构化、多步骤的监督信号。
使用方法
DentalProbe数据集主要用于训练与优化能够进行多步诊断推理的智能体视觉语言模型。在应用过程中,数据集首先通过专家轨迹进行指令微调,使模型学会在全局观察后调用“放大查看”与“镜像查看”工具,对可疑区域进行聚焦检查与对称对比。随后,基于数据集的强化学习框架进一步优化模型行为,通过结合规则评分奖励与条件诊断驱动奖励,鼓励模型在诊断可信度足够时进行重新检查,同时抑制无意义的探索操作。这种使用方法使得模型能够稳定地进行长视野推理,逐步形成连贯且符合临床预期的诊断结论,最终提升在全景X光分析任务中的可靠性与解释性。
背景与挑战
背景概述
DentalProbe数据集由香港大学牙科学院、北京大学、香港科技大学(广州)等机构的研究团队于2026年构建,旨在支持全景牙科X光片的智能诊断研究。该数据集聚焦于解决传统视觉语言模型在牙科影像分析中存在的静态单次推理局限,通过提供专家标注的诊断轨迹,模拟牙医临床工作流中的局部检查与对称比较过程。其核心研究问题在于如何实现迭代式、对称感知的诊断推理,以提升模型对细微病变的检测能力与临床解释的可靠性,为口腔放射学领域的智能诊断系统发展奠定了数据基础。
当前挑战
DentalProbe数据集旨在应对全景牙科X光片分析中的领域挑战,包括对高分辨率影像中细微病变的精细空间推理、双侧对称性理解以及多步骤诊断验证。传统对象检测器仅能提供类别与边界框,而单次推理的视觉语言模型缺乏对模糊区域的重新审视与结构化分析能力。在构建过程中,研究团队面临整合多源异构数据、生成高质量专家诊断轨迹以及设计符合临床实际的工具交互范式的挑战。具体而言,需要从多个公共数据集中提取并统一超过50种牙科疾病的标注,并通过多智能体流程模拟牙医的渐进式推理,确保轨迹的临床对齐性与语言多样性。
常用场景
经典使用场景
在口腔放射学领域,全景X光片分析要求模型具备精细的空间推理与双侧对称性理解能力。DentalProbe数据集通过专家标注的诊断轨迹,为智能体视觉语言模型提供了结构化监督,使其能够模拟牙医的临床诊断流程。该数据集最经典的使用场景是训练模型进行迭代式、对称感知的诊断推理,例如通过“放大”工具对可疑区域进行局部检查,并利用“镜像”工具进行对侧对比,从而逐步形成连贯的临床结论。
解决学术问题
DentalProbe数据集有效解决了全景牙科影像分析中的多个核心学术问题。传统目标检测器仅能提供类别与边界框,缺乏诊断解释性;而单次前向的视觉语言模型则无法重新审视模糊区域或捕捉细微病变模式。该数据集通过专家轨迹的监督,引导模型学习临床一致的多步推理模式,支持模型在复杂场景下进行局部重检与对称验证,显著提升了诊断的可靠性与可解释性,为智能体模型在医学影像领域的应用奠定了数据基础。
实际应用
在实际临床环境中,DentalProbe数据集支撑的模型能够辅助牙科医生进行全景X光片的自动化分析。通过模拟牙医的检查习惯,模型可以快速定位龋齿、根尖周病变、骨吸收等异常,并提供结构化的诊断报告。这种工具不仅减轻了医生的工作负担,还降低了因经验差异导致的误诊风险,尤其在筛查和初步诊断环节展现出较高的应用价值,为智能牙科诊断系统的开发提供了关键技术支撑。
数据集最近研究
最新研究方向
在口腔放射学领域,全景X光片分析正经历从静态感知向交互式诊断推理的范式转变。DentalProbe数据集的构建,通过集成专家引导的诊断轨迹,为智能体视觉语言模型提供了结构化监督,支持局部检查和对称性比较。当前研究前沿聚焦于开发具备迭代推理能力的智能体模型,如OralGPT-Plus,其通过强化学习框架实现临床意义的再检查,并引入“镜像”工具以利用口腔解剖的对称性进行对比分析。这一方向不仅提升了模型在复杂病变识别中的可靠性,也为未来临床对齐的全景影像分析奠定了坚实基础,推动了牙科人工智能向更精细、更符合临床工作流程的方向发展。
相关研究论文
  • 1
    OralGPT-Plus: Learning to Use Visual Tools via Reinforcement Learning for Panoramic X-ray Analysis香港科技大学·广州; 香港大学·牙科学院; 北京大学·计算机学院; 上海交通大学; 中国科学院·自动化研究所; 深圳大学·计算机与软件工程学院 · 2026年
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作