five

OminiAbnorm-CT-14K

收藏
github2025-06-13 更新2025-06-19 收录
下载链接:
https://github.com/zhaoziheng/OminiAbnorm-CT
下载链接
链接失效反馈
官方服务:
资源简介:
OminiAbnorm-CT-14K是第一个为多平面全身CT成像中的异常定位和描述设计的大规模数据集。它包含14.5K CT图像,标注了19K异常发现。每个异常发现都进一步链接到报告中的详细描述,并根据全面的分层分类法进行分类。

OminiAbnorm-CT-14K is the first large-scale dataset designed for abnormal localization and description in multi-plane whole-body CT imaging. It contains 14.5K CT images, annotated with 19K abnormal findings. Each abnormal finding is further linked to detailed descriptions in the reports and classified according to a comprehensive hierarchical classification system.
创建时间:
2025-05-28
原始信息汇总

OminiAbnorm-CT 数据集概述

数据集基本信息

  • 名称: OminiAbnorm-CT-14K
  • 用途: 用于多平面全身CT图像中的异常定位和描述
  • 规模: 包含14.5K CT图像,标注了19K异常发现
  • 特点:
    • 每个异常发现均与报告中的详细描述相关联
    • 按照全面的分层分类法进行分类

主要任务支持

  1. 视觉提示报告生成: 解释由红色边界框、椭圆、轮廓或裁剪区域标记的异常
  2. 基于定位的报告生成: 定位并解释CT图像上的所有异常
  3. 文本引导的定位报告生成: 检测、定位并解释CT图像上的特定异常

数据集内容

  • 标注类型: 异常定位标注
  • 描述关联: 每个异常发现均链接到报告中的详细描述
  • 分类体系: 采用分层分类法对异常进行分类

相关资源

可选辅助数据集

  • CT病灶检测/分割数据集:
    • DeepLesion
    • ULS23
    • MSD
    • KiTS23
  • 通用医学VQA数据集: PubmedVison中的CT图像

引用信息

bibtex @misc{zhao2025rethinkingwholebodyctimage, title={Rethinking Whole-Body CT Image Interpretation: An Abnormality-Centric Approach}, author={Ziheng Zhao and Lisong Dai and Ya Zhang and Yanfeng Wang and Weidi Xie}, year={2025}, eprint={2506.03238}, archivePrefix={arXiv}, primaryClass={eess.IV}, url={https://arxiv.org/abs/2506.03238}, }

搜集汇总
数据集介绍
main_image_url
构建方式
在医学影像分析领域,OminiAbnorm-CT-14K数据集通过系统性标注多平面全身CT图像中的异常区域构建而成。研究团队采用半自动标注流程,由专业放射科医师对14.5K张CT图像中的19K处异常发现进行边界标注,并与放射学报告中的详细描述建立关联。数据集构建过程中创新性地引入了分层分类体系,确保每处异常都能准确定位到解剖位置和病理性质。标注过程严格遵循DICOM标准,同时保留了原始医学影像的完整空间信息。
特点
该数据集最显著的特点是实现了多模态医学数据的深度整合,将视觉异常区域与自然语言描述有机结合。其覆盖范围涵盖全身各解剖部位,支持冠状位、矢状位和轴位三种成像平面。数据集中每个异常发现均包含像素级定位标注、结构化分类标签以及专业放射学描述文本,这种三位一体的标注方式为医学影像理解任务提供了丰富监督信号。特别值得注意的是,数据集采用统一的JSON格式组织标注信息,便于各类深度学习框架直接调用。
使用方法
使用该数据集时,研究者可通过Hugging Face平台直接获取预处理后的标准格式数据。数据集支持三种典型任务范式:对于视觉提示报告生成任务,用户需提供带有红色边界框标记的异常区域;在全图异常定位任务中,系统会自动检测并描述所有可见异常;而在文本引导定位任务中,则需输入特定的异常描述文本。为便于快速验证,官方提供了包含三种任务示例的演示脚本,用户只需将DICOM格式的CT图像转换为JPG序列即可进行推理测试。对于训练任务,配置文件支持从零训练或微调预训练模型两种模式。
背景与挑战
背景概述
OminiAbnorm-CT-14K数据集由研究人员Ziheng Zhao等人于2025年提出,旨在革新全身CT图像解读范式,采用以异常为中心的创新研究方法。该数据集由多机构合作开发,包含14.5K张多平面全身CT图像,标注了19K个异常发现,每个发现均与详细报告描述相关联,并按照层次化分类体系进行归类。作为首个专注于异常定位与描述的大规模多平面全身CT数据集,其创新性地支持视觉提示报告生成、基于定位的报告生成和文本引导的定位报告生成三大任务,为医学影像分析领域提供了全新的研究基准,显著推动了智能影像诊断系统的发展。
当前挑战
在医学影像分析领域,全身CT异常检测面临异常形态多样性和解剖结构复杂性的双重挑战。OminiAbnorm-CT-14K需解决跨身体区域异常的统一表征、多平面影像的空间一致性建模等核心问题。数据集构建过程中,研究人员需克服多模态标注对齐的技术难题,包括精确建立影像异常与文本描述的对应关系,以及处理不同扫描协议导致的图像质量差异。此外,创建全面而准确的层次化分类体系,需要协调放射学专业知识与机器学习需求之间的鸿沟,这对标注流程设计和质量控制提出了极高要求。
常用场景
经典使用场景
在医学影像分析领域,OminiAbnorm-CT-14K数据集为研究者提供了一个全面的平台,用于探索多平面全身CT图像中的异常检测与描述。其经典使用场景包括视觉提示报告生成、基于文本引导的异常定位与描述等任务。通过标注的19K异常发现,研究者能够深入分析不同身体区域的病变特征,为后续的自动化诊断系统奠定基础。
衍生相关工作
基于OminiAbnorm-CT-14K数据集,研究者们衍生了一系列经典工作,包括基于视觉提示的异常描述模型、多任务学习的异常检测框架以及跨数据集的迁移学习研究。这些工作不仅扩展了数据集的适用范围,也为医学影像分析领域提供了新的研究方向与技术手段。
数据集最近研究
最新研究方向
在医学影像分析领域,OminiAbnorm-CT-14K数据集以其全面的多平面全身CT异常标注和详尽的描述报告,为智能辅助诊断系统的发展提供了重要支持。该数据集的最新研究方向集中在基于视觉提示的报告生成、基于文本引导的异常定位与描述等任务上,这些任务旨在通过深度学习模型实现对CT图像中异常区域的精准识别与语义解释。随着多模态大模型在医疗领域的应用逐渐深入,OminiAbnorm-CT-14K为研究者提供了一个理想的基准测试平台,推动了医学影像理解从单纯的检测向语义化、可解释性方向的演进。该数据集的推出,不仅填补了全身CT异常分析大规模数据集的空白,也为跨模态医学影像研究提供了新的可能性。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作