OminiAbnorm-CT-14K

github2025-06-13 更新2025-06-19 收录

下载链接：

https://github.com/zhaoziheng/OminiAbnorm-CT

下载链接

链接失效反馈

官方服务：

资源简介：

OminiAbnorm-CT-14K是第一个为多平面全身CT成像中的异常定位和描述设计的大规模数据集。它包含14.5K CT图像，标注了19K异常发现。每个异常发现都进一步链接到报告中的详细描述，并根据全面的分层分类法进行分类。

OminiAbnorm-CT-14K is the first large-scale dataset designed for abnormal localization and description in multi-plane whole-body CT imaging. It contains 14.5K CT images, annotated with 19K abnormal findings. Each abnormal finding is further linked to detailed descriptions in the reports and classified according to a comprehensive hierarchical classification system.

创建时间：

2025-05-28

原始信息汇总

OminiAbnorm-CT 数据集概述

数据集基本信息

名称: OminiAbnorm-CT-14K
用途: 用于多平面全身CT图像中的异常定位和描述
规模: 包含14.5K CT图像，标注了19K异常发现
特点:
- 每个异常发现均与报告中的详细描述相关联
- 按照全面的分层分类法进行分类

主要任务支持

视觉提示报告生成: 解释由红色边界框、椭圆、轮廓或裁剪区域标记的异常
基于定位的报告生成: 定位并解释CT图像上的所有异常
文本引导的定位报告生成: 检测、定位并解释CT图像上的特定异常

数据集内容

标注类型: 异常定位标注
描述关联: 每个异常发现均链接到报告中的详细描述
分类体系: 采用分层分类法对异常进行分类

可选辅助数据集

CT病灶检测/分割数据集:
- DeepLesion
- ULS23
- MSD
- KiTS23
通用医学VQA数据集: PubmedVison中的CT图像

引用信息

bibtex @misc{zhao2025rethinkingwholebodyctimage, title={Rethinking Whole-Body CT Image Interpretation: An Abnormality-Centric Approach}, author={Ziheng Zhao and Lisong Dai and Ya Zhang and Yanfeng Wang and Weidi Xie}, year={2025}, eprint={2506.03238}, archivePrefix={arXiv}, primaryClass={eess.IV}, url={https://arxiv.org/abs/2506.03238}, }

搜集汇总

数据集介绍

构建方式

在医学影像分析领域，OminiAbnorm-CT-14K数据集通过系统性标注多平面全身CT图像中的异常区域构建而成。研究团队采用半自动标注流程，由专业放射科医师对14.5K张CT图像中的19K处异常发现进行边界标注，并与放射学报告中的详细描述建立关联。数据集构建过程中创新性地引入了分层分类体系，确保每处异常都能准确定位到解剖位置和病理性质。标注过程严格遵循DICOM标准，同时保留了原始医学影像的完整空间信息。

特点

该数据集最显著的特点是实现了多模态医学数据的深度整合，将视觉异常区域与自然语言描述有机结合。其覆盖范围涵盖全身各解剖部位，支持冠状位、矢状位和轴位三种成像平面。数据集中每个异常发现均包含像素级定位标注、结构化分类标签以及专业放射学描述文本，这种三位一体的标注方式为医学影像理解任务提供了丰富监督信号。特别值得注意的是，数据集采用统一的JSON格式组织标注信息，便于各类深度学习框架直接调用。

使用方法

使用该数据集时，研究者可通过Hugging Face平台直接获取预处理后的标准格式数据。数据集支持三种典型任务范式：对于视觉提示报告生成任务，用户需提供带有红色边界框标记的异常区域；在全图异常定位任务中，系统会自动检测并描述所有可见异常；而在文本引导定位任务中，则需输入特定的异常描述文本。为便于快速验证，官方提供了包含三种任务示例的演示脚本，用户只需将DICOM格式的CT图像转换为JPG序列即可进行推理测试。对于训练任务，配置文件支持从零训练或微调预训练模型两种模式。

背景与挑战

背景概述

OminiAbnorm-CT-14K数据集由研究人员Ziheng Zhao等人于2025年提出，旨在革新全身CT图像解读范式，采用以异常为中心的创新研究方法。该数据集由多机构合作开发，包含14.5K张多平面全身CT图像，标注了19K个异常发现，每个发现均与详细报告描述相关联，并按照层次化分类体系进行归类。作为首个专注于异常定位与描述的大规模多平面全身CT数据集，其创新性地支持视觉提示报告生成、基于定位的报告生成和文本引导的定位报告生成三大任务，为医学影像分析领域提供了全新的研究基准，显著推动了智能影像诊断系统的发展。

当前挑战

在医学影像分析领域，全身CT异常检测面临异常形态多样性和解剖结构复杂性的双重挑战。OminiAbnorm-CT-14K需解决跨身体区域异常的统一表征、多平面影像的空间一致性建模等核心问题。数据集构建过程中，研究人员需克服多模态标注对齐的技术难题，包括精确建立影像异常与文本描述的对应关系，以及处理不同扫描协议导致的图像质量差异。此外，创建全面而准确的层次化分类体系，需要协调放射学专业知识与机器学习需求之间的鸿沟，这对标注流程设计和质量控制提出了极高要求。

常用场景

经典使用场景

在医学影像分析领域，OminiAbnorm-CT-14K数据集为研究者提供了一个全面的平台，用于探索多平面全身CT图像中的异常检测与描述。其经典使用场景包括视觉提示报告生成、基于文本引导的异常定位与描述等任务。通过标注的19K异常发现，研究者能够深入分析不同身体区域的病变特征，为后续的自动化诊断系统奠定基础。

衍生相关工作

基于OminiAbnorm-CT-14K数据集，研究者们衍生了一系列经典工作，包括基于视觉提示的异常描述模型、多任务学习的异常检测框架以及跨数据集的迁移学习研究。这些工作不仅扩展了数据集的适用范围，也为医学影像分析领域提供了新的研究方向与技术手段。

数据集最近研究