five

RadGenome/RadGenome-ChestCT

收藏
Hugging Face2025-05-02 更新2025-04-08 收录
下载链接:
https://hf-mirror.com/datasets/RadGenome/RadGenome-ChestCT
下载链接
链接失效反馈
官方服务:
资源简介:
RadGenome Chest CT数据集是一个基于CT-RATE的全面、大规模、区域指导的3D胸部CT解读数据集。该数据集扩展了原始数据集,包含了25,692个非对比3D胸部CT体积和来自20,000名患者的报告。数据集特点包括:197个类别的器官级别分割掩码,提供了解读的中间视觉线索;665 K个多粒度关联报告,每个报告句子与CT体积的对应解剖区域相关联;1.3 M个关联VQA对,问题和答案都与参考分割掩码相关联,使模型能够将视觉证据与文本解释相结合。验证集中的所有关联报告和VQA对都经过了人工验证以确保数据集质量。该数据集旨在推动多模态医疗基础模型的发展。

RadGenome Chest CT is a comprehensive, large-scale, region-guided 3D chest CT interpretation dataset based on CT-RATE. The dataset extends the original dataset to include 25,692 non-contrast 3D chest CT volumes and reports from 20,000 patients. Features of the dataset include: organ-level segmentation masks for 197 categories, providing intermediate visual clues for interpretation; 665 K multi-granularity grounded reports, with each sentence of the report linked to the corresponding anatomical region of the CT volume; 1.3 M grounded VQA pairs, where questions and answers are all linked with reference segmentation masks, enabling models to associate visual evidence with textual explanations. All grounded reports and VQA pairs in the validation set have undergone manual verification to ensure dataset quality. The dataset is intended to advance the development of multimodal medical foundation models.
提供机构:
RadGenome
搜集汇总
数据集介绍
main_image_url
构建方式
RadGenome-Chest CT数据集的构建,是在CT-RATE数据集的基础上,运用先进的通用分割和大型语言模型,对原始数据集进行了扩展。该数据集整合了25,692个非对比3D胸部CT体积和20,000名患者的报告,包含了197个类别的器官级别分割掩模,665K个多粒度地面报告,以及1.3M个地面视觉问答对,所有这些数据均为确保质量而经过人工验证。
特点
该数据集的特点在于其综合性和大规模性,不仅提供了丰富的视觉线索,如器官级别的分割掩模,还通过地面报告和视觉问答对,将文本描述与CT体积的对应解剖区域相链接,为多模态医学基础模型的开发提供了前所未有的支持。
使用方法
使用RadGenome-Chest CT数据集时,用户需遵守相关法律法规和研究伦理,确保数据隐私和安全。数据集可用于学术、研究和教育目的,但严禁未经许可的商业利用。在使用数据集的任何研究成果中,必须引用数据集并提供适当的归属。
背景与挑战
背景概述
RadGenome Chest CT数据集,是在人工智能辅助医学领域研究背景下应运而生的一项重要成果。该数据集由研究者团队基于CT-RATE数据集进行拓展,创建于近年来,旨在推动通用型基础模型的开发。数据集涵盖了超过25,692个非对比3D胸部CT影像及来自20,000名患者的报告,通过引入先进的通用分割和大型语言模型,实现了在多个层面的增强。该数据集为胸部CT影像的解读提供了丰富的监督信号,对于医学影像分析领域具有显著的研究价值,其影响力在学术界正逐步显现。
当前挑战
RadGenome Chest CT数据集面临的挑战主要涉及两个方面:一是如何高效地利用该数据集训练出能够生成基于给定分割区域的文本的多模态医学基础模型,二是数据集构建过程中的隐私保护和技术难题。在研究领域问题方面,该数据集解决了胸部CT影像的细粒度解读问题,为模型提供了与视觉证据相对应的文本解释。在构建过程中,确保数据隐私和遵守相关法规是该数据集面临的主要挑战,同时,数据集的质量控制和多模态信息的有效融合也是必须克服的技术难题。
常用场景
经典使用场景
在医学影像分析领域,RadGenome Chest CT数据集被广泛用于训练和评估多模态医学基础模型。该数据集通过整合3D胸部CT影像与对应的文字报告,为机器学习模型提供了将视觉信息与文字描述相结合的深入学习机会,使其能够基于给定的分割区域生成相应的文本描述,这在以往的相关数据集中是难以实现的。
实际应用
在实际应用中,RadGenome Chest CT数据集可助力医疗诊断系统的开发,通过训练模型能够自动识别CT影像中的病变区域并生成详细的诊断报告。这种技术的应用能够提高医疗诊断的效率,减轻医生的工作负担,并在紧急情况下提供快速准确的诊断信息。
衍生相关工作
基于RadGenome Chest CT数据集的研究已经衍生出一系列相关工作,包括但不限于开发新的医学影像分割算法、改进多模态信息融合技术、以及构建更为复杂的医学影像解释模型。这些研究进一步推动了医学人工智能的发展,并在临床决策支持系统中展现了巨大的应用潜力。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作