five

BRISC

收藏
arXiv2025-06-17 更新2025-06-22 收录
下载链接:
https://www.kaggle.com/datasets/briscdataset/brisc2025/
下载链接
链接失效反馈
官方服务:
资源简介:
BRISC数据集是一个专门为脑肿瘤分割和分类任务设计的MRI数据集。该数据集包含6000个由认证放射科医生和医师注释的对比增强T1加权MRI扫描,涵盖了三种主要肿瘤类型——胶质瘤、脑膜瘤和垂体瘤,以及非肿瘤病例。每个样本都包括高分辨率标签,并按轴向、矢状和冠状成像平面进行分类,以促进鲁棒的模型开发和跨视图泛化。为了展示数据集的实用性,我们提出了一个基于transformer的分割模型,并将其与已建立的基线进行了比较。我们的方法实现了最高的加权平均交并比(IoU)为82.3%,在所有肿瘤类别中都观察到了改进。

The BRISC dataset is an MRI dataset specifically designed for brain tumor segmentation and classification tasks. It contains 6,000 contrast-enhanced T1-weighted MRI scans annotated by board-certified radiologists and physicians, covering three primary tumor types—glioma, meningioma, and pituitary tumor—as well as non-tumor cases. Each sample includes high-resolution labels and is categorized based on axial, sagittal, and coronal imaging planes to facilitate robust model development and cross-view generalization. To demonstrate the practical utility of this dataset, we propose a Transformer-based segmentation model and compare it against established baselines. Our method achieved the highest weighted mean Intersection over Union (IoU) of 82.3%, with improvements observed across all tumor categories.
提供机构:
伊朗科技大学计算机工程学院, 英国曼彻斯特北方护理联盟NHS基金会信托
创建时间:
2025-06-17
原始信息汇总

BRISC 2025: Brain Tumor MRI Dataset for Segmentation and Classification

数据集概述

  • 名称: BRISC 2025
  • 用途: 脑肿瘤MRI图像的分割与分类
  • 特点: 高质量、专家标注、解决现有数据集常见问题(如类别不平衡、注释不一致等)

数据集内容

  • 图像数量: 6,000张T1加权MRI图像
  • 类别:
    • Glioma
    • Meningioma
    • Pituitary Tumor
    • No Tumor
  • 标注: 像素级分割掩码(经医生和放射科医师验证)
  • 解剖平面: 轴向、冠状、矢状面
  • 数据划分:
    • 训练集: 5,000张
    • 测试集: 1,000张

数据集结构

分类任务 (classification_task/)

  • 按肿瘤类别组织的子文件夹
  • 图像格式: .jpg

分割任务 (segmentation_task/)

  • 包含配对的MRI图像和二进制掩码
  • 图像和掩码文件名对齐

技术细节

  • 总样本数: 6,000
  • 标注质量: 医学专家审核
  • 成像模态: T1加权MRI
  • 平面分布: 轴向、冠状、矢状面平衡
  • 肿瘤类别分布: 四类别平衡

文件名示例

  • 格式: brisc2025_test_00010_gl_ax_t1.jpg
  • 组成部分:
    • 前缀: brisc2025
    • 数据划分: test
    • 索引: 00010
    • 肿瘤类型: gl (glioma)
    • 视图: ax (axial)
    • 序列: t1 (T1-weighted)

数据集优势

  • 平衡且多样的多类别标签
  • 专家精修的分割掩码
  • 包含真实世界中的挑战性案例
  • 支持多任务学习(分割+分类)
  • 适合训练具有真实MRI变异性的鲁棒模型

应用场景

  • 基于深度学习的脑肿瘤分割
  • 多类别分类和二元肿瘤检测
  • 2D医学影像中的跨平面泛化
  • 神经肿瘤学中的AI辅助诊断工具开发

引用信息

  • 论文标题: "BRISC: Annotated Dataset for Brain Tumor Segmentation and Classification with Swin-HAFNet"
  • 作者: Fateh et al., 2025
  • BibTeX: bibtex @article{fateh2025brisc, title={BRISC: Annotated Dataset for Brain Tumor Segmentation and Classification with Swin-HAFNet}, author={Fateh, Amirreza and Rezvani, Yasin and Moayedi, Sara and Rezvani, Sadjad and Fateh, Fatemeh and Fateh, Mansoor}, journal={arXiv preprint arXiv:2506.14318}, year={2025} }

致谢

  • 特别感谢合作的放射科医师和医生进行专家标注和审核。

数据来源参考

  • 包括多个广泛使用的脑肿瘤影像数据集,如:
    • Masoud Nick Parvar Brain Tumor MRI Dataset
    • Sartaj Bhuvaji Brain Tumor Classification MRI Dataset
    • Cheng’s Brain Tumor Dataset
    • 等共10个参考数据集

元数据

  • 许可证: Attribution 4.0 International (CC BY 4.0)
  • 更新频率: 每年
  • 标签: Health, Cancer, Computer Vision, Deep Learning, Image Classification, Image Segmentation

活动概览

  • 查看次数: 273 (最近30天)
  • 下载次数: 40 (最近30天)
  • 参与度: 0.14652 (每次查看的下载次数)
搜集汇总
数据集介绍
main_image_url
构建方式
BRISC数据集通过精心筛选来自Figshare、SARTAJ和Br35H三大来源的原始MRI图像,构建了一个专注于脑肿瘤分割与分类的高质量数据集。研究团队采用严格的预处理流程,仅保留T1加权对比增强MRI扫描以确保模态一致性,并移除标签错误或质量不佳的图像。每张图像均经过专业放射科医师和临床医生的双重验证,使用AnyLabeling工具进行精确的肿瘤区域标注,最终形成包含6,000例扫描的标准化数据集,涵盖胶质瘤、脑膜瘤、垂体瘤及非肿瘤病例四大类别。
特点
该数据集的核心优势体现在多维度标注体系上:首先,所有样本均包含轴向、冠状位和矢状位三平面成像,为模型提供跨视角泛化能力;其次,针对每例肿瘤病例均提供像素级分割掩膜和病理分类标签,其中1,401例胶质瘤、1,635例脑膜瘤和1,757例垂体瘤构成均衡的类别分布。特别值得注意的是,数据集包含1,207例非肿瘤病例作为阴性对照,这种设计显著提升了模型在临床鉴别诊断中的实用性。
使用方法
研究者可通过Kaggle平台获取该数据集后,按照5:1比例划分的预定义训练集(5,000例)和测试集(1,000例)进行模型开发。对于分割任务,建议采用加权IoU指标评估模型性能;分类任务则可直接利用提供的病理标签。数据集的三平面成像特性支持多视角融合策略的研究,而精细标注的肿瘤边界特别适合开发基于Transformer的先进分割架构。临床应用中,该数据集可作为决策支持系统的基准测试平台。
背景与挑战
背景概述
BRISC数据集由伊朗科学技术大学和沙赫鲁德理工大学的研究团队于2025年创建,旨在解决脑肿瘤MRI图像分割与分类领域的关键挑战。该数据集包含6,000例增强T1加权MRI扫描,涵盖胶质瘤、脑膜瘤和垂体瘤三大常见肿瘤类型及非肿瘤病例,所有数据均经专业放射科医师标注。作为对BraTS等现有数据集的补充,BRISC通过多平面成像(轴状位、矢状位、冠状位)和平衡的类别分布,显著提升了模型在真实临床场景中的泛化能力。其创新性的标注体系与Transformer基准模型Swin-HAFNet的提出,为神经肿瘤学的机器学习研究提供了新的标准参照。
当前挑战
在领域问题层面,BRISC需解决脑肿瘤MRI分析中三大核心挑战:1) 肿瘤形态的高度异质性(如胶质瘤的浸润性生长模式)导致边界界定困难;2) 非肿瘤性病变(如囊肿、钙化灶)与肿瘤的影像学相似性引发的误分类风险;3) 多平面成像数据融合带来的特征对齐难题。在构建过程中,研究团队面临标注一致性控制(需放射科医师二次核验修正35%的初始标注)、短序列MRI(1-5幅/序列)的可用性筛选,以及跨机构数据(源自Figshare/SARTAJ/Br35H)的模态标准化等工程挑战。
常用场景
经典使用场景
BRISC数据集在脑肿瘤分割与分类研究中具有重要价值,其经典使用场景包括基于深度学习的脑肿瘤自动分割和分类模型的训练与评估。该数据集提供了高分辨率的T1加权MRI图像,涵盖了三种主要脑肿瘤类型(胶质瘤、脑膜瘤和垂体瘤)以及非肿瘤病例,为研究者提供了丰富的多平面视图数据,便于开发具有跨视图泛化能力的模型。特别是在医学影像分析领域,BRISC数据集常被用于验证新型Transformer架构在脑肿瘤分割任务中的性能表现。
解决学术问题
BRISC数据集有效解决了脑肿瘤影像分析领域的多个关键学术问题。首先,它弥补了现有数据集(如BraTS)在肿瘤类型覆盖上的局限性,通过纳入多种常见脑肿瘤类型提升了模型的泛化能力。其次,数据集提供的精确放射科医师标注解决了医学影像分割中标注质量不一致的难题。此外,多平面成像数据的系统性整合为研究跨视图特征融合算法提供了理想平台,显著推进了三维医学影像分析技术的发展。该数据集还通过平衡的类别分布,为处理医学数据中的类别不平衡问题提供了标准基准。
衍生相关工作
BRISC数据集已催生多项创新性研究工作,最具代表性的是与其同期提出的Swin-HAFNet模型,该模型通过层级注意力融合模块和上下文瓶颈增强器实现了82.4%的加权平均IoU。在后续研究中,数据集被广泛应用于改进U-Net系列架构,如开发具有多尺度特征提取能力的3D-UNet变体。在分类任务方向,研究者利用BRISC验证了混合CNN-Transformer架构在脑肿瘤亚型鉴别中的优越性。该数据集还启发了联邦学习框架下的多中心协作研究,相关成果发表在《Medical Image Analysis》等顶级期刊。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作