five

dwb2023/brain-tumor-image-dataset-semantic-segmentation

收藏
Hugging Face2024-07-06 更新2024-07-06 收录
下载链接:
https://hf-mirror.com/datasets/dwb2023/brain-tumor-image-dataset-semantic-segmentation
下载链接
链接失效反馈
官方服务:
资源简介:
脑肿瘤图像语义分割数据集(BTID)包含MRI图像和注释,旨在训练和评估分割模型。该数据集来源于Kaggle,包含详细的分割掩码,指示脑肿瘤的存在和边界。数据集可用于开发和基准测试医学图像分割算法,特别是在识别和分割脑肿瘤方面。数据集分为训练集、验证集和测试集,分别包含1502、429和215张图像。

The Brain Tumor Image Dataset (BTID) for Semantic Segmentation contains MRI images and annotations aimed at training and evaluating segmentation models. This dataset was sourced from Kaggle and includes detailed segmentation masks indicating the presence and boundaries of brain tumors. This dataset can be used for developing and benchmarking algorithms for medical image segmentation, particularly in identifying and segmenting brain tumors. The dataset is split into three subsets: Train (1502 images), Validation (429 images), and Test (215 images).
提供机构:
dwb2023
原始信息汇总

数据集概述

数据集描述

名称: Brain Tumor Image Dataset (BTID) for Semantic Segmentation
来源: Kaggle
用途: 用于训练和评估语义分割模型的MRI图像和注释,特别是用于识别和分割脑肿瘤。

特征

字段名称 数据类型 描述 示例值 用途
file_name String 图像文件的名称 "2256_jpg.rf.3afd7903eaf3f3c5aa8da4bbb928bc19.jpg" 图像文件的引用
image Image 图像数据 <PIL.JpegImagePlugin.JpegImageFile image mode=RGB size=640x640> 图像分析的输入
id Integer 每个图像的唯一标识符 0 图像级别的识别
category_id ClassLabel 指示图像是否为肿瘤的类别标签 1 (其中 0 = Tumor, 1 = Normal) 图像分类
bbox List[Float] 肿瘤的边界框坐标 [145.0, 239.0, 168.75, 162.5] 目标检测,感兴趣区域
segmentation List[List[Float]] 肿瘤的分割掩码坐标 [[313.75, 238.75, 145.0, 238.75, 145.0, 401.25, 313.75, 401.25, 313.75, 238.75]] 详细的对象分割
area Float 肿瘤覆盖的面积 27421.875 分析特征
iscrowd Integer 指示分割掩码是否用于人群 0 单个对象/人群的二进制标志
height Integer 图像的高度 640 图像尺寸
width Integer 图像的宽度 640 图像尺寸
date_captured String 图像捕获的日期 "2023-08-19T04:37:54+00:00" 图像的元数据
license Integer 图像的许可证信息 1 使用权的许可证引用

数据分割

数据集分为三个子集:

  • 训练集: 1502张图像
  • 验证集: 429张图像
  • 测试集: 215张图像

引用

请引用数据集的原始创建者:

bibtex @dataset{Darabi2023BrainTumor, author = {Peyman Darabi}, title = {Brain Tumor Image Dataset : Semantic Segmentation}, month = aug, year = 2023, url = {https://www.kaggle.com/datasets/pkdarabi/brain-tumor-image-dataset-semantic-segmentation}, note = {The Tumor Segmentation Dataset is designed specifically for the TumorSeg Computer Vision Project, which focuses on Semantic Segmentation. The project aims to identify tumor regions accurately within Medical Images using advanced techniques. The dataset contains two classes: Tumor (Class 1) and Non-Tumor (Class 0).}, }

许可证

数据集的许可证为CC BY-NC 4.0。更多信息请访问此链接

搜集汇总
数据集介绍
main_image_url
构建方式
该数据集的构建采用源自Kaggle的MRI图像及详细的标注信息,旨在为训练和评估分割模型提供标准化数据。数据集按照特定的特征字段组织,包括图像文件名、图像数据、唯一标识符、类别标签、边界框坐标、分割掩模坐标、面积、是否为群体标记、图像尺寸、捕获日期和许可信息等。这些字段经过精心设计,以满足医学图像分割,尤其是脑肿瘤识别与分割的需求。
特点
数据集的特点在于其包含了精细的分割掩模,能够精确指示脑肿瘤的存在与边界。数据集分为训练集、验证集和测试集三个子集,总计2136个样本,其中训练集1502个样本,验证集429个样本,测试集215个样本。数据集的构建考虑了医学图像的特性和分割任务的需求,为研究人员提供了一个可靠且具有挑战性的测试平台。
使用方法
使用该数据集时,用户可以通过Hugging Face的datasets库方便地加载和可视化数据。数据集的每个样本都包含了丰富的信息,用户可以依据具体的研究需求,对图像进行分类、目标检测和详细的分割任务。此外,数据集遵循CC BY-NC 4.0许可,用户在使用时需遵守相应的使用条款。
背景与挑战
背景概述
在医学影像分析领域,脑肿瘤的精确识别与分割对于临床诊断与治疗具有重要意义。dwb2023/brain-tumor-image-dataset-semantic-segmentation数据集应运而生,旨在为研究者提供用于训练和评估分割模型的MRI图像及注释。该数据集源自Kaggle平台,由Peyman Darabi于2023年创建,包含精细的分割掩模,用以指示脑肿瘤的存在与边界,为医学图像分割领域的研究提供了宝贵的资源。
当前挑战
该数据集在解决脑肿瘤图像的语义分割问题方面面临诸多挑战,包括但不限于:1)如何准确提取脑肿瘤的边界和区域;2)如何处理图像中的噪声和伪影;3)如何优化算法以适应不同大小和形状的肿瘤。在数据集构建过程中,挑战包括确保图像质量的一致性、注释的准确性以及数据隐私和使用的合规性。
常用场景
经典使用场景
在医学图像分析领域,dwb2023/brain-tumor-image-dataset-semantic-segmentation数据集的经典使用场景是作为训练和评估语义分割模型的基准数据。其详尽的分割掩模为算法提供了精确的肿瘤边界信息,是医学图像分割研究的重要资源。
实际应用
在实际应用中,该数据集可用于开发辅助诊断系统,通过自动化识别和分割脑部肿瘤,协助医生进行更快速和准确的诊断。此外,它还可用于医疗影像处理算法的性能测试,以确保算法在真实场景中的有效性和可靠性。
衍生相关工作
基于该数据集,研究者们已经衍生出了一系列相关工作,包括但不限于改进的分割算法、跨数据集的性能比较研究,以及结合临床信息的综合分析。这些工作进一步推动了医学图像分割技术的发展,并促进了其在临床实践中的应用。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作