brain-tumour-MRI-scan|医学影像数据集|肿瘤识别数据集

huggingface2024-07-21 更新2024-12-12 收录

医学影像

肿瘤识别

下载链接：

https://huggingface.co/datasets/Simezu/brain-tumour-MRI-scan

下载链接

链接失效反馈

资源简介：

该数据集包含7023张人类脑部MRI图像，分为4个类别：胶质瘤、脑膜瘤、无肿瘤和垂体瘤。数据集由三个来源组合而成：Figshare、SARTAJ数据集和Br35H。训练集和测试集分别包含不同类别的图像文件。

创建时间：

2024-07-21

原始信息汇总

数据集描述

该数据集包含7023张人类脑部MRI图像，分为以下4个类别：

胶质瘤（glioma）
脑膜瘤（meningioma）
无肿瘤（no tumor）
垂体瘤（pituitary）

数据集由以下三个数据集组合而成：

数据文件结构

默认配置

训练集（train）
- "Training/1-notumor/*.jpg"
- "Training/2-glioma/*.jpg"
- "Training/3-meningioma/*.jpg"
- "Training/4-pituitary/*.jpg"
测试集（test）
- "Testing/1-notumor/*.jpg"
- "Testing/2-glioma/*.jpg"
- "Testing/3-meningioma/*.jpg"
- "Testing/4-pituitary/*.jpg"

任务类别

图像分类（image-classification）

语言

英语（en）

数据集大小

1K<n<10K

AI搜集汇总

数据集介绍

构建方式

该数据集通过整合多个公开的脑部MRI图像数据集构建而成，主要包括Figshare、SARTAJ和Br35H三个来源。数据集涵盖了7023张脑部MRI图像，分为四个类别：胶质瘤、脑膜瘤、无肿瘤和垂体瘤。其中，无肿瘤类别的图像主要来源于Br35H数据集。数据集的构建过程确保了数据的多样性和代表性，为脑部肿瘤的分类研究提供了坚实的基础。

特点

该数据集的特点在于其丰富的图像类别和高质量的数据来源。数据集包含四个明确的类别，涵盖了常见的脑部肿瘤类型和无肿瘤情况，能够有效支持多类别图像分类任务。此外，数据集的图像来源于多个公开数据集，确保了数据的多样性和广泛性。数据集规模适中，包含7023张图像，适合用于深度学习模型的训练和验证。

使用方法

该数据集主要用于脑部MRI图像的分类任务，特别适用于深度学习模型的训练和评估。用户可以通过加载数据集中的训练集和测试集，分别用于模型的训练和性能测试。数据集的图像文件按照类别和分割方式组织，便于用户快速访问和处理。通过使用该数据集，研究人员可以开发出高效的脑部肿瘤自动分类模型，推动医学影像分析领域的发展。

背景与挑战

背景概述

脑肿瘤MRI扫描数据集（brain-tumour-MRI-scan）是一个专注于脑肿瘤分类的医学影像数据集，创建于近年，主要由Figshare、SARTAJ数据集和Br35H数据集整合而成。该数据集包含7023张人类脑部MRI图像，分为四类：胶质瘤、脑膜瘤、无肿瘤和垂体瘤。这些数据来源于多个公开数据集，旨在为医学影像分析领域提供高质量的标注数据，支持脑肿瘤的自动分类与诊断研究。该数据集的发布推动了深度学习在医学影像中的应用，尤其是在脑肿瘤早期检测和分类任务中，为研究人员提供了宝贵的资源。

当前挑战

脑肿瘤MRI扫描数据集在解决脑肿瘤分类问题时面临多重挑战。首先，脑肿瘤的形态多样性和复杂性使得图像分类任务极具挑战性，尤其是在区分不同类型的肿瘤时。其次，数据集的构建过程中，整合来自不同来源的数据可能导致图像质量、分辨率和标注标准的不一致，增加了数据预处理的难度。此外，医学影像数据的隐私性和获取难度也限制了数据集的规模和质量，进一步影响了模型的泛化能力。这些挑战要求研究者在数据预处理、模型设计和算法优化方面投入更多精力，以提高分类的准确性和鲁棒性。

常用场景

经典使用场景

在医学影像分析领域，brain-tumour-MRI-scan数据集被广泛用于训练和测试深度学习模型，以自动识别和分类脑部MRI图像中的肿瘤类型。该数据集包含了7023张MRI图像，分为四类：胶质瘤、脑膜瘤、无肿瘤和垂体瘤，为研究者提供了一个丰富的资源来探索图像分类算法在医学诊断中的应用。

实际应用

在实际应用中，brain-tumour-MRI-scan数据集被用于开发智能诊断系统，这些系统能够辅助医生快速识别脑部肿瘤类型，优化治疗方案。此外，该数据集还被用于教育和培训医学生和放射科医生，提高他们对脑部肿瘤影像特征的识别能力。

衍生相关工作

基于brain-tumour-MRI-scan数据集，研究者们已经开发了多种深度学习模型，如卷积神经网络（CNN）和迁移学习模型，这些模型在脑部肿瘤分类任务中表现出色。此外，该数据集还促进了多模态医学影像分析技术的发展，结合MRI与其他影像数据，进一步提升了诊断的全面性和准确性。

以上内容由AI搜集并总结生成

用户留言

有没有相关的论文或文献参考？

这个数据集是基于什么背景创建的？

数据集的作者是谁？

能帮我联系到这个数据集的作者吗？

这个数据集如何下载？

点击留言

数据主题

具身智能

数据集 4098个

机构 8个

大模型

数据集 439个

机构 10个

无人机

数据集 37个

机构 6个

指令微调

数据集 36个

机构 6个

蛋白质结构

数据集 50个

机构 8个

空间智能

数据集 21个

机构 5个

5,000+

优质数据集

54 个

任务类型

进入经典数据集

热门数据集

CMNEE（Chinese Military News Event Extraction dataset）

CMNEE（Chinese Military News Event Extraction dataset）是国防科技大学、东南大学和清华大学联合构建的一个大规模的、基于文档标注的开源中文军事新闻事件抽取数据集。该数据集包含17,000份文档和29,223个事件，所有事件均基于预定义的军事领域模式人工标注，包括8种事件类型和11种论元角色。数据集构建遵循两阶段多轮次标注策略，首先通过权威网站获取军事新闻文本并预处理，然后依据触发词字典进行预标注，经领域专家审核后形成事件模式。随后，通过人工分批、迭代标注并持续修正，直至满足既定质量标准。CMNEE作为首个专注于军事领域文档级事件抽取的数据集，对推动相关研究具有显著意义。

github 收录

Beijing Traffic

The Beijing Traffic Dataset collects traffic speeds at 5-minute granularity for 3126 roadway segments in Beijing between 2022/05/12 and 2022/07/25.

Papers with Code 收录

猫狗图像数据集

该数据集包含猫和狗的图像，每类各12500张。训练集和测试集分别包含10000张和2500张图像，用于模型的训练和评估。

github 收录

CliMedBench

CliMedBench是一个大规模的中文医疗大语言模型评估基准，由华东师范大学等机构创建。该数据集包含33,735个问题，涵盖14个核心临床场景，主要来源于顶级三级医院的真实电子健康记录和考试练习。数据集的创建过程包括专家指导的数据选择和多轮质量控制，确保数据的真实性和可靠性。CliMedBench旨在评估和提升医疗大语言模型在临床决策支持、诊断和治疗建议等方面的能力，解决医疗领域中模型性能评估的不足问题。

arXiv 收录

Wind Turbine Data

该数据集包含风力涡轮机的运行数据，包括风速、风向、发电量等参数。数据记录了多个风力涡轮机在不同时间点的运行状态，适用于风能研究和风力发电系统的优化分析。