five

TrainingDataPro/brain-mri-dataset|医学影像数据集|肿瘤检测数据集

收藏
hugging_face2024-04-25 更新2024-03-04 收录
医学影像
肿瘤检测
下载链接:
https://hf-mirror.com/datasets/TrainingDataPro/brain-mri-dataset
下载链接
链接失效反馈
资源简介:
该数据集包含脑癌患者的MRI扫描图像,图像以.dcm和.jpg格式存储,并附有医生的标签和PDF格式的报告。数据集包括10个不同角度的研究,提供了对脑肿瘤结构的全面理解。完整版本的数据集包含10万份不同疾病和条件的研究,包括癌症、多发性硬化症、转移性病变等。数据集对研究人员和医疗专业人员具有重要价值,可用于开发新的成像技术、训练和验证机器学习算法、分析肿瘤对不同治疗的反应等。

The dataset consists of 10 studies involving MRI scans of the brain from individuals with cancer. Each study is labeled by doctors and accompanied by a report in PDF format. The dataset also includes a DICOMDIR file containing information about the patients condition and file links, as well as a CSV file with study IDs and file counts. Additionally, the dataset provides medical reports from radiologists, which include demographic information of the patient, case description, preliminary diagnosis, and recommendations for further actions. The dataset is of great value to researchers and medical professionals in oncology, radiology, and medical imaging, and can be used for developing and evaluating new imaging techniques, training and validating machine learning algorithms, analyzing tumor response to different treatments, and more.
提供机构:
TrainingDataPro
原始信息汇总

Brain Cancer MRI Object Detection & Segmentation Dataset

概述

该数据集包含**.dcm文件**,这些文件包含脑部MRI扫描图像,用于检测和分割脑部肿瘤。图像由医生进行标注,并附有PDF格式的报告

数据集内容

  • ST000001: 包含10个研究的子文件夹,每个研究包含**.dcm和.jpg格式的MRI扫描图像**。
  • DICOMDIR: 包含患者病情信息和文件访问链接。
  • Brain_MRI_1.pdf: 包含由放射科医生提供的医疗报告。
  • .csv文件: 包含研究ID和文件数量。

医疗报告内容

  • 患者的人口统计信息
  • 病例描述
  • 初步诊断
  • 关于进一步行动的建议

数据集价值

该数据集对肿瘤学、放射学和医学影像领域的研究人员和医疗专业人员具有重要价值。可用于开发和评估新型成像技术、训练和验证机器学习算法以进行自动肿瘤检测和分割、分析肿瘤对不同治疗的反应,以及研究成像特征与临床结果之间的关系。

许可

该数据集的许可为cc-by-nc-nd-4.0

标签

  • code
  • medical
  • biology

任务类别

  • image-to-image
  • image-classification
  • image-segmentation
  • object-detection

语言

  • en
AI搜集汇总
数据集介绍
main_image_url
构建方式
该数据集由包含脑部癌症患者的MRI扫描图像的.dcm文件组成,这些图像由医生进行标注,并附有PDF格式的报告。数据集包括10个研究,从不同角度提供了对脑肿瘤结构的全面理解。每个研究包含.dcm和.jpg格式的MRI扫描图像,以及DICOMDIR文件,该文件包含患者状况的信息和访问文件的链接。此外,数据集还包括一个.csv文件,记录了研究ID和文件数量。
特点
该数据集的特点在于其高分辨率的MRI图像,能够清晰展示肿瘤的位置、大小及其周围组织。此外,数据集还包含了详细的医学报告,包括患者的个人信息、病例描述、初步诊断和进一步行动的建议。这些特征使得该数据集在肿瘤学、放射学和医学影像学领域具有重要价值,适用于开发和评估新型成像技术、训练和验证机器学习算法,以及分析肿瘤对不同治疗的反应。
使用方法
该数据集可用于多种目的,包括但不限于开发和评估新型成像技术、训练和验证用于自动肿瘤检测和分割的机器学习算法、分析肿瘤对不同治疗的反应,以及研究成像特征与临床结果之间的关系。使用者可以通过访问数据集的文件结构,获取.dcm和.jpg格式的MRI图像,以及相关的DICOMDIR和.csv文件,进行进一步的分析和研究。
背景与挑战
背景概述
在医学影像领域,脑部MRI扫描数据集的构建与应用对于肿瘤检测、分类和分割等任务具有重要意义。TrainingDataPro/brain-mri-dataset由专业医疗团队标注,包含10个不同角度的脑部MRI扫描图像,涵盖了多种脑部疾病,如癌症、多发性硬化症等。该数据集的创建旨在支持医学影像分析、机器学习算法验证以及临床治疗效果评估等研究,为神经影像学、放射学和肿瘤学领域的专业人员提供了宝贵的资源。
当前挑战
尽管TrainingDataPro/brain-mri-dataset在脑部MRI扫描数据集领域具有显著价值,但其构建过程中仍面临诸多挑战。首先,数据标注的准确性和一致性是关键,需要依赖经验丰富的放射科医生进行高质量的标注。其次,数据集的多样性和代表性问题,确保涵盖不同类型和阶段的脑部疾病,以提高模型的泛化能力。此外,数据隐私和伦理问题也是不可忽视的挑战,需确保患者数据的匿名化和合规使用。
常用场景
经典使用场景
在神经影像学领域,TrainingDataPro/brain-mri-dataset 数据集的经典使用场景主要集中在脑肿瘤的自动检测与分割。通过提供高分辨率的脑部MRI扫描图像,该数据集支持研究人员开发和验证用于肿瘤检测和分割的机器学习算法。这些算法不仅能够辅助医生快速识别肿瘤的位置和大小,还能为后续的临床决策提供关键的影像学依据。
解决学术问题
该数据集在学术研究中解决了脑肿瘤检测与分割的关键问题。通过提供标注精细的MRI图像,它为研究人员提供了丰富的数据资源,有助于推动医学影像分析技术的发展。此外,该数据集还支持对不同治疗方案下肿瘤反应的分析,以及影像特征与临床结果之间关系的研究,从而为个性化医疗提供了科学依据。
衍生相关工作
基于TrainingDataPro/brain-mri-dataset 数据集,衍生了一系列经典工作,包括脑肿瘤自动检测与分割算法的研究、肿瘤治疗效果的影像学评估方法的开发,以及个性化医疗方案的制定。这些工作不仅推动了医学影像分析技术的前沿发展,还为临床实践提供了有力的技术支持,显著提升了脑肿瘤诊断和治疗的效率与准确性。
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

中国区域交通网络数据集

该数据集包含中国各区域的交通网络信息,包括道路、铁路、航空和水路等多种交通方式的网络结构和连接关系。数据集详细记录了各交通节点的位置、交通线路的类型、长度、容量以及相关的交通流量信息。

data.stats.gov.cn 收录

Figshare

Figshare是一个在线数据共享平台,允许研究人员上传和共享各种类型的研究成果,包括数据集、论文、图像、视频等。它旨在促进科学研究的开放性和可重复性。

figshare.com 收录

CMNEE(Chinese Military News Event Extraction dataset)

CMNEE(Chinese Military News Event Extraction dataset)是国防科技大学、东南大学和清华大学联合构建的一个大规模的、基于文档标注的开源中文军事新闻事件抽取数据集。该数据集包含17,000份文档和29,223个事件,所有事件均基于预定义的军事领域模式人工标注,包括8种事件类型和11种论元角色。数据集构建遵循两阶段多轮次标注策略,首先通过权威网站获取军事新闻文本并预处理,然后依据触发词字典进行预标注,经领域专家审核后形成事件模式。随后,通过人工分批、迭代标注并持续修正,直至满足既定质量标准。CMNEE作为首个专注于军事领域文档级事件抽取的数据集,对推动相关研究具有显著意义。

github 收录

基于站点观测的中国1km土壤湿度日尺度数据集(2000-2022)

本研究提供了中国范围1km高质量的土壤湿度数据集-SMCI1.0(Soil Moisture of China by in situ data, version 1.0),SMCI1.0是包含2000-2022年、日尺度、以10厘米为间隔10层深度(10-100cm)的高时空分辨率土壤湿度,数据单位为0.001m³/m³,缺失值为-999,投影为WGS1984。该数据集是以中国气象局提供的1,648个站点观测10层土壤湿度作为基准,使用ERA5_Land气象强迫数据、叶面积指数(LAI)、土地覆盖类型(Landtypes)、地形(DEM)和土壤特性(Soil properties)作为协变量,通过机器学习方式获得。本研究进行了两组实验以验证SMCI1.0的精度,时间尺度上:ubRMSE为0.041-0.052,R为0.883-0.919;空间尺度上:ubRMSE为0.045-0.051,R为0.866-0.893。 由于SMCI1.0是基于实地观测的土壤湿度,它可以作为现有基于模型和卫星数据集的有效补充。该数据产品可用于各种水文、气象、生态分析和建模,尤其在需要高质量、高分辨率土壤湿度的应用上至关重要。有关数据集的引用及详细描述,请阅读说明文档。为便于使用,本研究提供了两种不同分辨率的版本:30 秒(~1km)和0.1度(~9km)。

国家青藏高原科学数据中心 收录

ChinaTravel

ChinaTravel是由南京大学国家重点实验室开发的一个真实世界基准数据集,专门用于评估语言代理在中国旅行规划中的应用。该数据集涵盖了中国10个最受欢迎城市的旅行信息,包括720个航班和5770趟列车,以及3413个景点、4655家餐厅和4124家酒店的详细信息。数据集通过问卷调查收集用户需求,并设计了一个可扩展的领域特定语言来支持自动评估。ChinaTravel旨在解决复杂的真实世界旅行规划问题,特别是在多兴趣点行程安排和用户偏好满足方面,为语言代理在旅行规划中的应用提供了重要的测试平台。

arXiv 收录