five

A dataset of primary nasopharyngeal carcinoma MRI with multi-modalities segmentation

收藏
arXiv2024-04-04 更新2024-06-21 收录
下载链接:
https://zenodo.org/records/10900202
下载链接
链接失效反馈
官方服务:
资源简介:
本数据集由佛山市第一人民医院创建,包含277名原发性鼻咽癌患者的MRI图像,涵盖T1加权、T2加权和增强T1加权序列,共计831次扫描。数据集不仅包括临床数据,还有经验丰富的放射科医生手动标注的分割图像,为未接受治疗的原发性鼻咽癌提供高质量数据资源。创建过程经过严格的质量控制,确保数据的准确性和可靠性。该数据集主要用于鼻咽癌的早期诊断、肿瘤分割和疾病分期,支持机器学习算法的发展,特别是在医疗图像分析领域,有助于提高疾病诊断和治疗策略的精确性。

This dataset was created by the First People's Hospital of Foshan. It contains MRI images from 277 patients with primary nasopharyngeal carcinoma, covering T1-weighted, T2-weighted and contrast-enhanced T1-weighted sequences, totaling 831 scans. In addition to clinical data, the dataset also includes manually annotated segmentation masks produced by experienced radiologists, providing high-quality data resources for untreated primary nasopharyngeal carcinoma cases. Its creation process underwent strict quality control to ensure the accuracy and reliability of the data. This dataset is mainly used for early diagnosis, tumor segmentation and disease staging of nasopharyngeal carcinoma, supporting the development of machine learning algorithms, especially in the field of medical image analysis, and helping to improve the accuracy of disease diagnosis and treatment strategies.
提供机构:
佛山市第一人民医院
创建时间:
2024-04-04
搜集汇总
数据集介绍
main_image_url
构建方式
该数据集由277名经临床和病理诊断为原发性鼻咽癌的患者的多模态磁共振成像(MRI)数据组成。这些数据包括T1加权、T2加权和对比增强T1加权序列,共计831次扫描。所有图像均由两位经验丰富的放射科医生手动标注,并通过ITK-SNAP软件进行像素级肿瘤区域的分割。此外,数据集还包括患者的临床数据,如EBV状态、活检结果和五年无进展生存期。为确保数据质量,排除了曾接受放疗或化疗的患者以及图像质量不达标的病例。
特点
该数据集的显著特点在于其多模态MRI数据的全面性和高质量的手动标注。通过结合T1加权、T2加权和对比增强T1加权序列,提供了丰富的肿瘤形态学信息。此外,数据集还包括详细的临床参数,为模型训练提供了多维度的特征。手动标注的肿瘤区域为深度学习模型提供了高度准确的基准,有助于提高分割和诊断的准确性。
使用方法
该数据集可用于开发和验证鼻咽癌自动分割算法,特别是基于卷积神经网络(CNN)和U-Net等深度学习模型的应用。研究人员可以通过访问Zenodo平台下载数据集,并使用ITK-SNAP软件进行可视化。对于Python用户,PyDICOM库可用于读取MRI数据,而vtkmodules和Nibabel则适用于处理感兴趣区域(ROI)数据。通过这些工具,研究人员可以高效地利用该数据集进行模型训练和性能评估,从而推动鼻咽癌诊断和治疗策略的进步。
背景与挑战
背景概述
鼻咽癌(Nasopharyngeal Carcinoma, NPC)是全球第六大高发癌症,其发病率在东南亚地区尤为显著。为了应对这一挑战,研究人员在佛山市第一人民医院、安徽医科大学第二附属医院和复旦大学中山医院等机构合作,于2024年创建了首个综合性的鼻咽癌MRI数据集。该数据集包含277名初诊鼻咽癌患者的MR轴向图像,涵盖T1加权、T2加权和对比增强T1加权序列,共计831次扫描。此数据集不仅提供了高质量的图像数据,还包括由经验丰富的放射科医生手动标注的肿瘤分割数据,以及相关的临床数据。这一数据集的发布填补了鼻咽癌诊断和治疗规划领域的数据空白,为机器学习算法的发展提供了宝贵的资源,推动了鼻咽癌早期诊断和治疗策略的进步。
当前挑战
尽管该数据集在鼻咽癌研究中具有重要意义,但其构建和应用过程中仍面临多项挑战。首先,高质量的手动标注数据生成过程耗时且依赖于专家经验,这限制了数据集的扩展和更新速度。其次,多模态MRI数据的整合和分析需要复杂的算法和技术支持,以确保准确性和可靠性。此外,数据集的隐私保护和匿名化处理也是一大挑战,需确保患者信息的安全性和合规性。最后,如何有效地利用这一数据集进行模型训练和验证,以实现自动化肿瘤分割和疾病预测,仍需进一步研究和优化。
常用场景
经典使用场景
该数据集主要用于鼻咽癌(NPC)的多模态磁共振成像(MRI)分割研究。通过整合T1加权、T2加权和对比增强T1加权序列的MRI图像,研究人员可以利用这些高分辨率图像进行肿瘤的精确分割。这种多模态数据集为深度学习算法提供了丰富的特征,有助于提高鼻咽癌诊断和治疗的准确性。
解决学术问题
该数据集解决了鼻咽癌诊断和治疗中的关键学术问题,包括肿瘤的早期检测、精确分割和疾病分期。通过提供高质量的手动标注数据,该数据集为机器学习算法的发展提供了坚实的基础,有助于提高鼻咽癌的诊断准确性和治疗效果。此外,该数据集还促进了多模态影像数据的整合研究,推动了医学影像分析技术的发展。
衍生相关工作
基于该数据集,已经衍生出多项经典工作,包括使用卷积神经网络(CNN)和U-Net架构进行鼻咽癌的自动分割研究。例如,Li等人提出的NPCNet模型,通过联合分割鼻咽癌肿瘤和转移淋巴结,显著提高了分割的准确性。此外,Chen等人开发的MMFNet模型,通过多模态MRI融合网络,进一步提升了鼻咽癌的分割效果。这些研究不仅推动了鼻咽癌的诊断技术,也为其他类型的肿瘤分割研究提供了宝贵的参考。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作