Neuroblastoma Pathology Gallery
收藏github2025-03-16 更新2025-03-18 收录
下载链接:
https://github.com/HovChen/MMLNB
下载链接
链接失效反馈官方服务:
资源简介:
数据集包含神经母细胞瘤的病理图像和相应的文本描述,用于辅助图像分类。数据集结构包括data/NBPath-7.5K/和data/NBITP-1.5K/两个主要文件夹,其中包含图像和描述文件。描述文件CSV应包含文件名、描述和类别(PD, D, 或 UD)的列。
This dataset comprises pathological images of neuroblastoma and their corresponding text descriptions, intended to assist with image classification. It includes two primary directories: data/NBPath-7.5K/ and data/NBITP-1.5K/, which store the image and description files respectively. The CSV-format description files should contain three columns: filename, description, and category (PD, D, or UD).
创建时间:
2025-03-08
原始信息汇总
MMLNB数据集概述
数据集结构
-
主文件夹结构:
data/ ├── NBPath-7.5K/ │ ├── images/ └── NBITP-1.5K/ ├── images/ └── descriptions.csv
数据集内容
- 包含两个子数据集:
- NBPath-7.5K:包含图像数据
- NBITP-1.5K:包含图像数据和描述文件
- 描述文件格式:
- CSV文件包含列:file_name, description, class
- class取值:PD, D, 或 UD
用途
- 用于神经母细胞瘤亚型分类的多模态学习
- 辅助生成病理感知的文本描述以协助图像分类
相关论文
- 标题:MMLNB: Multi-Modal Learning for Neuroblastoma Subtyping Classification Assisted with Textual Description Generation
- 作者:Huangwei Chen, Yifei Chen, Zhenyu Yan, Mingyang Ding, Chenlei Li, Zhu Zhu, Feiwei Qin
- 年份:2025
- arXiv链接:https://arxiv.org/abs/2503.12927
搜集汇总
数据集介绍

构建方式
Neuroblastoma Pathology Gallery数据集的构建基于多模态学习框架,结合视觉语言模型(VLM)与病理学描述生成技术。首先,通过LoRA技术对预训练的VLM进行微调,使其适应神经母细胞瘤病理图像的特征。随后,利用微调后的VLM生成病理感知的文本描述,辅助图像分类任务。数据集包含7.5K张神经母细胞瘤病理图像(NBPath-7.5K)和1.5K张带有病理描述的图像(NBITP-1.5K),后者通过CSV文件存储图像文件名、病理描述及分类标签。
特点
该数据集的核心特点在于其多模态特性,将病理图像与生成的文本描述相结合,为神经母细胞瘤的分类研究提供了丰富的上下文信息。数据集中的图像涵盖了多种病理类型(PD、D、UD),并通过高质量的病理描述增强了数据的可解释性。此外,数据集的构建方式支持端到端的模型训练与推理,为多模态学习在医学图像分析中的应用提供了实验基础。
使用方法
使用该数据集时,需先配置Python环境并安装相关依赖。数据集的图像与描述文件需按照指定目录结构存放。通过提供的脚本,用户可对VLM进行微调,生成病理描述,并训练多模态分类模型(MMLNB)。训练过程中,需指定描述文件路径、图像目录及模型保存路径。推理阶段,用户可通过批量推理脚本对测试图像生成描述并保存结果。整个流程支持从数据预处理到模型训练与评估的全流程操作。
背景与挑战
背景概述
Neuroblastoma Pathology Gallery数据集由Huangwei Chen等人于2025年提出,旨在通过多模态学习方法提升神经母细胞瘤亚型分类的准确性。该数据集由两部分组成:NBPath-7.5K和NBITP-1.5K,分别包含病理图像及其对应的病理描述。研究人员通过微调视觉语言模型(VLM)并生成病理感知的文本描述,辅助图像分类任务。这一研究为神经母细胞瘤的精准诊断提供了新的技术路径,并在医学影像分析领域产生了重要影响。
当前挑战
Neuroblastoma Pathology Gallery数据集在构建和应用过程中面临多重挑战。首先,神经母细胞瘤的病理图像具有高度异质性,如何有效提取并融合多模态信息(如图像与文本)成为关键难题。其次,数据集中病理描述的生成依赖于高质量的标注,而医学领域的专业术语和复杂病理特征增加了标注的难度。此外,模型在微调和推理过程中需要处理大规模数据,计算资源的优化与模型性能的平衡也是亟待解决的问题。这些挑战不仅影响了数据集的构建效率,也对模型的泛化能力提出了更高要求。
常用场景
经典使用场景
在神经母细胞瘤病理学研究中,Neuroblastoma Pathology Gallery数据集被广泛应用于多模态学习模型的训练与验证。通过结合病理图像与相应的文本描述,研究者能够构建出更为精准的分类模型,用于区分不同类型的神经母细胞瘤。该数据集的使用场景主要集中在病理图像的自动分类与描述生成,为临床诊断提供了强有力的辅助工具。
实际应用
在实际应用中,Neuroblastoma Pathology Gallery数据集被用于开发智能病理诊断系统。这些系统能够自动分析病理图像并生成详细的病理描述,帮助医生快速识别神经母细胞瘤的类型和严重程度。此外,该数据集还被用于医学教育,通过提供丰富的病理图像和描述,帮助医学生和病理学家更好地理解神经母细胞瘤的病理特征。
衍生相关工作
基于Neuroblastoma Pathology Gallery数据集,研究者们开发了多种多模态学习模型,如MMLNB模型。这些模型通过结合视觉与文本信息,显著提升了神经母细胞瘤分类的准确性。此外,该数据集还催生了一系列关于病理图像描述生成的研究工作,进一步推动了医学图像分析与自然语言处理的交叉领域发展。
以上内容由遇见数据集搜集并总结生成



