five

Neuroblastoma Pathology Gallery

收藏
github2025-03-16 更新2025-03-18 收录
下载链接:
https://github.com/HovChen/MMLNB
下载链接
链接失效反馈
官方服务:
资源简介:
数据集包含神经母细胞瘤的病理图像和相应的文本描述,用于辅助图像分类。数据集结构包括data/NBPath-7.5K/和data/NBITP-1.5K/两个主要文件夹,其中包含图像和描述文件。描述文件CSV应包含文件名、描述和类别(PD, D, 或 UD)的列。

This dataset comprises pathological images of neuroblastoma and their corresponding text descriptions, intended to assist with image classification. It includes two primary directories: data/NBPath-7.5K/ and data/NBITP-1.5K/, which store the image and description files respectively. The CSV-format description files should contain three columns: filename, description, and category (PD, D, or UD).
创建时间:
2025-03-08
原始信息汇总

MMLNB数据集概述

数据集结构

  • 主文件夹结构:

    data/ ├── NBPath-7.5K/ │ ├── images/ └── NBITP-1.5K/ ├── images/ └── descriptions.csv

数据集内容

  • 包含两个子数据集:
    • NBPath-7.5K:包含图像数据
    • NBITP-1.5K:包含图像数据和描述文件
  • 描述文件格式:
    • CSV文件包含列:file_name, description, class
    • class取值:PD, D, 或 UD

用途

  • 用于神经母细胞瘤亚型分类的多模态学习
  • 辅助生成病理感知的文本描述以协助图像分类

相关论文

  • 标题:MMLNB: Multi-Modal Learning for Neuroblastoma Subtyping Classification Assisted with Textual Description Generation
  • 作者:Huangwei Chen, Yifei Chen, Zhenyu Yan, Mingyang Ding, Chenlei Li, Zhu Zhu, Feiwei Qin
  • 年份:2025
  • arXiv链接:https://arxiv.org/abs/2503.12927
搜集汇总
数据集介绍
main_image_url
构建方式
Neuroblastoma Pathology Gallery数据集的构建基于多模态学习框架,结合视觉语言模型(VLM)与病理学描述生成技术。首先,通过LoRA技术对预训练的VLM进行微调,使其适应神经母细胞瘤病理图像的特征。随后,利用微调后的VLM生成病理感知的文本描述,辅助图像分类任务。数据集包含7.5K张神经母细胞瘤病理图像(NBPath-7.5K)和1.5K张带有病理描述的图像(NBITP-1.5K),后者通过CSV文件存储图像文件名、病理描述及分类标签。
特点
该数据集的核心特点在于其多模态特性,将病理图像与生成的文本描述相结合,为神经母细胞瘤的分类研究提供了丰富的上下文信息。数据集中的图像涵盖了多种病理类型(PD、D、UD),并通过高质量的病理描述增强了数据的可解释性。此外,数据集的构建方式支持端到端的模型训练与推理,为多模态学习在医学图像分析中的应用提供了实验基础。
使用方法
使用该数据集时,需先配置Python环境并安装相关依赖。数据集的图像与描述文件需按照指定目录结构存放。通过提供的脚本,用户可对VLM进行微调,生成病理描述,并训练多模态分类模型(MMLNB)。训练过程中,需指定描述文件路径、图像目录及模型保存路径。推理阶段,用户可通过批量推理脚本对测试图像生成描述并保存结果。整个流程支持从数据预处理到模型训练与评估的全流程操作。
背景与挑战
背景概述
Neuroblastoma Pathology Gallery数据集由Huangwei Chen等人于2025年提出,旨在通过多模态学习方法提升神经母细胞瘤亚型分类的准确性。该数据集由两部分组成:NBPath-7.5K和NBITP-1.5K,分别包含病理图像及其对应的病理描述。研究人员通过微调视觉语言模型(VLM)并生成病理感知的文本描述,辅助图像分类任务。这一研究为神经母细胞瘤的精准诊断提供了新的技术路径,并在医学影像分析领域产生了重要影响。
当前挑战
Neuroblastoma Pathology Gallery数据集在构建和应用过程中面临多重挑战。首先,神经母细胞瘤的病理图像具有高度异质性,如何有效提取并融合多模态信息(如图像与文本)成为关键难题。其次,数据集中病理描述的生成依赖于高质量的标注,而医学领域的专业术语和复杂病理特征增加了标注的难度。此外,模型在微调和推理过程中需要处理大规模数据,计算资源的优化与模型性能的平衡也是亟待解决的问题。这些挑战不仅影响了数据集的构建效率,也对模型的泛化能力提出了更高要求。
常用场景
经典使用场景
在神经母细胞瘤病理学研究中,Neuroblastoma Pathology Gallery数据集被广泛应用于多模态学习模型的训练与验证。通过结合病理图像与相应的文本描述,研究者能够构建出更为精准的分类模型,用于区分不同类型的神经母细胞瘤。该数据集的使用场景主要集中在病理图像的自动分类与描述生成,为临床诊断提供了强有力的辅助工具。
实际应用
在实际应用中,Neuroblastoma Pathology Gallery数据集被用于开发智能病理诊断系统。这些系统能够自动分析病理图像并生成详细的病理描述,帮助医生快速识别神经母细胞瘤的类型和严重程度。此外,该数据集还被用于医学教育,通过提供丰富的病理图像和描述,帮助医学生和病理学家更好地理解神经母细胞瘤的病理特征。
衍生相关工作
基于Neuroblastoma Pathology Gallery数据集,研究者们开发了多种多模态学习模型,如MMLNB模型。这些模型通过结合视觉与文本信息,显著提升了神经母细胞瘤分类的准确性。此外,该数据集还催生了一系列关于病理图像描述生成的研究工作,进一步推动了医学图像分析与自然语言处理的交叉领域发展。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作