five

nirschl_et_al_2018

收藏
Hugging Face2025-09-16 更新2025-09-17 收录
下载链接:
https://huggingface.co/datasets/nirschl-lab/nirschl_et_al_2018
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集用于从心脏组织病理学图像中分类临床慢性心力衰竭。它包含使用H&E染色的组织图像,旨在通过深度学习分类器识别患有心力衰竭的患者。数据集已由jnirschl和lozanoe更新和扩展,并纳入BRAVURA基准。数据集是单语的(英语),并在CC BY 4.0许可下发布。
创建时间:
2025-09-16
原始信息汇总

Nirschl et al 2018 数据集概述

数据集基本信息

  • 数据集名称:Nirschl et al 2018
  • 描述:基于心脏组织病理学图像对临床慢性心力衰竭进行分类
  • 任务:多类别分类(multi_class)
  • 语言:英语(en)
  • 许可证:CC-BY-4.0
  • 最后更新:2024-04-17 20:38:57
  • 版本:0.1.0

数据集统计

  • 总实例数:2299
  • 训练集:770
  • 验证集:374
  • 测试集:1155

患者特征统计

  • 年龄中位数:58.0 [48.0,63.0]岁
  • 性别分布
    • 女性:825 (36.1%)
    • 男性:1463 (63.9%)
  • 数据来源机构:UPenn (100%)

标签分布

  • 慢性心力衰竭:1034 (45.0%)
  • 心脏组织病理学:22 (1.0%)
  • 非慢性心力衰竭:1243 (54.1%)

技术特征

  • 领域:病理学 (100%)
  • 子领域:心血管病理学 (100%)
  • 染色方法:H&E (100%)
  • 成像模态:光学显微镜 (100%)
  • 子模态:明场显微镜 (100%)

数据结构

数据实例格式

json { "image_id": "UUID字符串", "image": "三维数组[250, 250, 3],uint8类型", "label": "类别标签(0-2)", "label_name": "字符串标签名称", "domain": "病理学", "subdomain": "心血管病理学", "modality": "光学显微镜", "submodality": "明场显微镜", "stain": "H&E", "microns_per_pixel": 2.0 }

数据字段说明

  • image_id:字符串类型,唯一标识符
  • image:三维数组,形状[250, 250, 3],uint8类型
  • label:类别标签,3个类别
  • label_name:字符串类型标签名称
  • domain:字符串类型领域信息
  • subdomain:字符串类型子领域信息
  • modality:字符串类型成像模态
  • submodality:字符串类型子模态
  • stain:字符串类型染色方法
  • microns_per_pixel:float32类型,像素微米比例

数据集创建

创建背景

原始数据集经过清理、更新和扩展,增加了额外元数据,并转换为Hugging Face数据集格式。该数据集是BRAVURA基准测试的一部分。

数据来源

  • 机构:UPenn
  • 匿名化处理:已去除个人和敏感信息
  • 伦理审批:获得机构审查委员会批准

引用信息

原始论文引用

bibtex @ARTICLE{Nirschl2018-pc, title = "A deep-learning classifier identifies patients with clinical heart failure using whole-slide images of {H&E} tissue", author = "Nirschl, Jeffrey J and Janowczyk, Andrew and Peyster, Eliot G and Frank, Renee and Margulies, Kenneth B and Feldman, Michael D and Madabhushi, Anant", journal = "PLoS One", volume = 13, number = 4, pages = "e0192726", month = apr, year = 2018 }

扩展数据集引用

使用本扩展数据集时请同时引用原始论文和BRAVURA基准测试论文。

数据集维护者

  • Jeff Nirschl
  • Alejandro Lozano
  • 联系方式:jnirschl@stanford.edu

相关链接

  • 论文:https://pubmed.ncbi.nlm.nih.gov/29614076/
  • 许可证:https://creativecommons.org/licenses/by/4.0/
  • Hugging Face数据集页面:https://huggingface.co/datasets/nirschl-lab/nirschl_et_al_2018
搜集汇总
数据集介绍
main_image_url
构建方式
在心脏病理学领域,nirschl_et_al_2018数据集的构建基于临床慢性心力衰竭的组织病理学图像分类需求。原始数据经过清洗、更新和扩展,纳入额外元数据后转换为Hugging Face数据集格式。每个实例分配了唯一UUID,保留原始标识符和文件名以确保数据可追溯性,并整合至BRAVURA基准测试中,严格遵循CC BY 4.0许可协议。
特点
该数据集包含2299张H&E染色的心脏组织病理学图像,涵盖慢性心力衰竭、非慢性心力衰竭及心脏组织病理三类标签。图像统一为250x250像素的三通道数组,附带丰富元数据如域、子域、染色方法和空间分辨率。数据按患者标识符划分训练集、验证集和测试集,确保样本独立性,且所有数据均来自单一机构,具有高度一致性。
使用方法
研究者可通过Hugging Face平台直接加载该数据集,支持图像分类任务特别是多类别心脏病理识别。使用前需引用原始论文及BRAVURA基准论文,遵循CC BY 4.0许可。数据已匿名化处理,无需额外伦理审查,但建议用户参考原始数据源的使用条款。适用于开发深度学习模型以辅助临床心力衰竭诊断。
背景与挑战
背景概述
nirschl_et_al_2018数据集由斯坦福大学Jeff Nirschl等研究人员于2018年创建,专注于心血管病理学领域。该数据集通过苏木精-伊红(H&E)染色的心脏组织切片图像,旨在解决临床慢性心力衰竭的自动分类问题。其创新性在于将深度学习技术引入组织病理学图像分析,为心血管疾病的诊断提供了新的 computational pathology 研究范式。该工作发表于PLoS One期刊,对推动数字病理学与人工智能的交叉融合具有显著影响力,为后续生物医学图像分析研究奠定了重要基础。
当前挑战
该数据集致力于解决心脏组织病理学图像中慢性心力衰竭的自动分类挑战,其核心难点在于组织形态学的细微差异辨识与疾病特异性模式的提取。构建过程中面临多重挑战:组织切片制备中的染色差异与图像质量不一致性需通过标准化预处理克服;医学标注依赖专业病理学家共识,存在主观性与时间成本问题;数据来源单一机构(宾夕法尼亚大学)可能导致模型泛化能力受限。此外,组织结构的复杂性与疾病表现的异质性要求算法具备多尺度特征感知能力,这些因素共同构成了该数据集在技术与临床适用性层面的核心挑战。
常用场景
经典使用场景
在心血管病理学领域,nirschl_et_al_2018数据集被广泛用于基于H&E染色组织切片的慢性心力衰竭自动分类研究。该数据集通过提供高质量的心脏组织病理学图像,支持深度学习模型进行多类别分类任务,包括慢性心力衰竭、心脏组织病理学病变及非心力衰竭状态的鉴别诊断。研究者利用该数据集训练卷积神经网络,实现对全幻灯片图像的自动化分析,显著提升了病理学诊断的效率和准确性。
衍生相关工作
该数据集衍生了一系列重要研究工作,包括基于深度学习的组织病理学图像分类算法优化、多模态医学数据融合分析以及可解释人工智能在医疗诊断中的应用。许多研究利用该数据集验证了卷积神经网络、注意力机制及迁移学习在心血管病理图像分析中的有效性。相关成果进一步推动了BRAVURA基准的发展,为生物医学人工智能领域提供了新的研究方向与方法论基础。
数据集最近研究
最新研究方向
在心脏病理学领域,nirschl_et_al_2018数据集作为基于H&E染色组织切片的慢性心力衰竭分类基准,正推动数字病理学与人工智能的深度融合。当前研究聚焦于多模态学习框架的构建,将组织形态学特征与临床元数据相结合,以提升模型的可解释性和泛化能力。随着BRAVURA基准的整合,该数据集已成为验证医疗领域鲁棒性AI代理的重要基础,尤其在心血管疾病智能诊断系统的开发中显现出关键价值。相关研究不仅促进了病理图像的自动化分析技术发展,更为精准医疗背景下的人工智能辅助决策系统提供了数据支撑。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作