nirschl_et_al_2018
收藏Nirschl et al 2018 数据集概述
数据集基本信息
- 数据集名称:Nirschl et al 2018
- 描述:基于心脏组织病理学图像对临床慢性心力衰竭进行分类
- 任务:多类别分类(multi_class)
- 语言:英语(en)
- 许可证:CC-BY-4.0
- 最后更新:2024-04-17 20:38:57
- 版本:0.1.0
数据集统计
- 总实例数:2299
- 训练集:770
- 验证集:374
- 测试集:1155
患者特征统计
- 年龄中位数:58.0 [48.0,63.0]岁
- 性别分布:
- 女性:825 (36.1%)
- 男性:1463 (63.9%)
- 数据来源机构:UPenn (100%)
标签分布
- 慢性心力衰竭:1034 (45.0%)
- 心脏组织病理学:22 (1.0%)
- 非慢性心力衰竭:1243 (54.1%)
技术特征
- 领域:病理学 (100%)
- 子领域:心血管病理学 (100%)
- 染色方法:H&E (100%)
- 成像模态:光学显微镜 (100%)
- 子模态:明场显微镜 (100%)
数据结构
数据实例格式
json { "image_id": "UUID字符串", "image": "三维数组[250, 250, 3],uint8类型", "label": "类别标签(0-2)", "label_name": "字符串标签名称", "domain": "病理学", "subdomain": "心血管病理学", "modality": "光学显微镜", "submodality": "明场显微镜", "stain": "H&E", "microns_per_pixel": 2.0 }
数据字段说明
- image_id:字符串类型,唯一标识符
- image:三维数组,形状[250, 250, 3],uint8类型
- label:类别标签,3个类别
- label_name:字符串类型标签名称
- domain:字符串类型领域信息
- subdomain:字符串类型子领域信息
- modality:字符串类型成像模态
- submodality:字符串类型子模态
- stain:字符串类型染色方法
- microns_per_pixel:float32类型,像素微米比例
数据集创建
创建背景
原始数据集经过清理、更新和扩展,增加了额外元数据,并转换为Hugging Face数据集格式。该数据集是BRAVURA基准测试的一部分。
数据来源
- 机构:UPenn
- 匿名化处理:已去除个人和敏感信息
- 伦理审批:获得机构审查委员会批准
引用信息
原始论文引用
bibtex @ARTICLE{Nirschl2018-pc, title = "A deep-learning classifier identifies patients with clinical heart failure using whole-slide images of {H&E} tissue", author = "Nirschl, Jeffrey J and Janowczyk, Andrew and Peyster, Eliot G and Frank, Renee and Margulies, Kenneth B and Feldman, Michael D and Madabhushi, Anant", journal = "PLoS One", volume = 13, number = 4, pages = "e0192726", month = apr, year = 2018 }
扩展数据集引用
使用本扩展数据集时请同时引用原始论文和BRAVURA基准测试论文。
数据集维护者
- Jeff Nirschl
- Alejandro Lozano
- 联系方式:jnirschl@stanford.edu
相关链接
- 论文:https://pubmed.ncbi.nlm.nih.gov/29614076/
- 许可证:https://creativecommons.org/licenses/by/4.0/
- Hugging Face数据集页面:https://huggingface.co/datasets/nirschl-lab/nirschl_et_al_2018




