five

DykeF/NCTCRCHE100K

收藏
Hugging Face2023-10-04 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/DykeF/NCTCRCHE100K
下载链接
链接失效反馈
官方服务:
资源简介:
这是一个包含100,000个非重叠图像块的数据集,这些图像块来自人类结直肠癌和正常组织的H&E染色组织学图像。所有图像均为224x224像素,每个像素代表0.5微米,并使用了Macenko方法进行颜色归一化。组织类别包括:脂肪组织(ADI)、背景(BACK)、碎片(DEB)、淋巴细胞(LYM)、粘液(MUC)、平滑肌(MUS)、正常结肠粘膜(NORM)、癌症相关基质(STR)、结直肠腺癌上皮(TUM)。这些图像是从N=86个H&E染色的人类癌症组织切片中手动提取的,这些切片来自NCT生物库(德国海德堡国家肿瘤疾病中心)和UMM病理档案(德国曼海姆大学医学中心)。组织样本包括CRC原发肿瘤切片和CRC肝转移肿瘤组织;正常组织类别通过增加非肿瘤区域的胃切除标本以增加变异性。数据集分为训练集(100,000个“train”和100,000个“train_nonorm”样本)以及验证集(7,180个样本)。
提供机构:
DykeF
原始信息汇总

NCTCRCHE100K 数据集卡片

描述

这是一个包含100,000张非重叠的从人源结直肠癌(CRC)和正常组织中提取的苏木精和伊红(H&E)染色组织学图像的集合。所有图像的尺寸为224x224像素,分辨率为0.5微米每像素(MPP)。所有图像均使用Macenko方法进行颜色归一化。

组织类别包括:脂肪(ADI)、背景(BACK)、碎片(DEB)、淋巴细胞(LYM)、粘液(MUC)、平滑肌(MUS)、正常结肠粘膜(NORM)、癌相关基质(STR)、结直肠腺癌上皮(TUM)。

这些图像是从N=86张H&E染色的人源癌症组织切片中手动提取的,这些切片来自甲醛固定石蜡包埋(FFPE)样本,来自NCT生物库(国家肿瘤疾病中心,海德堡,德国)和UMM病理档案(曼海姆大学医学中心,曼海姆,德国)。组织样本包含CRC原发性肿瘤切片和来自CRC肝转移的肿瘤组织;正常组织类别通过增加来自胃切除标本的非肿瘤区域来增加变异性。

数据结构

数据集分为训练集(100,000个“train”和100,000个“train_nonorm”样本)以及7180个样本的验证集。

5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作