1aurent/NCT-CRC-HE|数字病理学数据集|图像分类数据集
收藏数据集概述
数据集描述
- 名称: NCT-CRC-HE-100K
- 描述: 包含100,000张非重叠的图像块,来自人结直肠癌(CRC)和正常组织的苏木精和伊红(H&E)染色组织学图像。所有图像尺寸为224x224像素,分辨率为0.5微米每像素(MPP),并使用Macenko方法进行颜色归一化。
- 组织类别: 脂肪组织(ADI)、背景(BACK)、碎片(DEB)、淋巴细胞(LYM)、粘液(MUC)、平滑肌(MUS)、正常结肠粘膜(NORM)、癌相关基质(STR)、结直肠腺癌上皮(TUM)。
数据集版本
- CRC_VAL_HE_7K: 包含7180张图像块,来自50名结直肠腺癌患者,可作为较大数据集的验证集。
- NCT_CRC_HE_100K: 包含100,000张图像块,来自86张H&E染色的人类癌症组织切片。
- NCT_CRC_HE_100K_NONORM: 包含100,000张图像块,与NCT_CRC_HE_100K相同的数据源,但未进行颜色归一化。
数据集信息
- 特征:
image
: 图像数据类型。label
: 分类标签,包含9个类别(ADI, BACK, DEB, LYM, MUC, MUS, NORM, STR, TUM)。
- 分割:
CRC_VAL_HE_7K
: 7180个样本,大小为1093021734.96字节。NCT_CRC_HE_100K
: 100,000个样本,大小为15223287558.0字节。NCT_CRC_HE_100K_NONORM
: 100,000个样本,大小为15219740158.0字节。
- 下载大小: 27708267639字节。
- 数据集大小: 31536049450.96字节。
伦理声明
所有实验均遵循赫尔辛基宣言、国际人体生物医学研究伦理指南(CIOMS)、贝尔蒙特报告和美国共同规则进行。组织样本来自国家肿瘤疾病中心(NCT,海德堡,德国)的组织库,并获得了海德堡大学伦理委员会的批准。
引用
bibtex @dataset{kather_jakob_nikolas_2018_1214456, author = {Kather, Jakob Nikolas and Halama, Niels and Marx, Alexander}, title = {{100,000 histological images of human colorectal cancer and healthy tissue}}, month = apr, year = 2018, publisher = {Zenodo}, version = {v0.1}, doi = {10.5281/zenodo.1214456}, url = {https://doi.org/10.5281/zenodo.1214456} }

VoxBox
VoxBox是一个大规模语音语料库,由多样化的开源数据集构建而成,用于训练文本到语音(TTS)系统。
github 收录
中指数据库(物业版)
物业版解决物业企业“找项目”、“找行业和企业数据"的迫切需求,提供高效的市场拓展渠道、最新行业动态、竞品企业的多维度数据,助力企业科学决策。
西部数据交易中心 收录
CMAB
CMAB数据集由清华大学创建,是中国首个全国范围的多属性建筑数据集,涵盖了3667个自然城市,总面积达213亿平方米。该数据集通过集成多源数据,如高分辨率Google Earth影像和街景图像,生成了建筑的屋顶、高度、功能、年龄和质量等属性。数据集的创建过程结合了地理人工智能框架和机器学习模型,确保了数据的高准确性。CMAB数据集主要应用于城市规划和可持续发展研究,旨在提供详细的城市3D物理和社会结构信息,支持城市化进程和政府决策。
arXiv 收录
中国气象数据
本数据集包含了中国2023年1月至11月的气象数据,包括日照时间、降雨量、温度、风速等关键数据。通过这些数据,可以深入了解气象现象对不同地区的影响,并通过可视化工具揭示中国的气温分布、降水情况、风速趋势等。
github 收录
云浮市失信被执行人名单信息
该数据包含了2022年至今云浮市失信被执行人名单信息,指云浮市政务服务数据管理局对该信息的变动情况进行跟踪、采集、预测、分析、公布等活动。
开放广东 收录