CryoNuSeg|细胞核实例分割数据集|冷冻组织样本数据集
收藏CryoNuSeg: A Dataset for Nuclei Segmentation of Cryosectioned H&E-Stained Histological Images
数据集概述
CryoNuSeg 是一个完全标注的冷冻 H&E 染色的组织学图像数据集。该数据集包含 30 张固定大小为 512x512 像素的图像块,来自 10 个人体器官。数据集主要来源于 The Cancer Genome Atlas (TCGA)。
引用
CryoNuSeg 的论文已公开发布在 ScienceDirect 上:
@article{CryoNuSeg2021, title = "{CryoNuSeg}: A dataset for nuclei instance segmentation of cryosectioned H&E-stained histological images", journal = "Computers in Biology and Medicine", volume = "132", pages = "104349", year = "2021", issn = "0010-4825", doi = "https://doi.org/10.1016/j.compbiomed.2021.104349", url = "https://www.sciencedirect.com/science/article/pii/S0010482521001438", author = "Amirreza Mahbod and Gerald Schaefer and Benjamin Bancher and Christine L"{o}w and Georg Dorffner and Rupert Ecker and Isabella Ellinger" }
数据集链接
完整的数据集及其对应的分割掩码可在 Kaggle 网站上获取: https://www.kaggle.com/ipateam/segmentation-of-nuclei-in-cryosectioned-he-images
WSI 选择
从 TCGA 数据库中提取图像块的步骤如下:
- 选择 10 个未广泛用于其他公开数据集的器官,包括肾上腺、喉、淋巴结、纵隔、胰腺、胸膜、皮肤、睾丸、胸腺和甲状腺。
- 每个器官选择 3 张 40 倍放大的 WSI。
WSI 图像块提取
使用 QuPath 软件提取固定大小为 512x512 像素的图像块。
手动标注
使用 ImageJ 软件进行手动核实例分割标注。
分割掩码生成代码
Matlab 代码用于生成分割掩码,可在代码文件夹中找到。
致谢
本工作得到了奥地利研究促进机构 (FFG) 和 Kaggle 开放数据研究资助的支持。

中国空气质量数据集(2014-2020年)
数据集中的空气质量数据类型包括PM2.5, PM10, SO2, NO2, O3, CO, AQI,包含了2014-2020年全国360个城市的逐日空气质量监测数据。监测数据来自中国环境监测总站的全国城市空气质量实时发布平台,每日更新。数据集的原始文件为CSV的文本记录,通过空间化处理生产出Shape格式的空间数据。数据集包括CSV格式和Shape格式两数数据格式。
国家地球系统科学数据中心 收录
中国食物成分数据库
食物成分数据比较准确而详细地描述农作物、水产类、畜禽肉类等人类赖以生存的基本食物的品质和营养成分含量。它是一个重要的我国公共卫生数据和营养信息资源,是提供人类基本需求和基本社会保障的先决条件;也是一个国家制定相关法规标准、实施有关营养政策、开展食品贸易和进行营养健康教育的基础,兼具学术、经济、社会等多种价值。 本数据集收录了基于2002年食物成分表的1506条食物的31项营养成分(含胆固醇)数据,657条食物的18种氨基酸数据、441条食物的32种脂肪酸数据、130条食物的碘数据、114条食物的大豆异黄酮数据。
国家人口健康科学数据中心 收录
Figshare
Figshare是一个在线数据共享平台,允许研究人员上传和共享各种类型的研究成果,包括数据集、论文、图像、视频等。它旨在促进科学研究的开放性和可重复性。
figshare.com 收录
DALY
DALY数据集包含了全球疾病负担研究(Global Burden of Disease Study)中的伤残调整生命年(Disability-Adjusted Life Years, DALYs)数据。该数据集提供了不同国家和地区在不同年份的DALYs指标,用于衡量因疾病、伤害和早逝导致的健康损失。
ghdx.healthdata.org 收录
Google Scholar
Google Scholar是一个学术搜索引擎,旨在检索学术文献、论文、书籍、摘要和文章等。它涵盖了广泛的学科领域,包括自然科学、社会科学、艺术和人文学科。用户可以通过关键词搜索、作者姓名、出版物名称等方式查找相关学术资源。
scholar.google.com 收录