Breast Cancer Semantic Segmentation (BCSS) dataset|乳腺癌数据集|语义分割数据集
收藏数据集概述
数据集名称
Breast Cancer Semantic Segmentation (BCSS) dataset
数据集来源
该数据集与论文 "Structured crowdsourcing enables convolutional segmentation of histology images" 相关联,论文作者为 Amgad M, Elfandy H 等,发表于 Bioinformatics 2019。
数据集内容
- 掩码图像:以
.png
格式存储,像素值编码区域类别成员。 - 元数据:包含
gtruth_codes.tsv
文件,解释掩码图像中的像素值编码。 - RGB图像:与掩码图像对应,可从 TCGA 幻灯片中提取。
数据集使用注意事项
- 关键提示:零像素代表非感兴趣区域(“不关心”类别),在模型训练中应赋予零权重,不代表“其他”类别。
- 分辨率设置:掩码和对应的 RGB 图像将根据
MPP
或MAG
设置的分辨率进行下载。
数据集下载
- 便捷下载链接:提供一个链接下载 0.25 MPP 分辨率的数据集。
- 命令行下载:通过脚本下载所有数据集元素,包括注释 JSON 文件、掩码和 RGB 图像。
数据集许可证
- 数据集:CC0 1.0 Universal (CC0 1.0) 公共领域贡献许可证。
- 代码:MIT 许可证。
引用要求
使用数据集时,建议引用相关论文。

典型分布式光伏出力预测数据集
光伏电站出力数据每5分钟从电站机房监控系统获取;气象实测数据从气象站获取,气象站建于电站30号箱变附近,每5分钟将采集的数据通过光纤传输到机房;数值天气预报数据利用中国电科院新能源气象应用机房的WRF业务系统(包括30TF计算刀片机、250TB并行存储)进行中尺度模式计算后输出预报产品,每日8点前通过反向隔离装置推送到电站内网预测系统。
国家基础学科公共科学数据中心 收录
中国气象数据
本数据集包含了中国2023年1月至11月的气象数据,包括日照时间、降雨量、温度、风速等关键数据。通过这些数据,可以深入了解气象现象对不同地区的影响,并通过可视化工具揭示中国的气温分布、降水情况、风速趋势等。
github 收录
中国光伏电站空间分布ChinaPV数据集(2015,2020年)
该数据集是中国光伏电站空间分布ChinaPV数据,数据时间为2015和2020年。该数据集以Landsat-8卫星影像为数据源,处理方法是基于GEE遥感云计算平台,运用随机森林分类模型对2020年中国光伏电站进行遥感提取,后经过形态学运算,灯光数据滤除,轮廓细化及目视解译等后处理操作生成。该数据详细描述了中国区域内每个光伏电站的面积和地理位置信息,反映了中国地区光伏电站发展现状及其地域分布规律,以ESRI Shapefile格式存储。
国家地球系统科学数据中心 收录
Global Solar Dataset
在快速扩展的太阳能领域,找到全面的国家规模光伏(PV)数据集可能具有挑战性。资源通常分散在多个网站和API中,质量和可访问性差异显著。该仓库旨在通过将这些数据集的位置集中到一个位置来简化对这些数据集的访问,从而支持研究并促进新旧市场中太阳能预测模型的开发。
github 收录
ECMWF Reanalysis v5 (ERA5)
ERA5 是第五代 ECMWF 全球气候大气再分析,涵盖从 1940 年 1 月至今的时期。ERA5 由 ECMWF 的哥白尼气候变化服务 (C3S) 制作。 ERA5 提供大量大气、陆地和海洋气候变量的每小时估计值。这些数据以 30 公里的网格覆盖地球,并使用从地表到 80 公里高度的 137 个级别解析大气。ERA5 包括有关所有变量在降低空间和时间分辨率下的不确定性的信息。
OpenDataLab 收录