RSNA-BSD1K|乳腺癌检测数据集|医学影像分析数据集
收藏数据集概述
数据集名称
- RSNA-BSD1K
数据集描述
- RSNA-BSD1K 是一个包含 1,000 张乳腺 X 线照片的子集,这些照片来自 RSNA 乳腺筛查数据集,专门用于支持乳腺 X 线照片中乳腺癌检测(BCDM)的进一步研究。
- 原始 RSNA 数据集包含 54,706 张筛查乳腺 X 线照片,其中有 1,000 个恶性病例来自 8,000 名患者。从这些数据中,我们精选了 RSNA-BSD1K,其中包括 1,000 张乳腺 X 线照片,其中有 200 个恶性病例,由两位专家放射科医生进行边界框级别的标注。
数据集结构
- 数据集结构如下:
bash
- └─ rsna-bsd1k └─ annotations └─ instances_full.json └─ instances_val.json └─ images └─ train └─ val
数据集使用
- 将数据集放置在
DATA_ROOT
文件夹中。 - 在
datasets/coco_style_dataset.py
中添加 rsna 数据集。 - 完成后,可以使用该数据集进行训练和评估。
数据集发布时间
- 2024年6月发布。

光伏电站发电量预估数据
1、准确预测一个地区分布式光伏场站的整体输出功率,可以提高电网的稳定性,增加电网消纳光电能量的能力,在降低能源消耗成本的同时促进低碳能源发展,实现动态供需状态预测的方法,为绿色电力源网荷储的应用落地提供支持。 2、准确预估光伏电站发电量,可以自动发现一些有故障的设备或者低效电站,提升发电效能。1、逆变器及电站数据采集,将逆变器中计算累计发电量数据,告警数据同步到Maxcompute大数据平台 2、天气数据采集, 通过API获取ERA5气象数据包括光照辐射、云量、温度、湿度等 3、数据特征构建, 在大数据处理平台进行数据预处理,用累计发电量矫正小时平均发电功率,剔除异常数据、归一化。告警次数等指标计算 4、异常数据处理, 天气、设备数据根据经纬度信息进行融合, 并对融合后的数据进行二次预处理操作,剔除辐照度和发电异常的一些数据 5、算法模型训练,基于XGBoost算法模型对历史数据进行训练, 生成训练集并保存至OSS 6、算法模型预测,基于XGBoost算法模型接入OSS训练集对增量数据进行预测, 并评估预测准确率等效果数据,其中误差率=(发电量-预估发电量)/发电量,当误差率低于一定阈值时,该数据预测为准确。预测准确率=预测准确数量/预测数据总量。
浙江省数据知识产权登记平台 收录
中国光伏电站空间分布ChinaPV数据集(2015,2020年)
该数据集是中国光伏电站空间分布ChinaPV数据,数据时间为2015和2020年。该数据集以Landsat-8卫星影像为数据源,处理方法是基于GEE遥感云计算平台,运用随机森林分类模型对2020年中国光伏电站进行遥感提取,后经过形态学运算,灯光数据滤除,轮廓细化及目视解译等后处理操作生成。该数据详细描述了中国区域内每个光伏电站的面积和地理位置信息,反映了中国地区光伏电站发展现状及其地域分布规律,以ESRI Shapefile格式存储。
国家地球系统科学数据中心 收录
豆瓣数据集
该数据集通过爬虫技术从豆瓣网站获取了48223条电影数据,并与movielens ml-latest数据集通过共同的imdb字段进行交集处理,最终得到15752条共同数据。数据存储格式为JSON,支持导入到MongoDB或其他数据库使用。
github 收录
OpenSonarDatasets
OpenSonarDatasets是一个致力于整合开放源代码声纳数据集的仓库,旨在为水下研究和开发提供便利。该仓库鼓励研究人员扩展当前的数据集集合,以增加开放源代码声纳数据集的可见性,并提供一个更容易查找和比较数据集的方式。
github 收录
光伏电站数据运行数据集
为EPC公司、可再生能源投资者和金融机构、光伏产业链公司、电站资产管理公司。 提供的光伏电站的全方位运维数据,帮助评估投资风险和回报。
浙江大数据交易服务平台 收录