five

RSNA-BSD1K|乳腺癌检测数据集|医学影像分析数据集

收藏
github2024-07-11 更新2024-07-12 收录
乳腺癌检测
医学影像分析
下载链接:
https://github.com/Tajamul21/D-MASTER
下载链接
链接失效反馈
资源简介:
RSNA-BSD1K是从RSNA乳腺癌筛查数据集中精选的1,000张乳腺X光片子集,包含200个恶性病例,由两位专家放射科医生进行边界框级别的标注,旨在支持乳腺癌检测研究。
创建时间:
2024-07-06
原始信息汇总

数据集概述

数据集名称

  • RSNA-BSD1K

数据集描述

  • RSNA-BSD1K 是一个包含 1,000 张乳腺 X 线照片的子集,这些照片来自 RSNA 乳腺筛查数据集,专门用于支持乳腺 X 线照片中乳腺癌检测(BCDM)的进一步研究。
  • 原始 RSNA 数据集包含 54,706 张筛查乳腺 X 线照片,其中有 1,000 个恶性病例来自 8,000 名患者。从这些数据中,我们精选了 RSNA-BSD1K,其中包括 1,000 张乳腺 X 线照片,其中有 200 个恶性病例,由两位专家放射科医生进行边界框级别的标注。

数据集结构

  • 数据集结构如下: bash
    • └─ rsna-bsd1k └─ annotations └─ instances_full.json └─ instances_val.json └─ images └─ train └─ val

数据集使用

  • 将数据集放置在 DATA_ROOT 文件夹中。
  • datasets/coco_style_dataset.py 中添加 rsna 数据集。
  • 完成后,可以使用该数据集进行训练和评估。

数据集发布时间

  • 2024年6月发布。
AI搜集汇总
数据集介绍
main_image_url
构建方式
RSNA-BSD1K数据集是从RSNA乳腺筛查数据集中精心挑选的1,000张乳腺X光片子集,专门用于支持乳腺癌检测研究。该数据集包含200例恶性病例,由两位资深放射科医生进行边界框标注。通过这种精细的标注过程,RSNA-BSD1K旨在提供高质量的数据,以推动乳腺癌检测算法的发展。
使用方法
使用RSNA-BSD1K数据集时,研究者需首先下载数据集并将其放置在指定的数据根目录下。随后,通过修改代码中的数据集配置文件,将RSNA-BSD1K数据集纳入训练和评估流程。研究者可以根据需要调整训练参数,并利用提供的脚本进行模型训练和评估,以实现乳腺癌检测算法的优化和验证。
背景与挑战
背景概述
RSNA-BSD1K数据集是由印度理工学院德里分校(IIT Delhi)的研究团队于2024年创建的,旨在支持乳腺癌检测领域的研究。该数据集是从RSNA乳腺筛查数据集中精选出的1,000张乳腺X光片,包含200例恶性肿瘤,并由两位专家放射科医生进行边界框标注。RSNA-BSD1K的发布标志着在乳腺癌检测领域迈出了重要一步,为研究人员提供了一个高质量、标注精细的数据集,以推动跨领域乳腺癌检测模型的开发与优化。
当前挑战
RSNA-BSD1K数据集在构建过程中面临多项挑战。首先,乳腺癌检测领域存在数据稀缺和标注复杂的问题,需要高精度的标注以确保模型的准确性。其次,数据集的跨域适应性问题也是一个重要挑战,如何在不同数据源和环境下保持模型的稳定性和高效性是研究的重点。此外,数据集的规模和多样性要求模型具备强大的泛化能力,以应对实际临床应用中的各种复杂情况。
常用场景
经典使用场景
在乳腺癌检测领域,RSNA-BSD1K数据集的经典使用场景主要集中在通过深度学习模型进行乳腺X光片的自动分析与诊断。该数据集包含1000张经过专家标注的乳腺X光片,其中200张为恶性病例。研究者利用这些标注数据训练模型,以实现对乳腺X光片中恶性肿瘤的自动检测与定位,从而提高诊断的准确性和效率。
解决学术问题
RSNA-BSD1K数据集解决了乳腺癌检测中的关键学术问题,即如何在不同数据集之间进行无监督域适应。通过提供高质量的标注数据,该数据集支持研究者开发和验证新的深度学习模型,这些模型能够在不同数据源之间迁移知识,从而提高乳腺癌检测的泛化能力和准确性。这一研究不仅推动了医学影像分析技术的发展,也为临床实践提供了有力的技术支持。
实际应用
在实际应用中,RSNA-BSD1K数据集被广泛用于开发和优化乳腺癌检测算法。这些算法可以集成到医院的影像诊断系统中,帮助放射科医生快速准确地识别乳腺X光片中的恶性肿瘤。通过减少人为误差和提高诊断速度,这些算法显著提升了乳腺癌的早期检测率和治疗效果,从而挽救了大量患者的生命。
数据集最近研究
最新研究方向
在乳腺癌检测领域,RSNA-BSD1K数据集的最新研究方向主要集中在跨域自适应和深度学习模型的优化上。D-MASTER框架通过引入掩码退火技术和自适应置信度细化模块,显著提升了从乳腺X光片中检测乳腺癌的准确性。该研究不仅在MICCAI 2024会议上获得了认可,还为未来的跨域乳腺癌检测研究提供了新的基准。这一进展对于提高乳腺癌早期诊断的准确性和效率具有重要意义,尤其是在不同数据集和临床环境中的应用。
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

光伏电站发电量预估数据

1、准确预测一个地区分布式光伏场站的整体输出功率,可以提高电网的稳定性,增加电网消纳光电能量的能力,在降低能源消耗成本的同时促进低碳能源发展,实现动态供需状态预测的方法,为绿色电力源网荷储的应用落地提供支持。 2、准确预估光伏电站发电量,可以自动发现一些有故障的设备或者低效电站,提升发电效能。1、逆变器及电站数据采集,将逆变器中计算累计发电量数据,告警数据同步到Maxcompute大数据平台 2、天气数据采集, 通过API获取ERA5气象数据包括光照辐射、云量、温度、湿度等 3、数据特征构建, 在大数据处理平台进行数据预处理,用累计发电量矫正小时平均发电功率,剔除异常数据、归一化。告警次数等指标计算 4、异常数据处理, 天气、设备数据根据经纬度信息进行融合, 并对融合后的数据进行二次预处理操作,剔除辐照度和发电异常的一些数据 5、算法模型训练,基于XGBoost算法模型对历史数据进行训练, 生成训练集并保存至OSS 6、算法模型预测,基于XGBoost算法模型接入OSS训练集对增量数据进行预测, 并评估预测准确率等效果数据,其中误差率=(发电量-预估发电量)/发电量,当误差率低于一定阈值时,该数据预测为准确。预测准确率=预测准确数量/预测数据总量。

浙江省数据知识产权登记平台 收录

中国光伏电站空间分布ChinaPV数据集(2015,2020年)

该数据集是中国光伏电站空间分布ChinaPV数据,数据时间为2015和2020年。该数据集以Landsat-8卫星影像为数据源,处理方法是基于GEE遥感云计算平台,运用随机森林分类模型对2020年中国光伏电站进行遥感提取,后经过形态学运算,灯光数据滤除,轮廓细化及目视解译等后处理操作生成。该数据详细描述了中国区域内每个光伏电站的面积和地理位置信息,反映了中国地区光伏电站发展现状及其地域分布规律,以ESRI Shapefile格式存储。

国家地球系统科学数据中心 收录

豆瓣数据集

该数据集通过爬虫技术从豆瓣网站获取了48223条电影数据,并与movielens ml-latest数据集通过共同的imdb字段进行交集处理,最终得到15752条共同数据。数据存储格式为JSON,支持导入到MongoDB或其他数据库使用。

github 收录

OpenSonarDatasets

OpenSonarDatasets是一个致力于整合开放源代码声纳数据集的仓库,旨在为水下研究和开发提供便利。该仓库鼓励研究人员扩展当前的数据集集合,以增加开放源代码声纳数据集的可见性,并提供一个更容易查找和比较数据集的方式。

github 收录

光伏电站数据运行数据集

为EPC公司、可再生能源投资者和金融机构、光伏产业链公司、电站资产管理公司。 提供的光伏电站的全方位运维数据,帮助评估投资风险和回报。

浙江大数据交易服务平台 收录