SemilleroCV/DMR-IR
收藏Hugging Face2025-11-23 更新2025-07-05 收录
下载链接:
https://hf-mirror.com/datasets/SemilleroCV/DMR-IR
下载链接
链接失效反馈官方服务:
资源简介:
DMR-IR是一个红外成像数据库,用于哺乳研究,包括从Antônio Pedro University Hospital获取的TIFF格式的原始温度图像和通过临床元数据生成的文本提示。数据集用于乳腺成像和诊断分析研究。
DMR-IR is an infrared imaging database for Mamma Research, including TIFF raw temperature images and clinical metadata-generated text prompts from data acquired at Antônio Pedro University Hospital. The dataset is used for breast imaging and diagnostic analysis research.
提供机构:
SemilleroCV
搜集汇总
数据集介绍

构建方式
在乳腺医学影像研究领域,DMR-IR数据集的构建体现了严谨的临床数据采集与系统性处理流程。该数据集源于安东尼奥·佩德罗大学医院的临床实践,通过高灵敏度FLIR SC620热像仪采集原始红外温度矩阵,并整合了数字化乳腺X线摄影及丰富的临床元数据。构建过程遵循了严格的伦理审查规范,随后通过定制化处理流程,将原始温度数据转换为标准TIFF格式,并利用临床元数据自动生成描述性文本提示,从而构建了一个支持多模态研究的、包含训练集、验证集和测试集的标准化数据集。
特点
DMR-IR数据集以其多模态与高维度临床信息集成而著称。核心特征在于其不仅提供了高分辨率的原始热成像图像,还囊括了极其详尽的临床元数据,涵盖患者人口统计学信息、生活习惯、病史、检查协议及手术记录等多个维度。尤为突出的是,数据集通过自动化流程生成了与图像对应的文本描述,并包含了分割掩码与文本嵌入向量,为开发结合视觉与文本信息的先进机器学习模型提供了理想的基础设施。这种结构设计旨在促进对乳腺癌诊断中红外影像特征与临床背景之间复杂关联的深入探索。
使用方法
该数据集主要服务于乳腺成像与诊断分析的研究社群。研究人员可通过HuggingFace平台的标准接口加载数据集,其已预分割为训练、验证与测试子集,便于直接用于模型开发与评估。典型应用场景包括训练和测试红外图像处理算法、探索影像特征与临床变量的相关性,以及开发基于图像与文本提示的多模态分类或生成模型。使用时应严格遵守数据许可与隐私规范,鉴于其临床数据的敏感性,不建议将其用于直接的临床决策,而应作为算法研究与验证的宝贵资源。
背景与挑战
背景概述
DMR-IR热成像乳腺癌数据集由巴西安东尼奥·佩德罗大学医院于2014年创建,主要研究人员包括Silva、Saade、Sequeiros等人,其核心研究问题聚焦于利用红外热成像技术辅助乳腺癌的早期筛查与诊断。该数据集整合了高分辨率热成像图像、数字化乳腺X光片及丰富的临床元数据,为医学影像分析领域提供了多模态研究基础。通过引入自动生成的文本描述,该数据集推动了视觉-语言模型在医疗诊断中的应用,对提升乳腺癌检测的自动化与精准度具有显著影响力。
当前挑战
该数据集旨在解决乳腺癌红外热成像分类与诊断中的关键挑战,包括热成像图像中细微温度模式的有效提取、多模态数据(如图像与临床文本)的融合分析,以及模型在跨人口统计学群体中的泛化能力。在构建过程中,挑战主要源于临床元数据的质量控制与标准化,例如手动标注乳房切除状态、纠正数据异常,以及处理敏感个人信息时的伦理与隐私合规问题。此外,热成像数据的校准与文本提示的自动生成依赖于特定解析工具,其准确性直接影响下游任务的可靠性。
常用场景
经典使用场景
在乳腺影像学领域,DMR-IR数据集为红外热成像技术的算法开发提供了关键支撑。该数据集整合了高分辨率热成像图像与丰富的临床元数据,使得研究者能够构建并验证基于深度学习的图像分类模型,特别是针对良性与恶性乳腺病变的自动鉴别。通过生成描述性文本提示,数据集进一步促进了多模态学习框架的探索,将视觉特征与临床上下文信息相结合,从而提升诊断模型的解释性与鲁棒性。
解决学术问题
该数据集有效应对了医学影像分析中数据稀缺与多模态融合的挑战。通过提供标准化的热成像图像及其关联的临床元数据,它支持研究者深入探究红外特征与病理状态之间的相关性,为无创诊断方法的学术验证奠定基础。其意义在于推动了跨模态学习在乳腺癌早期检测中的应用,促进了计算机辅助诊断系统向更精准、可解释的方向演进,对提升医疗影像研究的可重复性具有重要影响。
衍生相关工作
围绕DMR-IR数据集,已衍生出多项经典研究工作。例如,基于该数据集的视觉-语言变换器模型被提出,用于融合热成像与临床文本信息以提升分类性能。此外,相关研究还探索了利用生成式提示增强多模态表征学习的方法,推动了红外影像与元数据协同分析的技术进展。这些工作不仅拓展了数据集的学术价值,也为乳腺癌热成像诊断的自动化与智能化提供了新的方法论框架。
以上内容由遇见数据集搜集并总结生成



