用于评估高光谱图像中血液检测的数据集
收藏arXiv2021-03-31 更新2024-06-21 收录
下载链接:
https://doi.org/10.5281/zenodo.3984905
下载链接
链接失效反馈官方服务:
资源简介:
本数据集由理论与应用信息学研究所,波兰科学院创建,旨在为高光谱图像中的血液检测算法开发提供支持。数据集包含多个检测场景,涵盖不同复杂度,允许测试机器学习方法在不同采集环境、背景类型、血液年龄及类似血液物质存在时的表现。数据集通过在线开放许可提供,包含14个高光谱图像,每个约180MB,以及实验源代码和地面实况图,以便复现论文中的结果。该数据集的应用领域包括法医学中的血液检测,旨在解决血液检测中的复杂性和高维度问题,提高检测算法的准确性和可靠性。
This dataset was created by the Institute of Theoretical and Applied Informatics, Polish Academy of Sciences, to support the development of blood detection algorithms for hyperspectral imagery. It encompasses multiple detection scenarios with varying levels of complexity, enabling the assessment of machine learning models' performance across diverse acquisition environments, background types, blood aging stages, and scenarios involving blood-like substances. The dataset is distributed under an open online license, and consists of 14 hyperspectral images (each approximately 180 MB in size), alongside experimental source code and ground truth maps to facilitate the reproduction of results presented in peer-reviewed papers. Its application domains include blood detection in forensic science, where it aims to resolve the complexity and high-dimensionality challenges inherent in blood detection tasks, thereby improving the accuracy and reliability of detection algorithms.
提供机构:
理论与应用信息学研究所,波兰科学院
创建时间:
2020-08-24
搜集汇总
数据集介绍

构建方式
在法医科学领域,高光谱成像技术因其对血红蛋白衍生物的光谱敏感性,成为非接触式血液检测的有力工具。为促进相关算法的发展,本数据集通过精心设计的模拟犯罪现场构建而成。研究团队使用Surface Optics SOC710高光谱相机,在可见光至近红外波段(377-1046纳米)采集了128个波段的数据。场景布置涵盖了多样化的背景材料(如织物、金属、塑料)、不同形态的血液样本以及多种类血物质(如人工血液、番茄酱),并考虑了血液随时间老化的光谱变化。数据采集过程遵循标准化校准流程,包括暗帧去除、光谱与辐射校准,并利用孟塞尔灰色校准板进行反射率归一化,以确保光谱信息的准确性与一致性。
特点
该数据集的核心特点在于其多样性与复杂性,旨在模拟真实犯罪现场中血液检测所面临的多变挑战。数据集包含六个独立场景(A-F),每个场景呈现不同的检测难度:从简单的白色背景到复杂的多材质环境,涵盖了血液与类血物质的混合情况。特别值得注意的是,数据集中包含了血液样本在数周时间跨度内的多次采集,有效捕捉了血红蛋白随时间降解导致的光谱变化,为研究血液老化效应提供了宝贵数据。此外,数据集还提供了详细的像素级标注,区分了明确血液区域与不确定血液区域,并附有外部光谱库参考,支持监督学习与跨场景验证。
使用方法
该数据集主要用于开发和评估高光谱图像中的血液检测算法,尤其适用于目标检测与分类任务。研究人员可采用监督学习方法,利用数据集中提供的血液光谱模板或外部光谱库作为参考,训练匹配滤波器等统计检测器。数据集支持多种实验场景,包括归纳式检测(使用其他图像的光谱模板)和基于光谱库的检测,以评估算法在不同背景、光照及血液老化条件下的鲁棒性。此外,数据集附带的源代码和真实标注图便于复现实验结果,支持性能指标(如AUC-ROC、精确率-召回率曲线)的定量分析,为算法比较与优化提供了标准化基准。
背景与挑战
背景概述
高光谱成像技术凭借其对血红蛋白衍生物的光谱敏感性,成为血液检测领域极具前景的非接触式分析工具。由波兰科学院理论与应用信息研究所的Michał Romaszewski等研究人员于2021年构建的血液检测高光谱图像数据集,旨在应对法医科学中血迹识别与分析的迫切需求。该数据集通过模拟犯罪现场的多变场景,涵盖了不同背景材质、血迹形态、血液存留时间及类血物质干扰等复杂因素,为开发与评估机器学习及信号处理算法提供了标准化测试平台。其公开共享的特性显著推动了高光谱血液检测算法的可比性研究,对法医物证数字化分析的发展产生了实质性影响。
当前挑战
该数据集致力于解决高光谱图像中血迹检测的核心挑战,即如何在复杂背景干扰、光谱混合效应及血液随时间降解的变异下实现精准识别。构建过程中的主要挑战包括:一是模拟真实法医场景的多样性,需协调多种背景材质与类血物质的配置以覆盖不同检测难度;二是保障数据采集的严谨性,涉及高光谱相机的标定、光照稳定性控制以及跨时段采集时血迹光谱变化的准确捕获;三是数据标注的可靠性,要求在多专家协同下依据先验知识与检测器响应,对血迹及类血物质像素进行精确划分,以建立高质量的基准真值。
常用场景
经典使用场景
在法医学与计算机视觉交叉领域,高光谱成像技术因其对血红蛋白衍生物的光谱敏感性,成为非接触式血迹检测的有力工具。该数据集通过模拟犯罪现场场景,构建了包含不同背景材质、血迹形态及类似血液物质的复杂环境,为机器学习算法提供了标准化的测试平台。其经典应用场景在于评估目标检测算法在多变条件下的鲁棒性,例如匹配滤波器等统计检测器在血迹识别中的性能验证,为高光谱图像分析提供了基准参考。
实际应用
在法医物证勘查的实际应用中,该数据集支持开发自动化血迹检测系统,可应用于犯罪现场的大面积快速扫描。其非接触式检测特性避免了化学试剂对DNA样本的污染,同时高光谱成像能够穿透部分表面材质,增强隐蔽血迹的发现概率。数据集模拟的多样化场景,如衣物、刀具及溅射模式,直接对应实际勘查中的常见物证类型,为现场便携式高光谱设备的算法优化提供了真实数据支撑,提升了取证效率与可靠性。
衍生相关工作
基于该数据集,衍生出一系列经典研究工作,推动了高光谱血迹检测领域的算法创新。例如,研究者利用匹配滤波器及其变体进行目标检测性能基准测试,并进一步开发了两阶段检测算法以提升外部光谱库的适应性。同时,数据集促进了空间-光谱联合分析方法的发展,如结合深度学习网络进行血迹像素分类,提高了复杂背景下的识别精度。此外,相关研究还扩展到血迹年龄估计模型构建,以及血迹与类似物质的光谱区分机制探索,为法医学定量分析开辟了新途径。
以上内容由遇见数据集搜集并总结生成



