hyperpspectral-forensics
收藏Hugging Face2025-08-14 更新2025-08-15 收录
下载链接:
https://huggingface.co/datasets/LivingOptics/hyperpspectral-forensics
下载链接
链接失效反馈官方服务:
资源简介:
Living Optics法医数据集包含224张图像,用于法医应用调查。数据集包括RGB图像、稀疏光谱样本、实例分割掩码、白参考光谱和库光谱。数据集标注了249个马血实例和167个血液混淆物实例,共416个标注实例,覆盖22种不同表面。此外,数据集还提供了覆盖350-1000 nm波长范围的高分辨率库光谱。
Living Optics法医数据集包含224张图像,用于法医应用调查。数据集包括RGB图像、稀疏光谱样本、实例分割掩码、白参考光谱和库光谱。数据集标注了249个马血实例和167个血液混淆物实例,共416个标注实例,覆盖22种不同表面。此外,数据集还提供了覆盖350-1000 nm波长范围的高分辨率库光谱。
创建时间:
2025-08-08
原始信息汇总
Living Optics Forensics Dataset 概述
数据集基本信息
- 许可证: lo-license (Living Optics EULA)
- 任务类别: 图像分割、图像分类
- 语言: 英语
- 标签: 法医学、血液检测、血液分类、高光谱
- 数据规模: 10K<n<100K
数据集内容
- 图像数量: 224张
- 数据类型:
- RGB图像
- 稀疏光谱样本
- 实例分割掩码
- 白参考光谱
- 库光谱
- 原始文件: 超过200个唯一原始文件
- 实例数量:
- 马血: 249个实例
- 血液混淆物(如假血、番茄酱): 167个实例
- 总标记实例: 416个
- 库光谱: 波长范围350–1000 nm,分辨率高于Living Optics相机
类别信息
- 总类别数: 25类
- 样本类别: 马血、番茄酱、红色食用染料、假血
- 表面类别: 各种材质和颜色的衬衫、PVC皮革、胶合板等
可视化与示例
- 包含标注示例和可视化图像
使用要求
- 工具:
下载与使用
- 下载地址: Living Optics Cloud Portal
- 示例项目: Spatial Spectral ML
数据集格式与读取
- 详细格式: dataset format
- Python读取示例: 包含完整的代码示例,用于读取和可视化数据集
其他信息
- 未标记数据: 可应要求提供
- 引用: 原始数据可通过请求获取
搜集汇总
数据集介绍

构建方式
在法医学应用研究领域,高光谱成像技术因其独特的光谱分辨能力而备受关注。该数据集通过Living Optics相机系统采集,包含224帧高光谱图像数据,源自200余个原始文件。数据构建过程严谨,不仅包含常规RGB图像,还整合了稀疏光谱采样、实例分割掩码、白参考光谱及实验室光谱等多模态信息。针对不同材质表面上的马血样本及其干扰物(如人造血液、番茄酱等),研究团队系统性地采集了416个标注实例,覆盖22种不同基底材质,确保了数据在法医血迹分析领域的代表性和多样性。
特点
该数据集在光谱法医学领域展现出显著特色,其光谱范围覆盖350-1000nm波段,采样分辨率超越常规高光谱相机。数据集包含25个精细分类类别,涵盖马血样本、常见干扰物质及多种材质表面,每个实例均配备像素级分割标注。独特的实验室光谱数据为算法开发提供了高精度参照,可用于光谱匹配算法开发和异常值过滤。未标注数据的可选扩展进一步增强了数据集的科研灵活性,为半监督学习等前沿方法提供了可能。
使用方法
该数据集需通过专用SDK和数据处理库进行访问,开发者可基于Python生态进行算法开发。典型使用流程包括:通过DatasetReader加载数据,解析RLE编码的分割掩码,提取掩码区域内的光谱特征,并进行可视化分析。数据集支持辐射度和反射率两种光谱单位的转换,配套代码示例展示了如何绘制个体光谱曲线、统计均值及极值范围。研究人员可参考提供的空间-光谱机器学习项目,构建血迹检测与分类模型,或开发新型光谱匹配算法。
背景与挑战
背景概述
高光谱成像技术在法医学领域具有重要应用价值,Living Optics公司开发的Forensics数据集代表了该领域的最新进展。该数据集由Living Optics团队构建,专注于血液检测与分类这一核心法医学问题,包含224幅高光谱图像,涵盖马血、番茄酱等25类样本在不同表面的光谱特征。数据集创新性地整合了RGB图像、稀疏光谱样本、实例分割掩模等多模态数据,并提供了350-1000nm波长范围内的高分辨率光谱库,为法医物证的光谱分析建立了新的基准。
当前挑战
该数据集面临双重技术挑战:在应用层面,不同材质表面对血液光谱特征的干扰使得传统分类算法准确率受限,需要开发具有强抗干扰能力的光谱解耦模型;在构建层面,高光谱数据的高维度特性导致标注成本激增,而样本在非均匀表面的光谱畸变现象对数据采集协议提出了严苛要求。此外,如何有效利用稀疏采样光谱与高分辨率光谱库的互补性,仍是当前算法设计中的关键难题。
常用场景
经典使用场景
在法医学领域,高光谱成像技术因其能够捕捉物质独特的光谱特征而备受关注。该数据集通过提供包含马血、番茄酱、红色食用色素等多种物质的实例分割掩膜和高光谱数据,为研究人员开发精确的血迹检测与分类算法提供了重要基础。数据集中的多类别标注和丰富的光谱信息,使得其在血迹识别与干扰物排除的研究中展现出独特价值。
解决学术问题
该数据集有效解决了法医学中血迹识别面临的复杂背景干扰问题。通过提供22种不同表面上的血迹样本及其干扰物的高光谱数据,研究人员能够深入探究物质在不同材质上的光谱响应特性。这不仅为高光谱图像分割算法提供了基准数据,还为开发基于光谱特征的物质分类模型奠定了坚实基础,推动了法医物证分析技术的进步。
衍生相关工作
基于该数据集,研究社区已衍生出多项重要工作。LivingOptics团队开发的空间光谱机器学习项目展示了如何利用该数据集进行分割和光谱分类算法的训练。此外,该数据集还促进了高光谱图像处理领域的新方法探索,包括基于深度学习的端到端物质识别系统和光谱特征增强技术等创新研究。
以上内容由遇见数据集搜集并总结生成



