NetherlandsForensicInstitute/vuurwerkverkenner-data
收藏Hugging Face2024-03-22 更新2024-06-22 收录
下载链接:
https://hf-mirror.com/datasets/NetherlandsForensicInstitute/vuurwerkverkenner-data
下载链接
链接失效反馈官方服务:
资源简介:
Vuurwerkverkenner数据集用于将爆炸烟花碎片链接到其原始烟花类型。该数据集由荷兰法医研究所在案件调查中研究的各种烟花组成,包含185个类别和332个独特的烟花包装。数据集的组织结构包括多个文件夹,每个文件夹对应一个烟花类别,包含包装的扫描图像和其他相关图像。元数据文件`meta.json.gz`存储了每个类别的元数据和参考嵌入。参考嵌入由AI模型生成,用于匹配烟花碎片和包装。元数据包括包装上的文本、危险等级、烟花类型、烟花类别、管长、管径、主装药成分、其他混合物成分、主装药质量和其他混合物质量等信息。
Vuurwerkverkenner数据集用于将爆炸烟花碎片链接到其原始烟花类型。该数据集由荷兰法医研究所在案件调查中研究的各种烟花组成,包含185个类别和332个独特的烟花包装。数据集的组织结构包括多个文件夹,每个文件夹对应一个烟花类别,包含包装的扫描图像和其他相关图像。元数据文件`meta.json.gz`存储了每个类别的元数据和参考嵌入。参考嵌入由AI模型生成,用于匹配烟花碎片和包装。元数据包括包装上的文本、危险等级、烟花类型、烟花类别、管长、管径、主装药成分、其他混合物成分、主装药质量和其他混合物质量等信息。
提供机构:
NetherlandsForensicInstitute
原始信息汇总
Vuurwerkverkenner 数据集
概述
Vuurwerkverkenner 数据集用于链接爆炸烟花片段与原始烟花类型。该数据集包含荷兰法医研究所调查案件中涉及的不同类型的烟花。
类别
烟花包装在视觉上非常相似时,可能会被归入同一类别。大多数情况下,一个包装与其他包装不相似,因此一个类别仅包含一个独特的包装。
内容
数据集包含 185 个类别,总计 332 个独特包装。数据集的组织结构如下:
vuurwerkverkenner-data └───fireworks_0 └─── wrappers └─── 0 └─── wrapper.jpg └─── compleet exemplaar.jpg └─── gedemonteerd.jpg └─── 1 └─── wrapper.jpg └─── compleet exemplaar.jpg └─── gedemonteerd.jpg └───fireworks_1 └─── wrappers └─── 0 └─── wrapper.jpg └───meta.json.gz
- 第一级文件夹(如
fireworks_0、fireworks_1等)对应类别。 - 第三级文件夹(如
0、1等)对应类别内的包装。 - 每个包装包含一个或多个图像,其中
wrapper.jpg是完整的包装扫描图像,还可能包含整个烟花物品或其内容的示意图。
元数据
meta.json.gz 文件包含烟花类别的元数据和参考嵌入。结构如下:
{ 0: { "embeddings": [[...], [...], ...], "wrappers": [ 0: { "wrapper_text": "abcdef", "article_name": "abc", ... }, 1: {...}, 2: {...} ] }, 1: {...} }
- 第一级(如
meta[0]、meta[1]等)表示烟花类别,对应照片文件夹的第一级(如meta[0]对应fireworks_0文件夹)。 - 每个类别包含参考嵌入和每个包装的元数据。
- 第三级(如
meta[0][wrappers][0])表示类别内的包装,对应照片文件夹(如fireworks_0/wrappers/0)。
参考嵌入
每个类别提供参考嵌入,由训练用于创建烟花包装和爆炸包装片段嵌入的 AI 模型生成。更多关于模型的详细信息,请参见 这里。
元数据字段
每个包装的元数据字段描述如下:
| 字段 | 描述 |
|---|---|
text |
包装上的完整文本(不包括非拉丁字母)。 |
endangerment |
烟花相关的危险或风险等级。 |
article_name |
物品名称。 |
firework_type |
烟花类型。 |
firework_category |
烟花的类别或分类。 |
tube_length |
管的长度。 |
tube_diameter |
管的直径。 |
composition_burst_charge |
烟花主炸药的成分。 |
composition_other_mixtures |
烟花其他炸药的成分。 |
mass_burst_charge |
主炸药的质量。 |
mass_other_mixtures |
其他炸药的质量。 |



