five

NetherlandsForensicInstitute/vuurwerkverkenner-data

收藏
Hugging Face2024-03-22 更新2024-06-22 收录
下载链接:
https://hf-mirror.com/datasets/NetherlandsForensicInstitute/vuurwerkverkenner-data
下载链接
链接失效反馈
官方服务:
资源简介:
Vuurwerkverkenner数据集用于将爆炸烟花碎片链接到其原始烟花类型。该数据集由荷兰法医研究所在案件调查中研究的各种烟花组成,包含185个类别和332个独特的烟花包装。数据集的组织结构包括多个文件夹,每个文件夹对应一个烟花类别,包含包装的扫描图像和其他相关图像。元数据文件`meta.json.gz`存储了每个类别的元数据和参考嵌入。参考嵌入由AI模型生成,用于匹配烟花碎片和包装。元数据包括包装上的文本、危险等级、烟花类型、烟花类别、管长、管径、主装药成分、其他混合物成分、主装药质量和其他混合物质量等信息。

Vuurwerkverkenner数据集用于将爆炸烟花碎片链接到其原始烟花类型。该数据集由荷兰法医研究所在案件调查中研究的各种烟花组成,包含185个类别和332个独特的烟花包装。数据集的组织结构包括多个文件夹,每个文件夹对应一个烟花类别,包含包装的扫描图像和其他相关图像。元数据文件`meta.json.gz`存储了每个类别的元数据和参考嵌入。参考嵌入由AI模型生成,用于匹配烟花碎片和包装。元数据包括包装上的文本、危险等级、烟花类型、烟花类别、管长、管径、主装药成分、其他混合物成分、主装药质量和其他混合物质量等信息。
提供机构:
NetherlandsForensicInstitute
原始信息汇总

Vuurwerkverkenner 数据集

概述

Vuurwerkverkenner 数据集用于链接爆炸烟花片段与原始烟花类型。该数据集包含荷兰法医研究所调查案件中涉及的不同类型的烟花。

类别

烟花包装在视觉上非常相似时,可能会被归入同一类别。大多数情况下,一个包装与其他包装不相似,因此一个类别仅包含一个独特的包装。

内容

数据集包含 185 个类别,总计 332 个独特包装。数据集的组织结构如下:

vuurwerkverkenner-data └───fireworks_0 └─── wrappers └─── 0 └─── wrapper.jpg └─── compleet exemplaar.jpg └─── gedemonteerd.jpg └─── 1 └─── wrapper.jpg └─── compleet exemplaar.jpg └─── gedemonteerd.jpg └───fireworks_1 └─── wrappers └─── 0 └─── wrapper.jpg └───meta.json.gz

  • 第一级文件夹(如 fireworks_0fireworks_1 等)对应类别。
  • 第三级文件夹(如 01 等)对应类别内的包装。
  • 每个包装包含一个或多个图像,其中 wrapper.jpg 是完整的包装扫描图像,还可能包含整个烟花物品或其内容的示意图。

元数据

meta.json.gz 文件包含烟花类别的元数据和参考嵌入。结构如下:

{ 0: { "embeddings": [[...], [...], ...], "wrappers": [ 0: { "wrapper_text": "abcdef", "article_name": "abc", ... }, 1: {...}, 2: {...} ] }, 1: {...} }

  • 第一级(如 meta[0]meta[1] 等)表示烟花类别,对应照片文件夹的第一级(如 meta[0] 对应 fireworks_0 文件夹)。
  • 每个类别包含参考嵌入和每个包装的元数据。
  • 第三级(如 meta[0][wrappers][0])表示类别内的包装,对应照片文件夹(如 fireworks_0/wrappers/0)。

参考嵌入

每个类别提供参考嵌入,由训练用于创建烟花包装和爆炸包装片段嵌入的 AI 模型生成。更多关于模型的详细信息,请参见 这里

元数据字段

每个包装的元数据字段描述如下:

字段 描述
text 包装上的完整文本(不包括非拉丁字母)。
endangerment 烟花相关的危险或风险等级。
article_name 物品名称。
firework_type 烟花类型。
firework_category 烟花的类别或分类。
tube_length 管的长度。
tube_diameter 管的直径。
composition_burst_charge 烟花主炸药的成分。
composition_other_mixtures 烟花其他炸药的成分。
mass_burst_charge 主炸药的质量。
mass_other_mixtures 其他炸药的质量。
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作