LOCO-Annotations|工业异常检测数据集|机器视觉数据集

github2024-06-10 更新2024-06-12 收录

工业异常检测

机器视觉

下载链接：

https://github.com/22strongestme/LOCO-Annotations

下载链接

链接失效反馈

资源简介：

LOCO-Annotations数据集是一个专门为评估逻辑异常检测框架如LogiCode而设计的自定义数据集。它是MVTec LOCO数据集的扩展，专注于工业环境中的逻辑异常。该数据集包含2908张精心标注的图像，分为1772张训练图像和1136张测试图像，涵盖早餐盒、螺丝袋、推钉、拼接连接器、果汁瓶等多个类别。每个图像都附有详细的JSON文件，提供像素级对象分割和地面实况标注。

The LOCO-Annotations dataset is a custom dataset specifically designed for evaluating logical anomaly detection frameworks such as LogiCode. It is an extension of the MVTec LOCO dataset, focusing on logical anomalies in industrial environments. The dataset contains 2908 meticulously annotated images, divided into 1772 training images and 1136 test images, covering multiple categories such as breakfast boxes, screw bags, push pins, splice connectors, and juice bottles. Each image is accompanied by a detailed JSON file providing pixel-level object segmentation and ground truth annotations.

创建时间：

2024-06-07

原始信息汇总

LOCO-Annotations 数据集概述

数据集描述

图像数量: 2908张图像
- 训练集: 1772张
- 测试集: 1136张
涉及类别:
- 早餐盒
- 螺丝袋
- 推钉
- 拼接连接器
- 果汁瓶
图像特征: 每张图像附带详细的JSON文件，提供像素级对象分割和地面实况标注。

异常类型

数量异常: 对象数量与预期不符。
尺寸异常: 对象尺寸超出正常范围。
位置异常: 对象位置不符合预定义规则。
匹配异常: 对象特征（如颜色或类型）与预期标准不匹配。

数据集格式

名称: LOCO
内容: 逻辑异常
类型: 多种类别
数量: 1772（训练）+ 1136（测试）
文件格式: JSON

AI搜集汇总

数据集介绍

构建方式

在工业逻辑异常检测领域，LOCO-Annotations数据集应运而生，其构建基于MVTec LOCO数据集的扩展。该数据集精心挑选并标注了2908张图像，其中1772张用于训练，1136张用于测试。这些图像涵盖早餐盒、螺丝袋、图钉、拼接连接器和果汁瓶等多个类别。每张图像均附有详细的JSON文件，提供像素级的对象分割和地面实况标注，标注格式为“异常类型：具体原因”，以明确每个逻辑异常的识别依据。

特点

LOCO-Annotations数据集的显著特点在于其专注于逻辑异常的检测，包括数量异常、尺寸异常、位置异常和匹配异常等多种类型。这些异常类型均在工业环境中具有实际应用价值，且数据集的标注精细，能够为模型提供准确的训练和测试环境。此外，数据集的多样性和广泛性确保了其在不同工业场景中的适用性。

使用方法

使用LOCO-Annotations数据集时，用户可从指定链接下载数据集，并利用提供的JSON文件进行模型评估。通过将模型输出与地面实况标注进行比较，可以有效评估逻辑异常检测框架的性能。为确保学术研究的严谨性，使用该数据集的研究应引用相关文献，以支持其研究成果的可信度和影响力。

背景与挑战

背景概述

LOCO-Annotations数据集是为评估逻辑异常检测框架（如LogiCode）性能而专门设计的一个自定义数据集。该数据集作为MVTec LOCO数据集的扩展，专注于工业环境中的逻辑异常。由2908张精心标注的图像组成，分为1772张训练图像和1136张测试图像，涵盖早餐盒、螺丝袋、图钉、拼接连接器和果汁瓶等多个类别。每张图像均附有详细的JSON文件，提供像素级对象分割和地面实况标注，标注格式为“异常类型：具体原因”，以明确每个识别出的逻辑异常的原因。该数据集由Yiheng Zhang、Yunkang Cao、Xiaohao Xu和Weiming Shen等研究人员于2024年创建，旨在推动逻辑异常检测技术的发展，特别是在工业应用中的实际应用。

当前挑战

LOCO-Annotations数据集在构建过程中面临多项挑战。首先，逻辑异常的定义和识别需要高度专业化的知识和精细的标注，这增加了数据集创建的复杂性。其次，数据集涵盖的类别多样，每种类别都有其独特的异常类型和原因，这要求标注者具备跨领域的专业知识。此外，确保标注的一致性和准确性也是一个重大挑战，因为逻辑异常的细微差别可能导致不同的标注结果。最后，数据集的评估需要与现有的逻辑异常检测框架进行对比，这要求模型输出与地面实况标注之间的高度一致性，以确保评估的公正性和有效性。

常用场景

经典使用场景

在工业自动化领域，LOCO-Annotations数据集被广泛应用于逻辑异常检测框架的性能评估。该数据集通过提供2908张精细标注的图像，涵盖早餐盒、螺丝袋、图钉、接线端子和果汁瓶等多个类别，为研究者提供了一个全面的测试平台。这些图像不仅包含像素级的对象分割，还附有详细的JSON文件，详细记录了每种逻辑异常的具体原因，如数量异常、尺寸异常、位置异常和匹配异常。通过对比模型输出与真实标注，研究者能够精确评估逻辑异常检测算法的有效性和鲁棒性。

实际应用

在实际应用中，LOCO-Annotations数据集为工业自动化系统提供了强大的支持。通过使用该数据集训练和验证的逻辑异常检测模型，企业能够实时监控生产线上的逻辑错误，如产品数量不符、尺寸偏差、位置错放和匹配不当等问题。这不仅提高了生产效率，还显著降低了因逻辑错误导致的质量问题和生产损失。此外，该数据集的应用还扩展到智能仓储和物流管理等领域，帮助企业实现更精细化的运营管理。

衍生相关工作

LOCO-Annotations数据集的发布催生了一系列相关的经典工作。例如，基于该数据集的研究论文《LogiCode: an LLM-Driven Framework for Logical Anomaly Detection》提出了一种由大型语言模型驱动的逻辑异常检测框架，显著提升了检测精度和效率。此外，该数据集还激发了多篇关于逻辑异常检测算法优化的研究，推动了深度学习在工业自动化中的应用。这些衍生工作不仅丰富了逻辑异常检测的理论体系，也为实际应用提供了强有力的技术支持。

以上内容由AI搜集并总结生成

用户留言

有没有相关的论文或文献参考？

这个数据集是基于什么背景创建的？

数据集的作者是谁？

能帮我联系到这个数据集的作者吗？

这个数据集如何下载？

点击留言

数据主题

具身智能

数据集 4098个

机构 8个

大模型

数据集 439个

机构 10个

无人机

数据集 37个

机构 6个

指令微调

数据集 36个

机构 6个

蛋白质结构

数据集 50个

机构 8个

空间智能

数据集 21个

机构 5个

5,000+

优质数据集

54 个

任务类型

进入经典数据集

热门数据集

中国区域交通网络数据集

该数据集包含中国各区域的交通网络信息，包括道路、铁路、航空和水路等多种交通方式的网络结构和连接关系。数据集详细记录了各交通节点的位置、交通线路的类型、长度、容量以及相关的交通流量信息。

data.stats.gov.cn 收录

UniProt

UniProt（Universal Protein Resource）是全球公认的蛋白质序列与功能信息权威数据库，由欧洲生物信息学研究所（EBI）、瑞士生物信息学研究所（SIB）和美国蛋白质信息资源中心（PIR）联合运营。该数据库以其广度和深度兼备的蛋白质信息资源闻名，整合了实验验证的高质量数据与大规模预测的自动注释内容，涵盖从分子序列、结构到功能的全面信息。UniProt核心包括注释详尽的UniProtKB知识库（分为人工校验的Swiss-Prot和自动生成的TrEMBL），以及支持高效序列聚类分析的UniRef和全局蛋白质序列归档的UniParc。其卓越的数据质量和多样化的检索工具，为基础研究和药物研发提供了无可替代的支持，成为生物学研究中不可或缺的资源。

www.uniprot.org 收录

AISHELL/AISHELL-1

Aishell是一个开源的中文普通话语音语料库，由北京壳壳科技有限公司发布。数据集包含了来自中国不同口音地区的400人的录音，录音在安静的室内环境中使用高保真麦克风进行，并下采样至16kHz。通过专业的语音标注和严格的质量检查，手动转录的准确率超过95%。该数据集免费供学术使用，旨在为语音识别领域的新研究人员提供适量的数据。

hugging_face 收录

CE-CSL

CE-CSL数据集是由哈尔滨工程大学智能科学与工程学院创建的中文连续手语数据集，旨在解决现有数据集在复杂环境下的局限性。该数据集包含5,988个从日常生活场景中收集的连续手语视频片段，涵盖超过70种不同的复杂背景，确保了数据集的代表性和泛化能力。数据集的创建过程严格遵循实际应用导向，通过收集大量真实场景下的手语视频材料，覆盖了广泛的情境变化和环境复杂性。CE-CSL数据集主要应用于连续手语识别领域，旨在提高手语识别技术在复杂环境中的准确性和效率，促进聋人与听人社区之间的无障碍沟通。

arXiv 收录

DALY

DALY数据集包含了全球疾病负担研究（Global Burden of Disease Study）中的伤残调整生命年（Disability-Adjusted Life Years, DALYs）数据。该数据集提供了不同国家和地区在不同年份的DALYs指标，用于衡量因疾病、伤害和早逝导致的健康损失。

ghdx.healthdata.org 收录