five

Valeo Anomaly Dataset (VAD)

收藏
github2024-05-14 更新2024-05-31 收录
下载链接:
https://github.com/abc-125/vad
下载链接
链接失效反馈
官方服务:
资源简介:
VAD数据集的所有图像均从实际生产线捕获,展示了从非常明显到极其微妙的各种缺陷。该数据集弥合了学术界和工业界之间的差距,为研究人员提供了提升方法性能以应对更复杂的现实世界挑战的机会。

All images in the VAD dataset are captured from actual production lines, showcasing a range of defects from very obvious to extremely subtle. This dataset bridges the gap between academia and industry, providing researchers with the opportunity to enhance method performance to tackle more complex real-world challenges.
创建时间:
2024-05-12
原始信息汇总

Valeo Anomaly Dataset (VAD)

数据集概述

  • 来源:VAD数据集中的所有图像均来自实际生产线,展示了从明显到极其微妙的多种缺陷。
  • 目的:旨在连接学术界与工业界,为研究人员提供机会,以提升处理复杂现实世界挑战的方法性能。

数据结构

shell vad |-- test |-----|--bad |-----|--bad_unseen_defects |-----|--good |-- train |-----|--bad |-----|--good |-- low_shot_train.json

数据详情

  • 训练集:包含1000张缺陷图像和2000张正常图像。
  • 测试集:包含1000张缺陷图像,其中165张为未见过的缺陷类型,以及1000张正常图像。
  • 缺陷类型:包含超过20种缺陷类型,详细信息见论文附录C。

许可证

VAD数据集遵循CC BY-NC-SA 4.0许可证。

引用信息

若使用此数据集,请引用以下论文:

@misc{baitieva2024supervised, title={Supervised Anomaly Detection for Complex Industrial Images}, author={Aimira Baitieva and David Hurych and Victor Besnier and Olivier Bernard}, year={2024}, eprint={2405.04953}, archivePrefix={arXiv}, primaryClass={cs.CV} }

搜集汇总
数据集介绍
main_image_url
构建方式
Valeo Anomaly Dataset (VAD) 的构建基于实际生产线上的图像采集,涵盖了从显著到极其细微的各种缺陷类型。该数据集通过提供多样化的缺陷样本,旨在弥合学术研究与工业应用之间的差距,为研究者提供了一个真实且复杂的挑战环境。训练集包含1000张缺陷图像和2000张正常图像,而测试集则包含1000张缺陷图像,其中165张为训练集中未见过的罕见缺陷类型。
特点
VAD 数据集的显著特点在于其真实性和多样性。数据集不仅包含了20多种不同类型的缺陷,还特别引入了训练集中未见过的罕见缺陷,以模拟更为复杂的实际应用场景。此外,数据集的结构设计与MVTec AD相似,便于研究者进行方法的迁移和对比。这种设计使得VAD成为评估异常检测算法在复杂工业图像中表现的有力工具。
使用方法
使用VAD数据集时,用户首先需下载数据集并解压。随后,可以通过运行`create_low_shot_train.py`脚本生成低样本基准的训练集,或通过设置`--vad_path`参数指定数据集路径。数据集的结构清晰,分为训练集和测试集,便于直接应用于各种异常检测算法的训练与评估。用户可根据具体需求调整数据集的使用方式,以适应不同的研究或应用场景。
背景与挑战
背景概述
Valeo Anomaly Dataset (VAD) 是由Valeo公司创建的一个专注于工业图像异常检测的数据集,旨在弥合学术研究与工业应用之间的鸿沟。该数据集采集自实际生产线,包含了多种缺陷类型,从明显的瑕疵到极其微小的异常,覆盖了广泛的工业检测需求。VAD的发布时间为2024年,主要研究人员包括Aimira Baitieva、David Hurych、Victor Besnier和Olivier Bernard,其核心研究问题是如何在复杂的工业图像中进行有效的异常检测。VAD不仅为学术界提供了丰富的研究素材,也为工业界提供了一个标准化的测试平台,推动了异常检测技术在实际应用中的进步。
当前挑战
VAD数据集在构建过程中面临了多重挑战。首先,如何从实际生产线中捕捉到多样化的缺陷样本,尤其是那些极其微小且罕见的异常,是一个技术难题。其次,数据集的标注工作需要极高的专业性和准确性,以确保每一种缺陷都能被正确识别和分类。此外,VAD还引入了未见过的缺陷类型,这为模型在实际应用中的泛化能力提出了更高的要求。在解决领域问题方面,VAD面临的挑战是如何在复杂的工业环境中,利用有限的训练数据实现高效的异常检测,尤其是在处理未见过的缺陷时,模型的鲁棒性和准确性显得尤为重要。
常用场景
经典使用场景
Valeo Anomaly Dataset (VAD) 在工业图像异常检测领域展现了其经典应用场景。该数据集通过捕捉实际生产线上的多样化缺陷,从显著的瑕疵到极其微小的异常,为研究人员提供了一个真实且复杂的测试平台。其结构与MVTec AD相似,便于研究人员快速上手,尤其是在处理低样本基准测试时,通过提供的脚本可以轻松生成低样本训练集。
实际应用
在实际应用中,VAD 数据集为工业生产线上的质量控制提供了强有力的支持。通过训练和测试模型,企业能够实时检测产品中的缺陷,从而提高生产效率和产品质量。特别是在汽车制造、电子产品组装等领域,VAD 的应用能够帮助企业快速识别并处理生产过程中的异常,减少废品率和返工成本,显著提升整体生产效益。
衍生相关工作
VAD 数据集的发布激发了大量相关研究工作,特别是在异常检测和工业图像分析领域。许多研究者基于该数据集开发了新的检测算法,探索了不同类型的缺陷识别方法,并提出了改进的模型训练策略。此外,VAD 还促进了跨领域的研究合作,如与计算机视觉、机器学习等领域的结合,进一步推动了工业图像处理技术的创新与发展。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作