five

CableInspect-AD|电力线检查数据集|视觉异常检测数据集

收藏
arXiv2024-09-30 更新2024-10-02 收录
电力线检查
视觉异常检测
下载链接:
https://mila-iqia.github.io/cableinspect-ad/
下载链接
链接失效反馈
资源简介:
CableInspect-AD是由加拿大公共事业公司Hydro-Québec的领域专家创建和标注的高质量公开数据集,专门用于机器人电力线检查中的视觉异常检测(VAD)。该数据集包含4798张高分辨率图像,涵盖三种电力线电缆上的6023个标注异常,代表了Hydro-Québec列出的七种最常见缺陷类型,具有不同的严重程度。数据集的创建过程包括使用移动摄像机捕获图像,并进行详细的图像级、像素级和边界框标注,以提供异常的详细分类。该数据集旨在解决现有数据集在捕捉真实世界多样化和意外异常方面的不足,推动VAD技术在复杂真实世界领域的应用。
提供机构:
Mila - 魁北克人工智能研究所, IREQ - Hydro-Québec研究所
创建时间:
2024-09-30
AI搜集汇总
数据集介绍
main_image_url
构建方式
CableInspect-AD数据集由加拿大公共事业公司Hydro-Québec的领域专家创建和标注。该数据集包含4,798张高分辨率图像,涵盖三种电力线电缆,并标注了6,023个异常。专家们精心挑选了七种最常见的缺陷类型,并根据严重程度进行分级。图像通过一个带有移动摄像头的装置进行采集,确保背景均匀,模拟真实世界的机器人场景。标注过程包括图像级、像素级和边界框标注,以提供详细的异常分类和严重程度信息。
特点
CableInspect-AD数据集的显著特点是其高质量和真实世界异常的多样性。数据集包含七种不同类型的异常,每种异常又分为多个严重等级,涵盖了从轻微缺陷到重大结构变形的广泛范围。此外,数据集的标注由领域专家完成,确保了标注的准确性和可靠性。这些特点使得该数据集成为评估视觉异常检测模型在复杂工业环境中性能的理想基准。
使用方法
CableInspect-AD数据集适用于评估和开发视觉异常检测算法。研究人员可以使用该数据集进行模型训练和测试,通过交叉验证策略评估模型性能。数据集的标注信息包括图像级、像素级和边界框标注,支持多种异常检测任务,如分类、定位和分割。此外,数据集还提供了增强的PatchCore算法和Vision-Language模型的评估协议,帮助研究人员在有限标注数据的情况下进行有效的模型评估和改进。
背景与挑战
背景概述
CableInspect-AD数据集由加拿大公共事业公司Hydro-Québec的领域专家创建和注释,旨在解决机器人输电线巡检中的视觉异常检测(VAD)问题。该数据集于2024年发布,包含了4,798张高分辨率图像和6,023个注释异常,涵盖了三种类型的输电线电缆和七种最常见的缺陷类型,具有不同严重级别。CableInspect-AD的创建填补了现有VAD数据集在真实世界场景中多样性和意外异常捕捉不足的空白,为工业异常检测领域提供了高质量的基准数据集。
当前挑战
CableInspect-AD数据集在构建过程中面临多项挑战。首先,收集多样化的异常和名义样本以设定检测阈值是一个复杂的过程。其次,现有VAD方法在受控环境中表现良好,但在真实世界场景中,由于异常的多样性和不可预测性,这些方法的表现受到限制。此外,数据集中包含的异常类型和严重级别的多样性增加了模型检测的难度,特别是对于轻微和难以察觉的异常。这些挑战使得CableInspect-AD成为了一个具有高价值的基准数据集,推动了VAD技术在复杂真实世界领域中的应用和研究。
常用场景
经典使用场景
CableInspect-AD数据集的经典使用场景主要集中在工业视觉异常检测(VAD)领域,特别是在机器人电力线巡检中。该数据集通过提供高分辨率图像和详细的异常标注,为研究人员提供了一个评估和开发新型VAD算法的基准。其挑战性的真实世界异常涵盖了从轻微缺陷到严重结构变形的多种类型和严重程度,使得该数据集成为测试模型在复杂和多样化异常情况下的性能的理想选择。
实际应用
在实际应用中,CableInspect-AD数据集被广泛用于开发和验证用于电力线巡检的机器人系统中的异常检测算法。这些算法通过识别和分类电力线上的各种异常,如断裂、腐蚀和变形,能够显著提高巡检效率和安全性。此外,该数据集的应用还扩展到了其他基础设施监测领域,如铁路和管道,进一步推动了VAD技术在不同行业中的实际应用。
衍生相关工作
CableInspect-AD数据集的发布催生了一系列相关研究工作,特别是在改进PatchCore算法和探索视觉语言模型(VLMs)在零样本VAD任务中的应用方面。例如,Enhanced-PatchCore算法通过仅使用少量标注数据设置检测阈值,显著提升了模型在有限标注数据场景下的适应性和鲁棒性。同时,VLMs在零样本VAD任务中的初步成功也为未来的研究提供了新的方向,特别是在减少对大量标注数据的依赖和提升模型泛化能力方面。
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

Figshare

Figshare是一个在线数据共享平台,允许研究人员上传和共享各种类型的研究成果,包括数据集、论文、图像、视频等。它旨在促进科学研究的开放性和可重复性。

figshare.com 收录

China Health and Nutrition Survey (CHNS)

China Health and Nutrition Survey(CHNS)是一项由美国北卡罗来纳大学人口中心与中国疾病预防控制中心营养与健康所合作开展的长期开放性队列研究项目,旨在评估国家和地方政府的健康、营养与家庭计划政策对人群健康和营养状况的影响,以及社会经济转型对居民健康行为和健康结果的作用。该调查覆盖中国15个省份和直辖市的约7200户家庭、超过30000名个体,采用多阶段随机抽样方法,收集了家庭、个体以及社区层面的详细数据,包括饮食、健康、经济和社会因素等信息。自2011年起,CHNS不断扩展,新增多个城市和省份,并持续完善纵向数据链接,为研究中国社会经济变化与健康营养的动态关系提供了重要的数据支持。

www.cpc.unc.edu 收录

CMNEE(Chinese Military News Event Extraction dataset)

CMNEE(Chinese Military News Event Extraction dataset)是国防科技大学、东南大学和清华大学联合构建的一个大规模的、基于文档标注的开源中文军事新闻事件抽取数据集。该数据集包含17,000份文档和29,223个事件,所有事件均基于预定义的军事领域模式人工标注,包括8种事件类型和11种论元角色。数据集构建遵循两阶段多轮次标注策略,首先通过权威网站获取军事新闻文本并预处理,然后依据触发词字典进行预标注,经领域专家审核后形成事件模式。随后,通过人工分批、迭代标注并持续修正,直至满足既定质量标准。CMNEE作为首个专注于军事领域文档级事件抽取的数据集,对推动相关研究具有显著意义。

github 收录

VisDrone2019

VisDrone2019数据集由AISKYEYE团队在天津大学机器学习和数据挖掘实验室收集,包含288个视频片段共261,908帧和10,209张静态图像。数据集覆盖了中国14个不同城市的城市和乡村环境,包括行人、车辆、自行车等多种目标,以及稀疏和拥挤场景。数据集使用不同型号的无人机在各种天气和光照条件下收集,手动标注了超过260万个目标边界框,并提供了场景可见性、对象类别和遮挡等重要属性。

github 收录

TCGA (The Cancer Genome Atlas)

TCGA数据集包含了多种癌症类型的基因组、转录组和表观遗传学数据,旨在通过大规模的基因组分析来理解癌症的发生和发展机制。

portal.gdc.cancer.gov 收录