five

排水资产生命周期健康管理智能体图像清洗数据集

收藏
天津市数据知识产权登记平台2026-05-18 更新2026-05-29 收录
下载链接:
https://dengji.tjippc.cn/xxgg_nr?id=38011980-19e3-4740-ab1b-2ddca79218a9
下载链接
链接失效反馈
官方服务:
资源简介:
本数据集应用的图像清洗算法用于对原始巡检图像进行自动化清洗、筛选与整理。算法首先采用多线程方式遍历输入目录中的原始图像,对图像进行完整性校验,并依据预设阈值执行分辨率检测、模糊度检测和光照条件检测,剔除损坏图像、低分辨率图像、模糊图像以及过暗或过亮图像,通过计算拉普拉斯方差值评估图像清晰度,通过平均灰度值评估图像亮度,通过像素方差评估图像信息量。随后,算法结合精确哈希(SHA256)与感知哈希(pHash)对图像进行重复性判定,去除内容完全重复或高度相似的图像,以保证样本数据的唯一性。在此基础上,算法进一步利用预训练深度神经网络 ResNet50提取图像特征向量,并通过Isolation Forest异常检测模型识别语义异常样本,从而剔除与业务场景不一致的异常图像。处理完成后,算法将保留的高质量图像输出至 cleaned_data/文件夹,将剔除图像按照异常类型分类存放至discarded_data/文件夹,并同步生成日志文件及Excel登记表,对图像文件名、文件路径、分辨率(图像宽度、图像高度)、哈希值、清晰度、平均亮度、处理状态及淘汰原因等字段进行记录。该算法实现了对原始巡检图像的规则化清洗、结构化筛选和分类整理,为后续人工标注与目标检测模型训练提供标准化基础数据。
提供机构:
中国市政工程华北设计研究总院有限公司
创建时间:
2026-05-15
搜集汇总
数据集介绍
main_image_url
背景与挑战
背景概述
该数据集专注于排水资产生命周期健康管理的智能体图像清洗,包含1032条每日更新的巡检图像元数据,通过自动化算法对多源图像(固定相机、无人机等)进行分辨率、模糊度、亮度及重复性检测,剔除低质量图像,形成高质量标准化数据集,用于供水管网巡检、设备状态识别及智慧水务平台AI模型训练,提升巡检效率和运维决策质量。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作