ventilatsiooni-loorid

Hugging Face2026-05-16 更新2026-05-17 收录

下载链接：

https://huggingface.co/datasets/kulimuli/ventilatsiooni-loorid

下载链接

链接失效反馈

官方服务：

资源简介：

Ventilatsiooni Lõõride AI Andmekogu（通风管道AI数据集）是一个用于通风系统自动化视觉检查的计算机视觉数据集，源自通风系统摄像头检查AI项目，旨在训练AI模型以检测建筑通风管道内部的缺陷与结构特征。数据采集自爱沙尼亚塔尔图市一栋5层公寓楼的通风系统，包含6个垂直竖井和30个通风管道（lõõr），管道由混凝土板构成，尺寸约为12x18厘米，深度约14-15米。数据集核心内容为通过管道镜（Borescope）拍摄的30个ASF格式视频，这些视频被处理为图像帧用于模型训练：总计从视频中以每秒2帧的速率提取了6,533帧图像，其中5,224帧用于训练，1,309帧用于验证。此外，包含126帧带有金标准人工标注的图像以及对应的126个人工检测发现。数据集还提供了结构化的元数据文件：`tartu_aruanne.json` 详细记录了30个管道的属性信息；`projekt_kokkuvote.json` 提供了项目摘要。数据集专为训练目标检测模型（特别是YOLO11n架构）而设计，标注类别涵盖通风管道内常见的八类目标：台阶/不平整（aste）、开口（ava）、凹陷（süvend）、偏移/错位（nihe）、堵塞（ummistus）、补丁管（plekktoru）、分叉（hargnemine）以及格栅（rest）。初步模型评估结果显示，整体启发式命中率为56.3%，最佳检测类别为liitekoht（接头处，80.3%），而ava（开口）类别的检测精度较低（48.6%），是需要改进的重点。该数据集为私有数据集，使用需遵循特定协议。

Ventilatsiooni Lõõride AI Andmekogu (Ventilation Duct AI Dataset) is a computer vision dataset for automated visual inspection of ventilation systems. It originates from the Ventilation System Camera Inspection AI project and aims to train AI models to detect defects and structural features inside building ventilation ducts. The data was collected from the ventilation system of a 5-story apartment building in Tartu, Estonia, which includes 6 vertical shafts and 30 ventilation ducts (lõõr). The ducts are made of concrete slabs, with dimensions of approximately 12x18 cm and a depth of about 14-15 meters. The core of the dataset consists of 30 ASF-format videos captured via a borescope, which were processed into image frames for model training: a total of 6,533 frames extracted at 2 frames per second, with 5,224 frames for training and 1,309 for validation. Additionally, it includes 126 frames with gold-standard manual annotations and corresponding 126 manual inspection findings. The dataset provides structured metadata files: `tartu_aruanne.json` details the attribute information of the 30 ducts, and `projekt_kokkuvote.json` offers a project summary. It is designed for training object detection models, particularly the YOLO11n architecture, with annotation categories covering eight common targets inside ventilation ducts: step/unevenness (aste), opening (ava), depression (süvend), offset/misalignment (nihe), blockage (ummistus), patch pipe (plekktoru), branching (hargnemine), and grating (rest). Preliminary model evaluation results show an overall heuristic hit rate of 56.3%, with the best detection category being liitekoht (joint, 80.3%), while the ava (opening) category has lower accuracy (48.6%), highlighting areas for improvement. The dataset is private and requires adherence to specific protocols for use.

创建时间：

2026-05-07

原始信息汇总

数据集概述：Ventilatsiooni Lõõride AI Andmekogu

该数据集专注于爱沙尼亚塔尔图市一栋公寓楼的通风管道（lõõrid）检测，旨在通过AI模型分析管道状态，提升建筑检查效率。

项目背景

建筑信息：位于 Tartu, Kaunase pst 65 的一栋5层公寓楼，含1个楼梯间、15套公寓、6个竖井、30条通风管道。
管道规格：混凝土面板竖井，尺寸约 12x18 cm，深度约 14-15 m。

数据构成

组件	数量
视频文件	30 个 ASF 格式文件
总帧数（2 fps）	6,533 帧
训练帧	5,224 帧
验证帧	1,309 帧
黄金标准帧	126 帧
人工标注次数	126 次

AI 模型

架构：YOLO11n（2.6M 参数）
检测类别：台阶（aste）、开口（ava）、凹槽（süvend）、错位（nihe）、堵塞（ummistus）、金属管道（plekktoru）、分支（hargnemine）、网格（rest）
训练状态：等待 GPU 额度以启动训练

性能结果

指标	值
启发式命中率	56.3%
最佳类别（连接处）	80.3%
需改进类别（开口）	48.6%

文件与工具

tartu_aruanne.json：30个管道的结构化数据库
projekt_kokkuvote.json：项目总结
generate_report.py：AI 报告生成脚本
extract_tartu_json.py：PDF 转 JSON 转换器
*.ASF：管道内窥镜视频文件

下一步计划

通过 HuggingFace 账单获取 GPU 额度，训练 YOLO11n 模型。
作为替代方案，使用 Google Colab 的免费 T4 GPU。
手动标注约 50 帧以提高精度。

许可与作者

许可：私有数据集，使用需协商。
作者：Vendipuhastus OÜ, Merilin Heinsaar；AI 开发：ML Intern (HuggingFace)

搜集汇总

数据集介绍

构建方式

本数据集专为通风管道摄像头检测的人工智能项目所构建，采集自爱沙尼亚塔尔图Kaunase pst 65号一栋5层公寓楼的30个通风管道。数据来源为30个ASF格式的内窥镜视频文件，以每秒2帧的频率提取出6,533帧图像，其中5,224帧用于训练，1,309帧用于验证，并从验证集中精选出126帧作为金标准数据，同时标注了126个人工检测到的缺陷。数据集的构建融合了PDF报告的结构化转换与自动化脚本处理，通过extract_tartu_json.py和generate_report.py等工具，将原始视频和报告转化为机器可读的格式。

特点

该数据集的核心特点在于其专注于通风管道缺陷检测的精细标注，覆盖了八个关键类别：管道连接处、开口、凹陷、错位、堵塞、金属片管、分支和格栅。基于YOLO11n架构（拥有260万参数）的模型训练表现出色，启发式检测命中率达56.3%，其中管道连接处的识别准确率最高为80.3%，而开口类别的识别仍是挑战，仅达48.6%。数据集不仅包含视觉图像，还整合了每个管道的结构化报告，如深度和缺陷位置信息，为多模态分析提供了可能。

使用方法

使用该数据集时，推荐采用HuggingFace的datasets库进行便捷加载，通过load_dataset('kulimuli/ventilatsiooni-loorid')即可获取。数据集适用于训练基于YOLO系列的目标检测模型，用于自动识别通风管道中的各类缺陷。用户可参考提供的tartu_aruanne.json和projekt_kokkuvote.json文件获取结构化的标签与项目摘要，并利用generate_report.py脚本自动生成检测报告。进一步提升精度的方法包括在Google Colab等平台利用免费GPU资源训练模型，或手动标注约50帧图像以优化性能。

背景与挑战

背景概述

该数据集名为Ventilatsiooni Lõõride AI Andmekogu，由Vendipuhastus OÜ公司的Merilin Heinsaar与HuggingFace的ML Intern项目合作创建，旨在利用人工智能技术对通风管道进行自动化视觉检测。数据集源自爱沙尼亚塔尔图市Kaunase pst 65号一栋五层住宅楼的30个通风管道，通过内窥镜视频采集，共包含6533帧图像，涵盖了踏步、开口、凹陷、错位、堵塞、金属管分支、格栅等八类关键缺陷与结构特征。该数据集针对建筑通风系统维护这一长期依赖人工目视检查的低效领域，提供了首个结构化的视觉检测基准，推动了计算机视觉在建筑基础设施健康监测中的应用，为后续基于YOLO等目标检测模型的自动化评估奠定了数据基础。

当前挑战

当前数据集面临的核心挑战在于所解决的领域问题：通风管道内部环境极为复杂，存在光照不均、镜面反射、狭小空间尺度变化剧烈等视觉困难，且缺陷类别如细小裂缝与接缝间的细微差异难以区分，导致基于通用目标检测模型（如YOLO11n）的启发式检测准确率仅达56.3%，其中开口类别的识别率低至48.6%。在构建过程中，从30个长度约14-15米的管道中提取关键帧并进行精确标注极为耗时，仅完成126张金标准图像的标注工作；同时，模型训练因GPU计算资源尚未到位而处于停滞状态，需通过HuggingFace计费或Google Colab的免费T4 GPU获取算力支持，这对数据集完整性与后续迭代构成制约。

常用场景

经典使用场景

在建筑通风系统的维护与故障诊断领域，利用深度学习技术对管道内壁状态进行自动化视觉检测已成为研究热点。该数据集以YOLO11n轻量级目标检测模型为核心，提供了来自真实高层住宅建筑的30段内窥镜视频，涵盖8种典型管道异常类别，包括管道接缝、开口、凹陷、错位、堵塞、金属管道、分支结构及格栅。经典使用方式是将视频按2帧每秒抽取为6533张静态图像，划分训练集与验证集后，用于训练高精度管道缺陷检测模型。该框架特别适用于多层住宅的垂直通风管道群，能够自动识别从0.8米至12.71米深处的各类结构异常与损伤，为传统人工目视检测提供了高效、可重复的替代方案。

实际应用

在实际工程环境中，该数据集驱动的AI模型可部署于通风管道年度普查与隐患预警系统。当维护团队携带内窥镜设备对楼宇管道进行例行巡检时，模型能够实时解译视频流并输出包含深度、异常类型及严重程度的结构化报告，例如在14.94米深度处精准标记出面板接缝的微小台阶。此方案已应用于具15个单元的住宅楼宇，显著降低了对专家目视经验的依赖。更广泛地，该技术可迁移至工业烟道、地下管廊及桥梁拉索内部等类似密闭空间，形成一套涵盖数据采集、模型推理到报告生成的自动化健康评估流程，极大提升运维效率与安全性。

衍生相关工作

围绕该数据集及其YOLO11n轻量级架构，衍生了多个极具价值的后续研究方向。其一是基于半监督学习的标注效率优化，利用项目规划中保留的126帧金标准与约50帧手动标注数据，可探索一致性正则化或伪标签策略以拓宽小样本场景下的泛化能力。其二是针对管道图像特有的几何畸变与光照不均，衍生出融合注意力机制或可变形卷积的改进检测网络，旨在提升开口类别目前48.6%偏低召回率。此外，该数据集的私有性催生了针对通风管道特定领域的开放基准挑战赛，并可能启发室内三维重建与视觉语言模型结合，实现从缺陷检测向自动维修方案生成的跨越。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集