UTM_Dataset
收藏Hugging Face2026-01-15 更新2026-01-16 收录
下载链接:
https://huggingface.co/datasets/claytonsds/UTM_Dataset
下载链接
链接失效反馈官方服务:
资源简介:
U-Tube Manometer数据集包含20,000张U型管压力计的图像,适用于计算机视觉回归和分类任务,主要用于读取和解释液柱高度。数据集适用于图像回归(估计液柱高度的数值)和图像分类(基于离散的液柱值或范围分类图像)。图像按文件夹结构组织,文件夹名称表示测量的液柱值。图像特征包括RGB图像、不同的光照条件、不同的工作流体(水、油、水-墨水混合物)、每张图像中单个U型管压力计以及可见的液柱和刻度标记。
创建时间:
2026-01-14
原始信息汇总
U-Tube Manometer Dataset (2025–2026) 数据集概述
数据集基本信息
- 数据集名称:U-Tube Manometer Dataset (2025–2026)
- 发布者:Santos, Clayton Silva
- 发布年份:2026
- 发布平台:Hugging Face
- 数据集地址:https://huggingface.co/datasets/claytonsds/UTM_DATASET
- 许可协议:Apache License 2.0
- 数据规模:10K < n < 100K
- 主要语言:英语、葡萄牙语
数据集内容与用途
- 核心内容:包含20,000张U型管压力计图像,图像中可见水柱。
- 任务类别:图像分类、图像回归。
- 具体用途:
- 图像回归:用于估计水柱高度的数值。
- 图像分类:基于离散的柱高值或范围对图像进行分类。
- 应用领域:U型管压力计、仪表读数、水柱测量。
数据结构
- 组织方式:采用标准的训练集/验证集/测试集划分。
- 标签编码:标签值编码在目录名称中,代表测量的水柱高度值(例如,以厘米为单位)。
- 目录结构示例:
dataset/train/10.2/image23.png- 子文件夹名称(如“10.2”)即为该文件夹内所有图像的标签值。
图像特征
- 图像类型:RGB图像。
- 主要内容:每张图像包含单个U型管压力计,可见液柱和刻度标记。
- 条件变化:
- 光照条件各异。
- 工作流体多样(水、油、水-墨水混合物)。
注意事项
- 在极端光照或被遮挡条件下,模型性能可能有所变化。
引用信息
如需在研究中使用此数据集,请引用: bibtex @dataset{utm_dataset, title = {U-Tube Manometer Dataset}, author = {Santos, Clayton Silva}, year = {2026}, publisher = {Hugging Face}, url = {https://huggingface.co/datasets/claytonsds/UTM_DATASET} }
搜集汇总
数据集介绍

构建方式
在工业测量与计算机视觉交叉领域,UTM_Dataset的构建体现了严谨的实验设计。该数据集通过采集透明PVC水柱软管与多种颜色柔性测量尺组合的U型管压力计图像,涵盖了水、油及染色水等多种工质流体。原始图像经专业标注工具处理,标注精度控制在±0.1厘米以内,并采用数据增强技术将20,036张原始图像扩展至48,218张,形成了涵盖训练、验证与测试的标准划分体系。
特点
本数据集的核心特征在于其高度的专业性与结构性。所有图像均聚焦于U型管液柱高度的视觉读取任务,文件夹层级直接以厘米为单位的液柱高度值命名,实现了标签与数据的直观映射。数据规模达到数万级别,且包含多种流体介质与测量尺颜色组合,为模型提供了丰富的视觉变异性和物理场景覆盖度,特别适用于回归与分类任务的模型训练与评估。
使用方法
使用该数据集时,研究者可依据标准数据划分直接加载训练、验证与测试集。图像按标签值分文件夹存储的结构便于进行监督学习任务的批量读取与处理。数据集适用于开发与评估液柱高度自动读取的计算机视觉模型,可通过回归预测具体高度值或通过分类识别高度区间。配套的元数据文件可辅助进行数据集的整体分析与统计。
背景与挑战
背景概述
在工业自动化与仪器仪表领域,精确测量流体压力或液位高度是保障生产安全与效率的关键环节。U型管压力计作为一种经典的流体压力测量工具,其读数过程长期依赖人工目视,存在主观误差与效率瓶颈。为推进该过程的智能化转型,研究人员Clayton Silva Santos于2026年发布了UTM_Dataset,该数据集旨在为计算机视觉回归与分类任务提供支持,核心研究问题聚焦于液体柱高度的自动识别。通过构建包含水、油及染色水等多种工质的大规模图像数据,该数据集为开发高精度液位视觉读取模型奠定了坚实基础,对工业视觉检测与自动化仪表领域具有显著的推动作用。
当前挑战
该数据集致力于解决工业场景中U型管压力计液柱高度的自动读取问题,其核心挑战在于模型需克服复杂环境干扰,如透明管壁的反光、液体弯月面形态变化、背景杂乱及不同颜色标尺的识别,以实现亚厘米级的高精度回归预测。在构建过程中,研究团队面临数据采集与标注的双重困难:需在多样光照与角度下采集数万张原始图像,并确保标注精度严格控制在±0.1厘米以内;同时,通过数据增强生成逾四万八千张图像以提升模型泛化能力,这一过程对标注一致性与数据质量控制提出了极高要求。
常用场景
经典使用场景
在工业自动化与流体力学领域,精确测量液体柱高度是监控压力与液位的关键环节。UTM_Dataset通过提供大量U型管压力计图像,为计算机视觉回归与分类任务奠定了数据基础。该数据集最经典的使用场景在于训练深度学习模型,以自动识别和读取不同流体(如水、油、染色水)在透明PVC软管中的柱高值,从而替代传统人工目视读数,提升测量效率与准确性。其图像标注精度达到±0.1厘米,确保了模型在复杂环境下的鲁棒性。
实际应用
在实际工业与科研环境中,UTM_Dataset的应用广泛涉及自动化监控系统。例如,在化工生产线上,模型可实时监测U型管压力计的液位变化,实现压力数据的连续采集与预警;在实验室研究中,它辅助流体力学实验的自动化数据记录,减少人为误差。此外,该数据集还可集成于智能仪表开发,为物联网设备提供视觉识别模块,从而提升工业4.0背景下设备智能化水平与操作安全性。
衍生相关工作
基于UTM_Dataset,已衍生出多项经典研究工作,主要集中在视觉测量算法的优化与扩展。例如,研究者利用该数据集开发了高效的特征提取网络,以应对不同流体折射率带来的读数偏差;同时,一些工作结合生成对抗网络进行数据增强,进一步提升模型在未见场景下的性能。这些成果不仅推动了仪表读数技术的进步,还为相关领域如医学液位检测、环境监测提供了可迁移的方法论参考。
以上内容由遇见数据集搜集并总结生成



