BubbleBench
收藏github2025-03-23 更新2025-03-26 收录
下载链接:
https://github.com/tangao1112/BubbleBench
下载链接
链接失效反馈官方服务:
资源简介:
该仓库包含三个不同的气泡图像数据集:标注气泡数据集、散焦气泡数据集和模拟气泡数据集。标注气泡数据集包含100张气泡图像,半自动标注了12,159个离散气泡和907个重叠气泡。散焦气泡数据集包含1,000个散焦气泡样本,主要用于比较不同模型在散焦气泡边缘检测方面的能力。模拟气泡数据集使用BubGAN模型生成不同孔隙率(ε)的模拟气泡图像,共180张图像。
This repository contains three distinct bubble image datasets: the Annotated Bubble Dataset, the Defocused Bubble Dataset, and the Simulated Bubble Dataset. The Annotated Bubble Dataset consists of 100 bubble images, with 12,159 discrete bubbles and 907 overlapping bubbles semi-automatically annotated. The Defocused Bubble Dataset includes 1,000 defocused bubble samples, primarily intended for comparing the performance of different models in defocused bubble edge detection. The Simulated Bubble Dataset contains 180 simulated bubble images with varying porosities (ε) generated using the BubGAN model.
创建时间:
2025-03-23
原始信息汇总
BubbleBench数据集概述
1. 数据集组成
1.1 Annotated Bubble Dataset(标注气泡数据集)
- 描述:包含100张气泡图像,选自7种实验条件,使用Labelme工具半自动标注
- 标注内容:12,159个离散气泡和907个重叠气泡
- 气泡尺寸:等效圆直径多小于1000 μm,主要集中在200-600 μm范围
- 用途:主要用于深度学习模型的训练和验证
- 结构:
- 总图像数:100
- 训练集:80张
- 测试集:20张
- 格式:COCO格式及Stardist/Splinedist兼容格式
1.2 Defocused Bubble Dataset(离焦气泡数据集)
- 描述:从标注数据集中选取的1,000个离焦气泡样本
- 用途:比较不同模型在离焦气泡边缘检测方面的能力
- 构建方式:使用代码从标注数据集中随机提取
1.3 Simulated Bubble Dataset(模拟气泡数据集)
- 生成方法:使用BubGAN模型在不同孔隙率(ε)下生成模拟气泡图像
- 处理:应用高斯模糊模拟离焦效果,生成不同离焦程度的重叠气泡
- 结构:
- 总图像数:180(每种孔隙率60张:ε=0.1,0.15,0.2)
- 格式:COCO格式及Stardist/Splinedist兼容格式
- 验证:通过比较实验图像和模拟图像的气泡面积分数(φ)分布特征进行验证
2. 相关文献
- 主文献:Cai T, Tang A, Xu R, et al. Balanced Deep Learning-Based Bubble Segmentation: Model Comparison, Optimization, and Application in Microbubble Detection.
- 引用文献:
- LabelMe图像标注工具
- Stardist和SplineDist细胞分割方法
- BubGAN气泡生成模型
- 离焦深度测量技术
搜集汇总
数据集介绍

构建方式
在气泡图像分析领域,BubbleBench数据集通过多维度构建策略实现了数据多样性。标注气泡数据集从7种实验条件中随机选取100幅图像,采用Labelme工具进行半自动标注,涵盖12,159个离散气泡和907个重叠气泡。离焦气泡数据集通过代码从标注数据集中随机抽取1000个样本,专注于边缘检测研究。仿真气泡数据集则运用BubGAN模型生成不同孔隙率的合成图像,并施加高斯模糊以模拟离焦效应,最终形成180幅具有物理真实性的样本。
使用方法
针对不同研究需求,数据集支持灵活的应用路径。标注数据集按8:2比例预分割训练测试集,可直接用于监督学习模型的开发与评估。离焦数据集建议配合深度离焦技术相关算法进行边缘检测性能对比实验。仿真数据集可通过调整孔隙率参数进行数据增强,其预定义的三种孔隙率等级(ε=0.1/0.15/0.2)为研究气泡群集行为提供参数化研究平台。所有子集均支持转换为COCO或Stardist格式,用户可根据具体算法需求选择相应数据加载方式。
背景与挑战
背景概述
BubbleBench数据集由Cai T等研究人员于近年开发,专注于气泡图像的深度学习分析领域。该数据集包含三个子集:标注气泡数据集、离焦气泡数据集和模拟气泡数据集,旨在解决微气泡检测与表征中的关键科学问题。数据集通过结合实验图像与BubGAN模型生成的合成数据,为多相流研究中气泡形态学分析提供了重要基准。其创新性地采用半自动标注技术和深度学习方法,显著提升了气泡边缘检测的精度,在化工过程监测、流体力学模拟等领域具有广泛应用价值。
当前挑战
该数据集面临的挑战主要体现在两个方面:在领域问题层面,微气泡的不规则形态、动态重叠以及离焦效应导致传统图像处理方法难以实现精确分割;数据构建过程中,人工标注大量微小气泡的耗时性、离焦样本的物理特性模拟真实性验证,以及合成数据与实验数据的分布对齐问题构成主要技术难点。此外,不同孔隙率条件下气泡群的空间分布特征建模也需要复杂的参数优化过程。
常用场景
经典使用场景
在流体力学与多相流研究中,气泡图像的精确分割与表征是理解两相流动力学的关键环节。BubbleBench数据集通过提供标注气泡、离焦气泡和模拟气泡三类子集,为深度学习模型在气泡识别任务中的性能评估建立了标准化测试平台。其标注气泡数据集特别适用于训练U-Net、StarDist等分割网络,而离焦子集则为研究光学畸变条件下的边缘检测算法鲁棒性提供了独特数据支持。
解决学术问题
该数据集有效解决了多相流研究中气泡自动识别的三大挑战:重叠气泡的分割难题通过907组标注样本提供基准数据;离焦气泡的边缘模糊问题通过1000组特化样本支撑算法比较;模拟数据集则突破实验数据稀缺限制,利用BubGAN生成不同孔隙率的逼真气泡图像。这些数据显著提升了气泡尺寸分布统计的准确性,为微流体器件中的气泡动力学研究提供了量化分析基础。
实际应用
在工业微流控设备检测领域,BubbleBench的离焦气泡数据集已被应用于开发在线气泡监测系统。石油管道中的气液两相流分析借助其模拟数据集进行算法预训练,大幅降低现场数据采集成本。环保领域的水处理曝气过程优化则利用标注数据集训练实时气泡分析模型,实现曝气效率的精准调控。这些应用验证了数据集在复杂工业场景中的实用价值。
数据集最近研究
最新研究方向
在流体力学与计算机视觉交叉领域,BubbleBench数据集为气泡动力学研究提供了多模态基准。当前前沿研究聚焦于基于深度学习的微气泡分割算法优化,特别是针对离焦气泡边缘检测的对抗性生成网络改进。通过BubGAN模型生成的合成数据与实验数据联合训练,研究者正探索孔隙率参数对气泡形态分布的影响机制。该数据集在微流控芯片设计、工业浮选过程监控等场景展现出应用潜力,其标注体系为不规则粒子图像的三维重构提供了新思路。
以上内容由遇见数据集搜集并总结生成



