GIRAFE
收藏arXiv2024-12-20 更新2024-12-25 收录
下载链接:
http://arxiv.org/abs/2412.15054v1
下载链接
链接失效反馈官方服务:
资源简介:
GIRAFE数据集是由布雷斯特大学和格雷戈里奥·马拉尼奥医院合作创建的,旨在促进对声带高速视频内窥镜序列的高级语义分割、分析和评估。该数据集包含65个高速视频记录,来自50名患者(30名女性,20名男性),涵盖了从健康到各种声带疾病的广泛情况。所有记录均由专家手动标注,并结合了传统和深度学习方法的自动分割。数据集的创建过程包括数据收集、标注和验证,旨在支持声带疾病诊断和新算法开发,特别是在声带间隙的自动分割方面。
The GIRAFE Dataset was co-developed by the University of Brest and Gregorio Marañón Hospital, aiming to facilitate advanced semantic segmentation, analysis and evaluation of high-speed videoendoscopic sequences of the vocal folds. This dataset comprises 65 high-speed video recordings from 50 patients (30 female, 20 male), covering a broad spectrum of conditions ranging from healthy vocal folds to various vocal fold disorders. All recordings were manually annotated by experts, paired with automatic segmentations derived via both traditional and deep learning methodologies. The dataset development process includes data collection, annotation and validation, and is designed to support vocal fold disease diagnosis and the development of novel algorithms, particularly for automatic segmentation of the glottal space.
提供机构:
信息医学处理实验室(LaTIM),UMR 1101,INSERM 布雷斯特大学
创建时间:
2024-12-20
搜集汇总
数据集介绍

构建方式
GIRAFE数据集的构建旨在填补声门间隙语义分割领域公开数据集的空白,通过收集50名患者(30名女性,20名男性)的65段高速视频内窥镜序列,涵盖了健康对照组、确诊声带障碍患者以及未知健康状况的个体。所有视频均由专家手动标注,生成了声门间隙的语义分割掩码,并辅以多种先进方法的自动分割结果。数据集的构建过程包括使用WOLF® HRES ENDOCAM 5562摄像系统和70度视角的刚性内窥镜进行视频采集,采样率为4000 fps,空间分辨率为256×256像素,确保了数据的多样性和高质量。
使用方法
GIRAFE数据集的使用方法涵盖了多个方面,包括声门间隙的语义分割、辅助播放的生成以及深度学习模型的训练与评估。数据集提供了详细的Python和MATLAB脚本,用于读取图像及其掩码,并生成多种FP可视化结果。用户可以通过GitHub仓库获取数据管理脚本和深度学习模型的训练与测试代码,如UNet和SwinUnetV2。数据集还提供了Jupyter笔记本,指导用户如何从原始分割生成FP。此外,数据集的组织结构清晰,分为Raw_Data、Seg_FP-Results和Training三个目录,分别存储原始视频、分割结果和训练数据,便于用户进行数据分析和模型开发。数据集的使用不仅限于声带振动模式的研究,还可用于声带疾病的诊断和治疗效果的评估。
背景与挑战
背景概述
GIRAFE数据集是由Gustavo Andrade-Miranda等人于2024年创建的,旨在解决声带高速视频内窥镜(HSV)序列中声门间隙语义分割的公开数据缺乏问题。该数据集包含来自50名患者的65个高速视频内窥镜记录,涵盖了健康个体、确诊声带障碍患者以及未知健康状况的个体。所有记录均由专家手动标注,提供了声门间隙的语义分割掩码。GIRAFE数据集的发布为声带振动分析、声门间隙分割算法的发展以及辅助播放(Facilitative Playbacks)的评估提供了重要资源,推动了声带疾病诊断和治疗的研究进展。
当前挑战
GIRAFE数据集面临的挑战主要包括两个方面。首先,声门间隙的精确自动语义分割仍然是一个未解决的难题,尽管深度学习技术在该领域取得了显著进展,但其性能仍受限于标注数据的稀缺性。其次,数据集的构建过程中,获取高质量的高速视频内窥镜数据及其专家级标注面临诸多困难,包括法律限制、罕见疾病的低发病率、高昂的设备成本以及复杂的标注流程。此外,数据集的多样性和代表性也是构建过程中需要克服的挑战,以确保其在临床实践中的广泛适用性和鲁棒性。
常用场景
经典使用场景
GIRAFE数据集主要用于声带高速视频内窥镜(HSV)序列的语义分割、分析和辅助播放(Facilitative Playbacks, FP)的评估。该数据集通过提供带有声门间隙语义分割标注的视频序列,支持研究人员开发新的声门间隙分割算法,并改进或创建新的FP技术。这些FP技术能够将复杂的声带振动动态简化为更易管理的图像或时间序列,从而帮助临床医生更准确地诊断声带疾病。
解决学术问题
GIRAFE数据集解决了声带振动分析领域中的一个关键问题,即缺乏公开的、带有声门间隙语义分割标注的高速视频内窥镜数据集。这一问题限制了现有研究的可重复性和进一步探索。通过提供65个来自50名患者的高速视频内窥镜记录,GIRAFE数据集为研究人员提供了一个可靠的基准,用于开发和评估声门间隙分割算法。此外,数据集还包含了手动和自动分割结果,帮助研究人员比较不同方法的性能,并推动声带振动分析的自动化进程。
实际应用
GIRAFE数据集在临床实践中具有广泛的应用前景。通过提供高质量的声带振动数据,该数据集能够帮助临床医生更准确地诊断声带疾病,如声带结节、息肉、喉炎和声带麻痹等。此外,数据集中的FP技术能够将复杂的声带振动动态简化为更易理解的图像或时间序列,从而辅助医生进行视觉评估。这些应用不仅提高了诊断的准确性,还为声带疾病的治疗和康复提供了有力的支持。
数据集最近研究
最新研究方向
在声带高速视频内窥镜(HSV)领域,GIRAFE数据集为声门间隙的语义分割、分析和辅助播放(Facilitative Playbacks, FP)提供了重要的研究基础。该数据集包含65个来自50名患者的高速视频内窥镜记录,涵盖了健康个体、确诊声带障碍患者以及未知健康状况的病例,所有数据均由专家手动标注。GIRAFE的发布填补了该领域公开数据集的空白,推动了基于深度学习的声门间隙自动分割技术的发展。近年来,研究者利用GIRAFE数据集开发了多种FP生成算法,如声门面积波形(GAW)、声门振动图(GVG)和声门振动谱(PVG),这些技术在声带振动模式的分析和声带疾病的诊断中展现出显著优势。然而,尽管深度学习模型在声门分割任务中取得了进展,完全自动化的高精度分割方法仍面临挑战,尤其是在处理复杂病理和光照条件时。GIRAFE数据集的开放共享为研究者提供了丰富的实验数据,促进了声带振动分析技术的创新与优化,具有重要的临床应用价值。
相关研究论文
- 1GIRAFE: Glottal Imaging Dataset for Advanced Segmentation, Analysis, and Facilitative Playbacks Evaluation信息医学处理实验室(LaTIM),UMR 1101,INSERM 布雷斯特大学 · 2024年
以上内容由遇见数据集搜集并总结生成



