QinLei086/COSTG_v1
收藏Hugging Face2024-07-07 更新2024-07-22 收录
下载链接:
https://hf-mirror.com/datasets/QinLei086/COSTG_v1
下载链接
链接失效反馈官方服务:
资源简介:
该数据集在ECCV 2024论文《Enriching Information and Preserving Semantic Consistency in Expanding Curvilinear Object Segmentation Datasets》中引入。它包含三种数据类型(目录):血管造影(angiography)、裂缝(crack)和视网膜(retina),这些数据来源于六个公共数据集。此外,unprocessed_json目录包含了通过与ChatGPT-4V和Gemini 1.5 Pro交互获得的原始未处理的图像和掩码的文本描述。所有图像和掩码已被调整为512x512的统一分辨率。
The COSTG dataset, introduced in the ECCV 2024 paper, aims to enrich information and preserve semantic consistency in expanding curvilinear object segmentation datasets. It includes three types of data: angiography (coronary artery disease), crack, and retina (retinal vessels), containing six public datasets. Additionally, the unprocessed_json directory includes raw, unprocessed textual descriptions of images and masks obtained directly from ChatGPT-4V and Gemini 1.5 Pro. All images and masks have been resized to a uniform resolution of 512x512 using bilinear interpolation.
提供机构:
QinLei086
原始信息汇总
COSTG_v1 数据集概述
基本信息
- 许可证: Apache 2.0
- 任务类别: 文本到图像
- 语言: 英语
- 数据集大小: 1K < n < 10K
- 数据集名称: COSTG
数据集介绍
该数据集在 ECCV 2024 论文 Enriching Information and Preserving Semantic Consistency in Expanding Curvilinear Object Segmentation Datasets 中引入。
数据类型
数据集包含三种数据类型(目录):
- angiography(冠状动脉疾病血管造影)
- crack(裂缝)
- retina(视网膜血管)
这些数据类型共同包含六个公开数据集,具体描述见论文。
额外信息
- unprocessed_json 目录包含通过 ChatGPT-4V 和 Gemini 1.5 Pro 直接获取的图像和掩码的原始未处理文本描述。
- 所有图像和掩码已使用双线性插值调整到统一的 512x512 分辨率。
- 如需访问原始未处理数据集,请参考论文中提供的相应地址进行下载。
数据集结构
COSTG_v1 │ ├── angiography/ │ ├── CHUAC/ │ │ ├── test/ │ │ └── training/ │ ├── DCA1/ │ │ ├── test/ │ │ └── training/ │ ├── XCAD/ │ │ ├── test/ │ │ └── training/ │ └── angiography.json │ ├── crack/ │ ├── test/ │ └── training/ │ └── crack.json │ ├── retina/ │ ├── CHASEDB1/ │ │ ├── test/ │ │ └── training/ │ ├── DRIVE/ │ │ ├── test/ │ │ └── training/ │ └── retina.json │ └── unprocessed_json/ ├── angiography.json ├── crack.json └── retina.json
搜集汇总
数据集介绍

构建方式
COSTG_v1数据集的构建基于 angiography、crack 以及 retina 三种数据类型,分别涉及冠状动脉造影、裂缝和视网膜血管的图像。该数据集整合了六个公开数据集,并通过与ChatGPT-4V和Gemini 1.5 Pro的交互获取原始文本描述,进而形成图像和掩膜的文本到图像任务的数据集。所有图像和掩膜均经过双线性插值调整至统一的512x512分辨率,以便利实验操作。
特点
该数据集的特点在于丰富了信息内容并保持了语义一致性,其涵盖了多种医学图像类型,为研究者提供了丰富的实验素材。此外,数据集中包含了未经处理的原始文本描述,为深入分析图像和掩膜提供了可能性。其结构化存储方式便于数据的快速检索和处理。
使用方法
使用COSTG_v1数据集时,研究者可根据需要选择特定的数据类型,如冠状动脉造影、裂缝或视网膜图像。数据集提供了处理后的图像和掩膜,以及原始的文本描述。如需原始数据集,研究者可参考论文中提供的地址进行下载。该数据集易于集成至现有的图像处理和机器学习框架中,支持多种实验设计和模型训练。
背景与挑战
背景概述
COSTG_v1数据集,在计算机视觉与医学图像分析领域,是一项旨在丰富信息并保持语义一致性的研究尝试。该数据集由ECCV 2024论文[*Enriching Information and Preserving Semantic Consistency in Expanding Curvilinear Object Segmentation Datasets*]所介绍,涵盖三种数据类型:angiography(冠状动脉疾病血管造影)、crack(裂纹)以及retina(视网膜血管)。该数据集的创建,汇集了六个公开数据集,为医学图像的精确分割提供了丰富的样本资源。由专业研究人员精心构建,COSTG_v1自推出以来,对医学图像分析领域产生了显著影响,推动了相关技术的进步与发展。
当前挑战
在研究领域问题上,COSTG_v1数据集面临的挑战包括如何精确分割复杂曲线对象,如angiography中的冠状动脉,以及retina中的微细血管结构。此外,构建过程中也遇到了诸多挑战,例如保持数据集的语义一致性,确保在数据增强和信息丰富的同时不破坏原始图像的语义特征。数据集的构建还需克服处理大规模图像数据时的计算效率问题,以及确保不同来源数据集之间的兼容性和一致性。
常用场景
经典使用场景
在计算机视觉领域,COSTG_v1数据集以其丰富的信息内涵和严格的语义一致性,成为扩展曲线对象分割任务的一项重要资源。该数据集涵盖了血管造影、裂缝和视网膜三种类型的数据,为研究者提供了一个统一的实验平台,使得基于512x512像素分辨率图像的研究得以在多个公开数据集上展开。
实际应用
实际应用中,COSTG_v1数据集的图像分割技术可用于医疗影像分析,如冠状动脉疾病的血管造影分析、视网膜血管的识别等,这些应用对于疾病的早期诊断和治疗具有显著影响。此外,裂缝检测技术在基础设施维护和安全监测方面也具有广泛的应用。
衍生相关工作
COSTG_v1数据集的发布促进了相关领域的研究进展,衍生出了一系列经典工作,包括但不限于在医学影像分割、图像描述生成、以及自然语言与图像交互等方向的深入研究,这些工作进一步推动了计算机视觉与自然语言处理领域的交叉融合。
以上内容由遇见数据集搜集并总结生成



