QinLei086/COSTG_v1

Name: QinLei086/COSTG_v1
Creator: QinLei086
Published: 2024-07-07 08:16:36
License: 暂无描述

Hugging Face2024-07-07 更新2024-07-22 收录

下载链接：

https://hf-mirror.com/datasets/QinLei086/COSTG_v1

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集在ECCV 2024论文《Enriching Information and Preserving Semantic Consistency in Expanding Curvilinear Object Segmentation Datasets》中引入。它包含三种数据类型（目录）：血管造影（angiography）、裂缝（crack）和视网膜（retina），这些数据来源于六个公共数据集。此外，unprocessed_json目录包含了通过与ChatGPT-4V和Gemini 1.5 Pro交互获得的原始未处理的图像和掩码的文本描述。所有图像和掩码已被调整为512x512的统一分辨率。

The COSTG dataset, introduced in the ECCV 2024 paper, aims to enrich information and preserve semantic consistency in expanding curvilinear object segmentation datasets. It includes three types of data: angiography (coronary artery disease), crack, and retina (retinal vessels), containing six public datasets. Additionally, the unprocessed_json directory includes raw, unprocessed textual descriptions of images and masks obtained directly from ChatGPT-4V and Gemini 1.5 Pro. All images and masks have been resized to a uniform resolution of 512x512 using bilinear interpolation.

提供机构：

QinLei086

原始信息汇总

COSTG_v1 数据集概述

基本信息

许可证: Apache 2.0
任务类别: 文本到图像
语言: 英语
数据集大小: 1K < n < 10K
数据集名称: COSTG

数据集介绍

该数据集在 ECCV 2024 论文 Enriching Information and Preserving Semantic Consistency in Expanding Curvilinear Object Segmentation Datasets 中引入。

数据类型

数据集包含三种数据类型（目录）：

angiography（冠状动脉疾病血管造影）
crack（裂缝）
retina（视网膜血管）

这些数据类型共同包含六个公开数据集，具体描述见论文。

额外信息

unprocessed_json 目录包含通过 ChatGPT-4V 和 Gemini 1.5 Pro 直接获取的图像和掩码的原始未处理文本描述。
所有图像和掩码已使用双线性插值调整到统一的 512x512 分辨率。
如需访问原始未处理数据集，请参考论文中提供的相应地址进行下载。

数据集结构

COSTG_v1 │ ├── angiography/ │ ├── CHUAC/ │ │ ├── test/ │ │ └── training/ │ ├── DCA1/ │ │ ├── test/ │ │ └── training/ │ ├── XCAD/ │ │ ├── test/ │ │ └── training/ │ └── angiography.json │ ├── crack/ │ ├── test/ │ └── training/ │ └── crack.json │ ├── retina/ │ ├── CHASEDB1/ │ │ ├── test/ │ │ └── training/ │ ├── DRIVE/ │ │ ├── test/ │ │ └── training/ │ └── retina.json │ └── unprocessed_json/ ├── angiography.json ├── crack.json └── retina.json

搜集汇总

数据集介绍

构建方式

COSTG_v1数据集的构建基于 angiography、crack 以及 retina 三种数据类型，分别涉及冠状动脉造影、裂缝和视网膜血管的图像。该数据集整合了六个公开数据集，并通过与ChatGPT-4V和Gemini 1.5 Pro的交互获取原始文本描述，进而形成图像和掩膜的文本到图像任务的数据集。所有图像和掩膜均经过双线性插值调整至统一的512x512分辨率，以便利实验操作。

特点

该数据集的特点在于丰富了信息内容并保持了语义一致性，其涵盖了多种医学图像类型，为研究者提供了丰富的实验素材。此外，数据集中包含了未经处理的原始文本描述，为深入分析图像和掩膜提供了可能性。其结构化存储方式便于数据的快速检索和处理。

使用方法

使用COSTG_v1数据集时，研究者可根据需要选择特定的数据类型，如冠状动脉造影、裂缝或视网膜图像。数据集提供了处理后的图像和掩膜，以及原始的文本描述。如需原始数据集，研究者可参考论文中提供的地址进行下载。该数据集易于集成至现有的图像处理和机器学习框架中，支持多种实验设计和模型训练。

背景与挑战

背景概述

COSTG_v1数据集，在计算机视觉与医学图像分析领域，是一项旨在丰富信息并保持语义一致性的研究尝试。该数据集由ECCV 2024论文[*Enriching Information and Preserving Semantic Consistency in Expanding Curvilinear Object Segmentation Datasets*]所介绍，涵盖三种数据类型：angiography（冠状动脉疾病血管造影）、crack（裂纹）以及retina（视网膜血管）。该数据集的创建，汇集了六个公开数据集，为医学图像的精确分割提供了丰富的样本资源。由专业研究人员精心构建，COSTG_v1自推出以来，对医学图像分析领域产生了显著影响，推动了相关技术的进步与发展。

当前挑战

在研究领域问题上，COSTG_v1数据集面临的挑战包括如何精确分割复杂曲线对象，如angiography中的冠状动脉，以及retina中的微细血管结构。此外，构建过程中也遇到了诸多挑战，例如保持数据集的语义一致性，确保在数据增强和信息丰富的同时不破坏原始图像的语义特征。数据集的构建还需克服处理大规模图像数据时的计算效率问题，以及确保不同来源数据集之间的兼容性和一致性。

常用场景

经典使用场景

在计算机视觉领域，COSTG_v1数据集以其丰富的信息内涵和严格的语义一致性，成为扩展曲线对象分割任务的一项重要资源。该数据集涵盖了血管造影、裂缝和视网膜三种类型的数据，为研究者提供了一个统一的实验平台，使得基于512x512像素分辨率图像的研究得以在多个公开数据集上展开。

实际应用

实际应用中，COSTG_v1数据集的图像分割技术可用于医疗影像分析，如冠状动脉疾病的血管造影分析、视网膜血管的识别等，这些应用对于疾病的早期诊断和治疗具有显著影响。此外，裂缝检测技术在基础设施维护和安全监测方面也具有广泛的应用。

衍生相关工作

COSTG_v1数据集的发布促进了相关领域的研究进展，衍生出了一系列经典工作，包括但不限于在医学影像分割、图像描述生成、以及自然语言与图像交互等方向的深入研究，这些工作进一步推动了计算机视觉与自然语言处理领域的交叉融合。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集