five

EndoScene|结肠镜图像分析数据集|医学图像分割数据集

收藏
arXiv2016-12-03 更新2024-06-21 收录
结肠镜图像分析
医学图像分割
下载链接:
http://adas.cvc.uab.es/endoscene
下载链接
链接失效反馈
资源简介:
EndoScene数据集是由巴塞罗那自治大学计算机视觉中心创建,旨在为结肠镜图像的端腔场景分割提供基准。该数据集包含912张图像,来源于44个视频序列,覆盖36名患者。数据集的创建过程中,结合了CVC-ColonDB和CVC-ClinicDB两个现有数据集,并增加了对腔体和镜面高光的标注。EndoScene数据集主要应用于结肠镜图像分析,特别是帮助临床医生在结肠镜检查中识别和分割息肉,以减少结直肠癌相关死亡率。
提供机构:
计算机视觉中心,计算机科学系,巴塞罗那自治大学,西班牙
创建时间:
2016-12-03
AI搜集汇总
数据集介绍
main_image_url
构建方式
EndoScene数据集通过合并两个最大的结肠镜图像数据集——CVC-ColonDB和CVC-ClinicDB,并添加了新的注释以分割肠腔和镜面高光,以建立一个新的强大的结肠镜图像分析研究基准。该数据集由912张图像组成,这些图像是从36名患者的44个视频序列中获得的。注释包括息肉、肠腔、背景和镜面高光,其中背景仅包含黏膜(肠壁)。数据集被分为训练集(60%)、验证集(20%)和测试集(20%),每个患者只能出现在一个数据集中。
特点
EndoScene数据集的特点在于其广泛的注释和高质量的分割,这对于开发决策支持系统(DSS)以帮助临床医生在不同阶段的结肠镜检查过程中提供肠腔场景分割至关重要。数据集的注释包括息肉、肠腔、背景和镜面高光,这些注释可以帮助临床医生在检查过程中进行导航,并指示可能被病变覆盖的区域。此外,镜面高光已被证明有助于减少手工方法中息肉检测的假阳性比率。
使用方法
使用EndoScene数据集时,研究者可以将其作为训练和验证全卷积网络(FCN)的基础,以进行语义分割。此外,数据集还提供了评估指标,如交并比(IoU)和每像素精度,以帮助研究者比较不同方法的性能。数据集的分割任务包括息肉分割、肠腔分割和背景分割。为了提高分割性能,研究者可以使用数据增强技术,如随机裁剪、旋转、缩放、共享和弹性变换。此外,研究者还可以根据需要调整网络结构,例如,可以使用不同的网络层数或激活函数。
背景与挑战
背景概述
肠镜图像分析是计算机视觉和医疗影像分析领域的重要研究方向,对于结直肠癌的早期诊断和治疗具有重要意义。EndoScene数据集由David Vázquez等人创建,旨在为肠镜图像分析研究提供一个新的基准。该数据集结合了两个最大的肠镜图像数据集CVC-ColonDB和CVC-ClinicDB,并加入了额外的标注以分割肠腔和镜面高光,以期为肠镜图像分析研究提供一个更加强大的基准。EndoScene数据集的创建对肠镜图像分析领域的研究产生了深远的影响,为后续研究提供了宝贵的数据资源。
当前挑战
EndoScene数据集在肠镜图像分析领域面临的主要挑战包括:1)肠镜图像中息肉的漏诊率较高,尤其是对于小型或扁平的息肉或隐藏在肠道皱襞后面的息肉;2)肠镜图像中息肉的恶性程度只能在组织学分析后得知。此外,构建EndoScene数据集的过程中也面临了一些挑战,如:1)缺乏大型公开的标注数据库,这使得训练和验证深度学习网络变得困难;2)肠镜图像的标注过程需要耗费大量的人力和时间。
常用场景
经典使用场景
EndoScene数据集作为结直肠内镜图像分析的基准,主要应用于结直肠息肉的检测和分割。该数据集包含了丰富的内镜图像,标注了息肉、肠腔、背景和反光亮点等类别,为研究者提供了宝贵的训练和测试资源。EndoScene数据集的经典使用场景是通过深度学习方法,如全卷积网络(FCN),对内镜图像进行语义分割,从而辅助临床医生在结肠镜检查过程中更准确地识别和定位息肉。
衍生相关工作
基于EndoScene数据集的研究衍生了许多相关的工作。研究者们利用该数据集探索了不同的深度学习架构和训练策略,以提高内镜图像分割的性能。此外,EndoScene数据集还推动了内镜图像分析领域的标准化进程,促进了不同研究之间的比较和合作。
数据集最近研究
最新研究方向
在消化内镜领域,EndoScene 数据集的引入为结肠镜图像分析研究提供了一个新的强大基准。该数据集通过结合两个最大的结肠镜图像数据集,并添加了分割腔体和反光亮点等额外的标注,旨在推动结肠镜图像分析研究的发展。在最新的研究中,研究者使用标准的全卷积网络(FCN)对语义分割进行训练,并在没有进一步后处理的情况下,显著优于之前的内镜场景分割结果。这一研究方向表明,深度学习技术在医学图像分割任务中的应用越来越广泛,特别是在结肠镜图像分析中。EndoScene 数据集的建立,为研究者提供了一个宝贵的资源,有助于推动结肠镜图像分析领域的发展,并为临床医生提供更好的辅助决策系统。
相关研究论文
  • 1
    A Benchmark for Endoluminal Scene Segmentation of Colonoscopy Images计算机视觉中心,计算机科学系,巴塞罗那自治大学,西班牙 · 2016年
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

GAOKAO-Bench

GAOKAO-Bench是由复旦大学计算机科学与技术学院创建的数据集,涵盖了2010至2022年间中国高考的所有科目题目,共计2811题。该数据集包含1781道客观题和1030道主观题,题型多样,包括单选、填空、改错、开放性问题等。数据集通过自动化脚本和人工标注将PDF格式的题目转换为JSON文件,数学公式则转换为LATEX格式。GAOKAO-Bench旨在为大型语言模型提供一个全面且贴近实际应用的评估基准,特别是在解决中国高考相关问题上的表现。

arXiv 收录

FER2013

FER2013数据集是一个广泛用于面部表情识别领域的数据集,包含28,709个训练样本和7,178个测试样本。图像属性为48x48像素,标签包括愤怒、厌恶、恐惧、快乐、悲伤、惊讶和中性。

github 收录

Nexdata/chinese_dialect

该数据集包含25,000小时的中文方言语音数据,收集自多个方言区域的本地方言使用者,涵盖闽南语、粤语、四川话、河南话、东北话、上海话、维吾尔语和藏语等。数据格式为16kHz、16bit、未压缩的wav文件,单声道。句子准确率超过95%。数据集支持的任务包括自动语音识别(ASR)和音频说话人识别。

hugging_face 收录

Breast Cancer Dataset

该项目专注于清理和转换一个乳腺癌数据集,该数据集最初由卢布尔雅那大学医学中心肿瘤研究所获得。目标是通过应用各种数据转换技术(如分类、编码和二值化)来创建一个可以由数据科学团队用于未来分析的精炼数据集。

github 收录

MedDialog

MedDialog数据集(中文)包含了医生和患者之间的对话(中文)。它有110万个对话和400万个话语。数据还在不断增长,会有更多的对话加入。原始对话来自好大夫网。

github 收录