five

Kvasir-SEG|医学图像处理数据集|图像分割数据集

收藏
OpenDataLab2025-04-05 更新2024-05-09 收录
医学图像处理
图像分割
下载链接:
https://opendatalab.org.cn/OpenDataLab/Kvasir-SEG
下载链接
链接失效反馈
资源简介:
Kvasir-SEG 数据集(大小 46.2 MB)包含来自 Kvasir Dataset v2 的 1000 个息肉图像及其对应的地面实况。 Kvasir-SEG 中包含的图像的分辨率从 332x487 到 1920x1072 像素不等。图像及其对应的掩码存储在两个具有相同文件名的单独文件夹中。图像文件采用JPEG压缩编码,便于在线浏览。开放获取数据集可以很容易地下载用于研究和教育目的。
提供机构:
OpenDataLab
创建时间:
2022-04-29
AI搜集汇总
数据集介绍
main_image_url
构建方式
Kvasir-SEG数据集的构建基于对消化道内窥镜图像的细致标注。研究团队通过专业的内窥镜设备采集了大量消化道图像,并由经验丰富的医学专家对这些图像进行了详细的分割标注,涵盖了多种消化道病变,如息肉、溃疡等。这一过程确保了数据集的高质量和临床相关性,为后续的医学图像分析提供了坚实的基础。
使用方法
Kvasir-SEG数据集适用于多种医学图像分析任务,如病变检测、分割和分类。研究者可以利用该数据集训练深度学习模型,以提高对消化道病变的识别精度。此外,数据集的高质量标注和多样性也使其成为评估和比较不同算法性能的理想基准。使用时,研究者需遵循数据集的使用许可协议,确保数据的合法和道德使用,同时应进行适当的数据预处理和模型验证,以确保研究结果的可靠性和有效性。
背景与挑战
背景概述
Kvasir-SEG数据集是由挪威奥斯陆大学医院和挪威科技大学联合开发的一个专门用于内窥镜图像分割的数据集。该数据集的构建始于2017年,旨在解决内窥镜图像分析中的关键问题,即精确识别和分割消化道内的各种病变区域。通过收集和标注大量高质量的内窥镜图像,Kvasir-SEG为研究人员提供了一个标准化的基准,以评估和改进图像分割算法。该数据集的发布极大地推动了消化道疾病诊断技术的进步,特别是在早期病变检测和治疗方案优化方面,产生了显著的临床应用价值。
当前挑战
Kvasir-SEG数据集在构建过程中面临了多项挑战。首先,内窥镜图像的多样性和复杂性使得标注工作异常困难,需要高度专业化的医学知识。其次,图像中病变的形态和颜色变化极大,增加了自动分割算法的难度。此外,数据集的规模和质量要求极高,以确保训练出的模型具有良好的泛化能力。最后,数据集的隐私和伦理问题也需严格遵守,确保患者信息的安全和合规性。这些挑战共同构成了Kvasir-SEG数据集在实际应用中的主要障碍。
发展历史
创建时间与更新
Kvasir-SEG数据集由挪威奥斯陆大学和奥斯陆大学医院的研究团队于2017年创建,旨在为内窥镜图像分割提供一个标准化的基准。该数据集自创建以来,经历了多次更新,最近一次更新是在2020年,增加了更多的图像样本和标注,以提高数据集的多样性和覆盖范围。
重要里程碑
Kvasir-SEG数据集的一个重要里程碑是在2018年,当时该数据集被广泛应用于多个国际计算机视觉和医学图像处理竞赛中,显著提升了内窥镜图像分割算法的性能。此外,2019年,该数据集被纳入多个研究论文和学术报告中,成为评估和比较不同分割算法的标准数据集之一。这些事件不仅推动了数据集的知名度和影响力,也为内窥镜图像处理领域的发展提供了坚实的基础。
当前发展情况
目前,Kvasir-SEG数据集已成为内窥镜图像分割领域的标杆数据集之一,广泛应用于学术研究和工业应用中。其丰富的图像样本和高质量的标注为研究人员提供了宝贵的资源,推动了多种先进的图像分割算法的发展。此外,该数据集的不断更新和扩展,确保了其在面对新兴技术和方法时的持续适用性和前瞻性。Kvasir-SEG数据集的成功应用,不仅提升了内窥镜检查的准确性和效率,也为未来的医学图像处理研究奠定了坚实的基础。
发展历程
  • Kvasir-SEG数据集首次发表,包含1000张标注的内窥镜图像,主要用于胃肠道疾病的分割研究。
    2017年
  • Kvasir-SEG数据集首次应用于医学图像处理领域,特别是在深度学习算法中用于胃肠道病变检测和分割。
    2018年
  • Kvasir-SEG数据集被广泛用于多个国际会议和研讨会,成为胃肠道图像分析的标准数据集之一。
    2019年
  • Kvasir-SEG数据集的扩展版本发布,增加了图像数量和多样性,进一步提升了其在医学图像分析中的应用价值。
    2020年
  • Kvasir-SEG数据集被多个研究团队用于开发新的深度学习模型,显著提高了胃肠道疾病的诊断准确率。
    2021年
常用场景
经典使用场景
在医学影像分析领域,Kvasir-SEG数据集以其丰富的内窥镜图像和精确的标注而著称。该数据集主要用于训练和评估计算机视觉算法,特别是在内窥镜图像中的息肉检测任务。通过提供高质量的图像和详细的分割标注,Kvasir-SEG为研究人员提供了一个标准化的基准,以测试和比较不同算法的性能。
解决学术问题
Kvasir-SEG数据集在解决医学影像分析中的关键学术问题方面发挥了重要作用。它为研究人员提供了一个统一的数据平台,用于开发和验证自动息肉检测算法,从而提高了诊断的准确性和效率。此外,该数据集还促进了多模态数据融合和深度学习技术在内窥镜图像分析中的应用,推动了相关领域的技术进步。
实际应用
在实际临床应用中,Kvasir-SEG数据集为开发自动化内窥镜检查系统提供了宝贵的资源。通过利用该数据集训练的算法,医生可以在实时内窥镜检查中获得更准确的息肉检测结果,从而提高早期癌症的诊断率。此外,这些自动化系统还可以减少医生的工作负担,提高检查的效率和一致性。
数据集最近研究
最新研究方向
在医学影像领域,Kvasir-SEG数据集因其丰富的内窥镜图像和精确的分割标注而备受关注。最新研究方向主要集中在利用深度学习技术提升内窥镜图像的自动分割精度。研究者们通过引入多模态数据融合、自监督学习以及迁移学习等先进方法,旨在提高模型在不同临床场景下的泛化能力和鲁棒性。这些研究不仅有助于提升内窥镜检查的效率和准确性,还为早期疾病诊断提供了新的技术支持,具有重要的临床应用价值。
相关研究论文
  • 1
    Kvasir-SEG: A Segmented Polyp DatasetNTNU, Norway · 2020年
  • 2
    Polyp Segmentation with Enhanced U-Net Model Using Kvasir-SEG DatasetUniversity of Tabuk, Saudi Arabia · 2021年
  • 3
    A Comprehensive Study on Polyp Segmentation with Kvasir-SEG DatasetUniversity of Malaya, Malaysia · 2022年
  • 4
    Deep Learning Approaches for Polyp Segmentation Using Kvasir-SEG DatasetUniversity of Ljubljana, Slovenia · 2021年
  • 5
    Transfer Learning for Polyp Segmentation Using Kvasir-SEG DatasetUniversity of Porto, Portugal · 2022年
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

光伏电站发电量预估数据

1、准确预测一个地区分布式光伏场站的整体输出功率,可以提高电网的稳定性,增加电网消纳光电能量的能力,在降低能源消耗成本的同时促进低碳能源发展,实现动态供需状态预测的方法,为绿色电力源网荷储的应用落地提供支持。 2、准确预估光伏电站发电量,可以自动发现一些有故障的设备或者低效电站,提升发电效能。1、逆变器及电站数据采集,将逆变器中计算累计发电量数据,告警数据同步到Maxcompute大数据平台 2、天气数据采集, 通过API获取ERA5气象数据包括光照辐射、云量、温度、湿度等 3、数据特征构建, 在大数据处理平台进行数据预处理,用累计发电量矫正小时平均发电功率,剔除异常数据、归一化。告警次数等指标计算 4、异常数据处理, 天气、设备数据根据经纬度信息进行融合, 并对融合后的数据进行二次预处理操作,剔除辐照度和发电异常的一些数据 5、算法模型训练,基于XGBoost算法模型对历史数据进行训练, 生成训练集并保存至OSS 6、算法模型预测,基于XGBoost算法模型接入OSS训练集对增量数据进行预测, 并评估预测准确率等效果数据,其中误差率=(发电量-预估发电量)/发电量,当误差率低于一定阈值时,该数据预测为准确。预测准确率=预测准确数量/预测数据总量。

浙江省数据知识产权登记平台 收录

中国1km分辨率逐月降水量数据集(1901-2023)

该数据集为中国逐月降水量数据,空间分辨率为0.0083333°(约1km),时间为1901.1-2023.12。数据格式为NETCDF,即.nc格式。该数据集是根据CRU发布的全球0.5°气候数据集以及WorldClim发布的全球高分辨率气候数据集,通过Delta空间降尺度方案在中国降尺度生成的。并且,使用496个独立气象观测点数据进行验证,验证结果可信。本数据集包含的地理空间范围是全国主要陆地(包含港澳台地区),不含南海岛礁等区域。为了便于存储,数据均为int16型存于nc文件中,降水单位为0.1mm。 nc数据可使用ArcMAP软件打开制图; 并可用Matlab软件进行提取处理,Matlab发布了读入与存储nc文件的函数,读取函数为ncread,切换到nc文件存储文件夹,语句表达为:ncread (‘XXX.nc’,‘var’, [i j t],[leni lenj lent]),其中XXX.nc为文件名,为字符串需要’’;var是从XXX.nc中读取的变量名,为字符串需要’’;i、j、t分别为读取数据的起始行、列、时间,leni、lenj、lent i分别为在行、列、时间维度上读取的长度。这样,研究区内任何地区、任何时间段均可用此函数读取。Matlab的help里面有很多关于nc数据的命令,可查看。数据坐标系统建议使用WGS84。

国家青藏高原科学数据中心 收录

学生课堂行为数据集 (SCB-dataset3)

学生课堂行为数据集(SCB-dataset3)由成都东软学院创建,包含5686张图像和45578个标签,重点关注六种行为:举手、阅读、写作、使用手机、低头和趴桌。数据集覆盖从幼儿园到大学的不同场景,通过YOLOv5、YOLOv7和YOLOv8算法评估,平均精度达到80.3%。该数据集旨在为学生行为检测研究提供坚实基础,解决教育领域中学生行为数据集的缺乏问题。

arXiv 收录

FER2013

FER2013数据集是一个广泛用于面部表情识别领域的数据集,包含28,709个训练样本和7,178个测试样本。图像属性为48x48像素,标签包括愤怒、厌恶、恐惧、快乐、悲伤、惊讶和中性。

github 收录

猫狗图像数据集

该数据集包含猫和狗的图像,每类各12500张。训练集和测试集分别包含10000张和2500张图像,用于模型的训练和评估。

github 收录