five

EGC-Z datasets

收藏
github2021-10-07 更新2024-05-31 收录
下载链接:
https://github.com/gustavozf/EGC_Z_dataset
下载链接
链接失效反馈
官方服务:
资源简介:
本仓库提供了用于研究慢性退行性疾病自动识别的数据集,这些数据集由肠道神经系统图像组成,用于评估肠道神经胶质细胞是否受到慢性退行性疾病的影响。数据集包括三种不同的慢性退行性疾病:癌症、糖尿病和类风湿性关节炎。

This repository provides datasets for the study of automatic recognition of chronic degenerative diseases. These datasets consist of images from the enteric nervous system, aimed at evaluating whether enteric glial cells are affected by chronic degenerative diseases. The datasets include three different types of chronic degenerative diseases: cancer, diabetes, and rheumatoid arthritis.
创建时间:
2020-03-29
原始信息汇总

数据集概述

数据集名称

  • The EGC-Z datasets

数据集内容

  • 包含三个不同的慢性退化性疾病的数据集:关节炎(AIA)、癌症(TW)和糖尿病(D)。
  • 每个数据集由两类图像组成:患病(1)和健康对照(0)。

数据集详情

  • AIA:

    • 患病样本数: 210
    • 健康对照样本数: 208
    • 图像尺寸: 1024 x 768
    • 总样本数: 418
  • TW:

    • 患病样本数: 192
    • 健康对照样本数: 224
    • 图像尺寸: 1384 x 1036
    • 总样本数: 416
  • D:

    • 患病样本数: 290
    • 健康对照样本数: 224
    • 图像尺寸: 1384 x 1036
    • 总样本数: 514

数据集使用建议

  • 每个数据集应视为独立的二分类问题。
  • 推荐使用留一法交叉验证,确保模型评估的准确性。
  • 图像来自随机的小肠样本,无连续性或相关性,但建议同一来源动物的图像在同一分割中保持一致。

数据集组织结构

  • 数据集按以下结构组织:

    data/ |__ DATASET_1/ |__ animal_tag_1/ |__ sample_1.jpg |__ sample_2.jpg ... |__ sample_n.jpg |__ animal_tag_2/ ... |__ DATASET_2/ ...

引用信息

  • 使用数据集时,请引用以下论文:

    @Article{Felipe2021, author={Felipe, Gustavo Z. and Zanoni, Jacqueline N. and Sehaber-Sierakowski, Camila C. and Bossolani, Gleison D. P. and Souza, Sara R. G. and Flores, Franklin C. and Oliveira, Luiz E. S. and Pereira, Rodolfo M. and Costa, Yandre M. G.}, title={Automatic chronic degenerative diseases identification using enteric nervous system images}, journal={Neural Computing and Applications}, year={2021}, month={Jun}, day={17}, issn={1433-3058}, doi={10.1007/s00521-021-06164-7}, url={https://doi.org/10.1007/s00521-021-06164-7} }

许可证

搜集汇总
数据集介绍
main_image_url
构建方式
EGC-Z数据集由巴西马林加州立大学肠神经可塑性实验室的研究人员构建,旨在通过肠神经系统图像识别慢性退行性疾病。数据集的构建基于大鼠肠神经系统的图像样本,通过S100蛋白的免疫染色技术可视化肠胶质细胞(EGC)。每个数据集代表一种疾病,包括类风湿性关节炎(AIA)、癌症(TW)和糖尿病(D)。数据集分为两类:一类为患病动物的图像样本,另一类为健康对照组的图像样本。图像样本的获取过程遵循严格的实验流程,确保数据的科学性和可靠性。
特点
EGC-Z数据集的特点在于其多样性和复杂性。数据集包含三种不同的慢性退行性疾病,每种疾病的数据集均具有独特的图像特征,如不同的噪声水平、对比度差异以及肠胶质细胞的清晰度变化。此外,数据集的图像样本来自不同的大鼠,确保了数据的广泛性和代表性。每个数据集的图像样本数量适中,且图像分辨率较高,为后续的机器学习模型训练提供了丰富的信息。数据集的构建还考虑了实验的独立性,确保每个数据集作为一个独立的二分类问题进行处理。
使用方法
使用EGC-Z数据集时,建议将其视为三个独立的二分类问题进行处理。由于数据集中的图像样本来自不同的大鼠,且每个动物的图像样本具有独立性,因此在训练和测试时应确保同一动物的图像样本在同一数据分割中。推荐使用留一法交叉验证(leave-one-out cross-validation)来评估模型的性能,以确保模型的泛化能力。数据集的文件夹结构清晰,每个数据集文件夹中包含一个CSV文件,记录了每个图像样本的标签信息。在使用该数据集时,需遵循Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International License的许可条款,确保非商业用途并注明来源。
背景与挑战
背景概述
EGC-Z数据集由巴西马林加州立大学肠神经可塑性实验室的研究团队创建,旨在通过肠神经系统(ENS)图像自动识别慢性退行性疾病。该数据集于2021年发布,主要应用于慢性疾病如癌症、糖尿病和类风湿性关节炎的诊断研究。数据集包含从大鼠小肠中提取的肠胶质细胞(EGC)图像,通过S100蛋白免疫染色技术获取。研究团队结合手工特征提取和深度学习技术,成功实现了对健康与患病细胞的分类,识别率分别达到89.30%(类风湿性关节炎)、98.45%(癌症)和95.13%(糖尿病)。这一成果为慢性退行性疾病的早期诊断提供了新的技术手段,推动了医学图像分析领域的发展。
当前挑战
EGC-Z数据集在构建和应用过程中面临多重挑战。首先,数据集的图像来源于不同研究人员的独立采集,导致图像质量存在显著差异,如噪声水平、对比度和清晰度不一致,这增加了模型训练的复杂性。其次,由于图像样本来自随机提取的动物小肠组织,缺乏空间连续性,因此需确保训练和测试集的分割不会引入数据泄露问题。此外,数据集的规模相对较小,尤其是某些疾病类别的样本数量有限,可能影响模型的泛化能力。最后,尽管深度学习技术在分类任务中表现出色,但如何有效结合手工特征与深度学习特征以进一步提升分类性能,仍是一个亟待解决的问题。
常用场景
经典使用场景
EGC-Z数据集在慢性退行性疾病识别领域具有重要应用,特别是在通过肠神经系统图像进行疾病诊断的研究中。该数据集通过提供来自健康个体和患有癌症、糖尿病及类风湿性关节炎的个体的肠胶质细胞图像,为机器学习模型提供了丰富的训练和测试数据。研究人员可以利用这些图像数据,结合纹理描述符和卷积神经网络等深度学习技术,开发出高效的疾病识别算法。
衍生相关工作
EGC-Z数据集的发布催生了一系列相关研究,特别是在基于深度学习的医学图像分析领域。许多研究团队利用该数据集开发了新的图像分类算法,并结合迁移学习、特征融合等技术,进一步提升了模型的性能。此外,该数据集还促进了跨学科合作,推动了计算机视觉与生物医学领域的深度融合。
数据集最近研究
最新研究方向
近年来,随着慢性退行性疾病诊断需求的增加,EGC-Z数据集在医学图像分析领域引起了广泛关注。该数据集通过提供来自大鼠肠神经系统的图像样本,支持了基于机器学习和深度学习的疾病识别研究。当前的研究方向主要集中在结合手工特征和深度学习特征的多模态融合技术上,以提高分类精度。特别是,研究者们正在探索如何利用卷积神经网络(如AlexNet和VGG16)与纹理描述符(如局部二值模式)的互补性,进一步提升对癌症、糖尿病和类风湿性关节炎等疾病的识别能力。此外,跨数据集验证和模型泛化能力的研究也成为热点,旨在确保模型在不同噪声水平和图像质量下的鲁棒性。这些研究不仅推动了慢性退行性疾病的早期诊断,也为医学图像分析领域提供了新的技术路径。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作