five

Dataset Repository

收藏
github2024-07-17 更新2024-07-18 收录
下载链接:
https://github.com/Icesi-MakeHealth-Datathon/dataset
下载链接
链接失效反馈
官方服务:
资源简介:
本仓库包含多个医学图像数据集,用于支持人工智能算法在医疗诊断中的应用。数据集包括:1. 基于CT图像的脑卒中患者时间窗口分类;2. 基于数字乳腺摄影图像的乳腺实质类型分类;3. 基于患者预约记录的磁共振检查缺席预测。

This repository contains multiple medical image datasets to support the application of artificial intelligence algorithms in medical diagnosis. The datasets include: 1. Time window classification for stroke patients based on computed tomography (CT) images; 2. Breast parenchymal type classification based on digital mammography images; 3. Prediction of missed magnetic resonance imaging (MRI) examinations based on patient appointment records.
创建时间:
2024-07-16
原始信息汇总

数据集概述

数据集1

标题

Clasificación del tiempo de ventana en pacientes con ACV al despertar a partir de imágenes de tomografía computarizada de cráneo simple.

背景

目前,缺血性脑卒中(ACV)的治疗方法和处理是根据治疗窗口期来定义的。然而,高达25%的患者在入院时脑卒中的发病时间未知。使用人工智能算法可以通过估计发病时间未知的缺血性脑卒中患者的治疗窗口期来支持诊断方法,从而从治疗角度支持决策制定。

数据

数据是通过对医学体积图像的处理、生成掩码和使用Python以及pydicom和pyradiomics包进行放射组学特征提取获得的。

数据集2

标题

Clasificación del tipo de parénquima mamario a partir de imágenes de mamografía digital.

背景

数字乳腺摄影是一种使用电离辐射来检查乳房的诊断图像。进行两种投影,一种是中斜位,另一种是头尾位。这项研究可以识别早期乳腺癌的迹象。尽管有多种算法试图识别这些迹象,但由于乳腺实质的组成,在某些情况下这是一个挑战。识别乳腺组织类型(A、B、C、D)可能作为应用图像处理技术和人工智能算法之前的步骤,以提高这些方法的整体性能。

数据

数据是通过对二维医学图像的处理、生成掩码和使用Python以及pydicom和pyradiomics包进行放射组学特征提取获得的。

数据集3

标题

Identificación de inasistencias en pacientes con citas programadas para estudios de resonancia magnética en un centro de alta complejidad en Cali.

背景

患者预约医疗检查的缺席问题在哥伦比亚和全球范围内都会导致显著的经济损失,并影响医疗机构的运营效率。为了解决患者预约缺席的问题,可以使用预定义的两类分类模型,即“出席”或“缺席”。这样可以帮助机构做出明智的决策,优化资源分配,降低运营成本,并提高患者的满意度和治疗依从性。

数据

数据直接从参与该领域的Fundación Valle del Lili的工作人员处获得。这些数据是由FVL内部患者管理系统生成的历史记录,因此包含机构感兴趣的特征和属性。数据集涵盖了详细的医疗预约信息和患者社会人口统计数据。包括预约和出席信息、确认、患者病史和进行的医疗检查类型。此外,还提供了患者的个人和社会信息,如年龄、性别和居住地。该数据集对于分析医疗预约管理和就诊患者的人口统计和社会经济特征非常有用。

数据集4

标题

Prediccion de Apnea del sueño

背景

睡眠呼吸暂停是一种睡眠障碍,其特征是在睡眠期间反复出现呼吸暂停或浅呼吸期。这些暂停可以从几秒钟到几分钟不等,每小时可能发生30次或更多次。睡眠呼吸暂停可以是阻塞性的(最常见)、中枢性的(较少见)或两者的结合。阻塞性睡眠呼吸暂停(AOS)发生在喉部肌肉过度放松,部分或完全阻塞上呼吸道时。

数据

数据代表了电子病历的主要变量。其中包括:诊断、药物、咨询原因和症状。

搜集汇总
数据集介绍
main_image_url
构建方式
该数据集的构建基于对医学影像的深入处理与分析,具体通过Python环境下的pydicom和pyradiomics包实现。数据集包括多个子集,分别针对不同医学应用场景。例如,Dataset 1聚焦于通过计算机断层扫描(CT)图像对脑卒中患者的时间窗口进行分类;Dataset 2则利用数字乳腺摄影图像对乳腺实质类型进行分类。这些数据集的构建过程涉及图像的体积处理、掩膜生成以及放射组学的特征提取,确保了数据的高质量和多样性。
使用方法
该数据集适用于多种医学影像分析和人工智能算法的开发与验证。研究者可以利用这些数据集进行模型训练,以提高对特定医学问题的诊断准确性。例如,可以使用Dataset 1来训练和验证脑卒中时间窗口分类模型,或使用Dataset 2来开发乳腺实质类型识别算法。此外,数据集的详细文档和特征描述为研究者提供了清晰的指导,确保了数据的有效利用和结果的可重复性。
背景与挑战
背景概述
Dataset Repository 是一个专注于医疗影像分析和患者管理的数据集集合,由多个研究机构和医疗中心合作创建。该数据集的创建旨在通过人工智能和机器学习技术,解决医疗领域中的关键问题,如中风患者的治疗窗口期估计、乳腺组织分类、患者预约缺席预测以及睡眠呼吸暂停的诊断。这些数据集的构建基于大量的医学影像和患者历史数据,通过Python和相关库如pydicom和pyradiomics进行处理。这些数据集不仅为研究人员提供了丰富的资源,也为医疗决策提供了科学依据,推动了医疗领域的智能化发展。
当前挑战
Dataset Repository 在构建过程中面临多项挑战。首先,医学影像数据的获取和处理需要高度的专业知识和复杂的算法支持,确保数据的准确性和可靠性。其次,患者数据的隐私保护和合规性是另一大挑战,尤其是在处理敏感的医疗信息时。此外,不同数据集之间的异质性增加了模型训练的复杂性,要求研究人员开发能够适应多种数据类型和结构的通用算法。最后,如何确保模型的可解释性和临床适用性,以便医生能够信任并采纳这些智能系统的建议,也是一个亟待解决的问题。
常用场景
经典使用场景
该数据集在医疗影像分析领域展现了其经典应用场景。例如,在Dataset 1中,通过分析脑部CT图像,利用人工智能算法对缺血性脑卒中患者的治疗时间窗进行分类,从而辅助临床决策。此外,Dataset 2聚焦于乳腺组织类型的分类,通过乳腺X光图像的分析,识别不同类型的乳腺组织,为早期乳腺癌检测提供支持。这些应用不仅提升了诊断的准确性,还加速了治疗决策的制定。
解决学术问题
该数据集解决了医疗影像分析中的多个关键学术问题。首先,通过Dataset 1和Dataset 2,研究者能够探索和验证基于影像的智能诊断模型,解决了传统诊断方法中时间窗不确定和组织类型识别困难的问题。其次,Dataset 3和Dataset 4分别针对患者预约失约和睡眠呼吸暂停的预测,提供了数据驱动的解决方案,填补了现有研究中的空白,推动了医疗资源优化和患者管理效率的提升。
实际应用
在实际应用中,该数据集显著提升了医疗服务的效率和质量。例如,Dataset 1和Dataset 2的应用使得医疗机构能够更快速、准确地进行脑卒中和乳腺癌的诊断,从而提高患者的生存率和生活质量。Dataset 3则通过预测患者失约情况,帮助医院优化资源配置,减少经济损失。Dataset 4的应用则有助于早期识别睡眠呼吸暂停患者,提供个性化治疗方案,改善患者的生活质量。
数据集最近研究
最新研究方向
在医疗影像分析领域,Dataset Repository的最新研究方向主要集中在利用人工智能算法提升对复杂疾病的诊断精度。具体而言,针对急性脑卒中(ACV)患者的治疗窗口期预测,研究者们正探索通过计算机断层扫描(CT)图像的深度学习模型,以辅助临床决策。此外,乳腺组织类型的分类研究也在推进,旨在通过数字乳腺摄影图像的分析,提高乳腺癌早期检测的准确性。同时,针对医疗预约的缺席预测,研究者们利用历史数据和社会人口统计信息,开发模型以优化资源分配和提升患者依从性。这些研究不仅在技术上推动了医疗影像处理的发展,也在实际应用中为医疗决策提供了有力支持。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作