IST-3 CT Head Scans|医学影像数据集|中风研究数据集

arXiv2024-08-02 更新2024-08-07 收录

医学影像

中风研究

下载链接：

https://github.com/bjin96/superimposition-tool

下载链接

链接失效反馈

资源简介：

IST-3 CT头部扫描数据集由爱丁堡大学临床脑科学中心创建，包含10,659个CT系列，用于研究颅内动脉钙化的分割。数据集来源于第三届国际中风试验（IST-3），涉及3035名急性缺血性中风患者的非增强CT扫描。数据集创建过程中，通过与模板配准和质量控制，确保了数据的有效性和准确性。该数据集主要用于支持深度学习方法在中风风险评估中的应用，特别是在颅内动脉钙化的自动量化方面。

提供机构：

爱丁堡大学临床脑科学中心

创建时间：

2024-08-02

原始信息汇总

CT扫描叠加工具

安装

克隆仓库： bash git clone https://github.com/bjin96/superimposition-tool.git
安装依赖： bash pip install -r requirements.txt
确保安装Qt5，按照Qt文档中的说明进行安装。

运行

在config.json中设置变量：

变量	描述
batch_size	一次叠加的扫描数量。
template_path	所有扫描共注册到的模板路径（NIfTI格式，`.nii.gz`）。
blacklist_path	存储黑名单路径的JSON文件路径。如果文件不存在，将会创建。
input_file_list_path	包含待分析CT扫描路径的JSON文件路径。

黑名单文件格式： json [ { "file": "/path/to/the/blacklisted/file1.nii.gz", "reason": "First comment" }, { "file": "/path/to/the/blacklisted/file2.nii.gz", "reason": "Second comment" }, ... ]

输入文件列表格式： json [ "/path/to/the/blacklisted/file1.nii.gz", "/path/to/the/blacklisted/file2.nii.gz", ... ]

启动工具： bash python run.py

AI搜集汇总

数据集介绍

构建方式

IST-3 CT Head Scans数据集的构建基于第三国际中风试验（IST-3）中的临床CT头部扫描数据。研究团队从IST-3试验中提取了10,659个CT系列，涵盖了2,578名患者的扫描数据。这些数据包括不同类型的CT扫描，如软组织和骨核成像、不同患者方向、以及单独的颅底和颅顶系列。数据集的构建过程中，研究团队采用了模板配准技术，将CT扫描与年龄匹配的磁共振成像（MRI）模板进行配准，以确保数据的一致性和准确性。此外，通过信息分布沿z轴的分组和相似性度量，对图像系列进行了质量控制，确保了数据集的高质量。

使用方法

IST-3 CT Head Scans数据集主要用于颅内动脉钙化（IAC）的分割和评分研究。研究者可以利用该数据集训练深度学习模型，以自动识别和量化CT头部扫描中的IAC。使用该数据集时，研究者应首先进行数据预处理，包括将DICOM格式转换为NIfTI格式，并进行轴向系列的限制和本地化器的移除。随后，通过配准和质量控制步骤，确保数据的准确性和一致性。最终，研究者可以利用经过处理的CT系列进行IAC的分割和评分，从而为中风风险的评估提供支持。

背景与挑战

背景概述

IST-3 CT Head Scans数据集由爱丁堡大学临床脑科学中心主导，联合多个研究机构共同创建，旨在解决颅内动脉钙化（IAC）的分割问题。该数据集源自第三届国际卒中试验（IST-3），包含10,659个CT扫描系列，覆盖2,578名患者的临床数据。IAC作为一种潜在的非侵入性生物标志物，对于卒中风险的评估具有重要意义。然而，现有的深度学习方法在临床影像数据上的应用仍处于探索阶段，因此构建一个高质量、异质性强的临床CT数据集对于训练和验证这些方法至关重要。该数据集的创建不仅填补了临床影像数据在IAC分割领域的空白，还为未来的深度学习模型提供了宝贵的训练资源。

当前挑战

IST-3 CT Head Scans数据集在构建过程中面临多项挑战。首先，数据集的异质性导致数据异常和质量问题，如扫描参数、患者体位和图像分辨率的不一致。其次，数据预处理和质量控制过程复杂，需要高效的图像配准和相似性度量方法来确保数据的一致性和可用性。此外，数据集中存在大量的不可恢复样本和配准失败案例，这些都需要通过精细的质量控制流程进行筛选和排除。最后，尽管数据集已经过严格的质量控制，但其异质性和临床数据的复杂性仍对深度学习模型的训练提出了更高的要求，需要进一步研究和优化以提升模型的泛化能力和准确性。

常用场景

经典使用场景

IST-3 CT Head Scans数据集的经典使用场景主要集中在颅内动脉钙化（IAC）的分割与风险评估。通过该数据集，研究者能够训练和验证深度学习模型，以自动识别和量化CT头部扫描中的IAC区域。这种自动化方法不仅提高了钙化评分的准确性，还显著减少了人工评分的误差和时间成本。

解决学术问题

IST-3 CT Head Scans数据集解决了颅内动脉钙化与缺血性中风风险之间关系的不确定性问题。通过提供大规模、高质量的临床CT扫描数据，该数据集支持了深度学习模型的训练，从而能够更精确地预测中风风险。这不仅推动了中风预防和管理的科学研究，还为临床实践中的早期干预提供了有力支持。

实际应用

在实际应用中，IST-3 CT Head Scans数据集被广泛用于开发和优化自动化钙化评分工具。这些工具可以集成到医院的影像分析系统中，帮助临床医生快速、准确地评估患者的中风风险。此外，该数据集还支持了多中心研究，促进了不同医疗机构之间的数据共享和协作，进一步提升了中风风险评估的准确性和可靠性。

数据集最近研究

相关研究论文

1
Pre-processing and quality control of large clinical CT head datasets for intracranial arterial calcification segmentation爱丁堡大学临床脑科学中心 · 2024年

以上内容由AI搜集并总结生成

用户留言

有没有相关的论文或文献参考？

这个数据集是基于什么背景创建的？

数据集的作者是谁？

能帮我联系到这个数据集的作者吗？

这个数据集如何下载？

点击留言

数据主题

具身智能

数据集 4098个

机构 8个

大模型

数据集 439个

机构 10个

无人机

数据集 37个

机构 6个

指令微调

数据集 36个

机构 6个

蛋白质结构

数据集 50个

机构 8个

空间智能

数据集 21个

机构 5个

5,000+

优质数据集

54 个

任务类型

进入经典数据集

热门数据集

LibriSpeech

LibriSpeech 是一个大约 1000 小时的 16kHz 英语朗读语音语料库，由 Vassil Panayotov 在 Daniel Povey 的协助下编写。数据来自 LibriVox 项目的已读有声读物，并经过仔细分割和对齐。

OpenDataLab 收录

中国行政区划数据

本项目为中国行政区划数据，包括省级、地级、县级、乡级和村级五级行政区划数据。数据来源于国家统计局，存储格式为sqlite3 db文件，支持直接使用数据库连接工具打开。

github 收录

CliMedBench

CliMedBench是一个大规模的中文医疗大语言模型评估基准，由华东师范大学等机构创建。该数据集包含33,735个问题，涵盖14个核心临床场景，主要来源于顶级三级医院的真实电子健康记录和考试练习。数据集的创建过程包括专家指导的数据选择和多轮质量控制，确保数据的真实性和可靠性。CliMedBench旨在评估和提升医疗大语言模型在临床决策支持、诊断和治疗建议等方面的能力，解决医疗领域中模型性能评估的不足问题。

arXiv 收录

MOOCs Dataset

该数据集包含了大规模开放在线课程（MOOCs）的相关数据，包括课程信息、用户行为、学习进度等。数据主要用于研究在线教育的行为模式和学习效果。

www.kaggle.com 收录

CatMeows

该数据集包含440个声音样本，由21只属于两个品种（缅因州库恩猫和欧洲短毛猫）的猫在三种不同情境下发出的喵声组成。这些情境包括刷毛、在陌生环境中隔离和等待食物。每个声音文件都遵循特定的命名约定，包含猫的唯一ID、品种、性别、猫主人的唯一ID、录音场次和发声计数。此外，还有一个额外的zip文件，包含被排除的录音（非喵声）和未剪辑的连续发声序列。

huggingface 收录