IST-3 CT Head Scans|医学影像数据集|中风研究数据集
收藏CT扫描叠加工具
安装
-
克隆仓库: bash git clone https://github.com/bjin96/superimposition-tool.git
-
安装依赖: bash pip install -r requirements.txt
-
确保安装Qt5,按照Qt文档中的说明进行安装。
运行
在config.json
中设置变量:
变量 | 描述 |
---|---|
batch_size | 一次叠加的扫描数量。 |
template_path | 所有扫描共注册到的模板路径(NIfTI格式,.nii.gz )。 |
blacklist_path | 存储黑名单路径的JSON文件路径。如果文件不存在,将会创建。 |
input_file_list_path | 包含待分析CT扫描路径的JSON文件路径。 |
黑名单文件格式: json [ { "file": "/path/to/the/blacklisted/file1.nii.gz", "reason": "First comment" }, { "file": "/path/to/the/blacklisted/file2.nii.gz", "reason": "Second comment" }, ... ]
输入文件列表格式: json [ "/path/to/the/blacklisted/file1.nii.gz", "/path/to/the/blacklisted/file2.nii.gz", ... ]
启动工具: bash python run.py

- 1Pre-processing and quality control of large clinical CT head datasets for intracranial arterial calcification segmentation爱丁堡大学临床脑科学中心 · 2024年
LibriSpeech
LibriSpeech 是一个大约 1000 小时的 16kHz 英语朗读语音语料库,由 Vassil Panayotov 在 Daniel Povey 的协助下编写。数据来自 LibriVox 项目的已读有声读物,并经过仔细分割和对齐。
OpenDataLab 收录
中国行政区划数据
本项目为中国行政区划数据,包括省级、地级、县级、乡级和村级五级行政区划数据。数据来源于国家统计局,存储格式为sqlite3 db文件,支持直接使用数据库连接工具打开。
github 收录
CliMedBench
CliMedBench是一个大规模的中文医疗大语言模型评估基准,由华东师范大学等机构创建。该数据集包含33,735个问题,涵盖14个核心临床场景,主要来源于顶级三级医院的真实电子健康记录和考试练习。数据集的创建过程包括专家指导的数据选择和多轮质量控制,确保数据的真实性和可靠性。CliMedBench旨在评估和提升医疗大语言模型在临床决策支持、诊断和治疗建议等方面的能力,解决医疗领域中模型性能评估的不足问题。
arXiv 收录
MOOCs Dataset
该数据集包含了大规模开放在线课程(MOOCs)的相关数据,包括课程信息、用户行为、学习进度等。数据主要用于研究在线教育的行为模式和学习效果。
www.kaggle.com 收录
CatMeows
该数据集包含440个声音样本,由21只属于两个品种(缅因州库恩猫和欧洲短毛猫)的猫在三种不同情境下发出的喵声组成。这些情境包括刷毛、在陌生环境中隔离和等待食物。每个声音文件都遵循特定的命名约定,包含猫的唯一ID、品种、性别、猫主人的唯一ID、录音场次和发声计数。此外,还有一个额外的zip文件,包含被排除的录音(非喵声)和未剪辑的连续发声序列。
huggingface 收录