SAT-DS
收藏github2024-06-04 更新2024-06-06 收录
下载链接:
https://github.com/zhaoziheng/SAT-DS
下载链接
链接失效反馈官方服务:
资源简介:
SAT-DS是一个医学数据收集,包含72个公共分割数据集,涵盖超过22K 3D图像,302K分割掩码和497个类别,涉及3种不同模态(MRI, CT, PET)和8个人体区域。
SAT-DS is a medical data collection comprising 72 publicly available segmentation datasets, encompassing over 22,000 3D images, 302,000 segmentation masks, and 497 categories. It spans three different modalities (MRI, CT, PET) and eight human body regions.
创建时间:
2024-06-03
原始信息汇总
数据集概述
数据集名称: SAT-DS
数据集描述: SAT-DS是一个包含72个公共分割数据集的医学数据集合,涵盖了超过22,000个3D图像、302,000个分割掩码和497个类别。这些数据来自3种不同的成像模式(MRI, CT, PET)和8个人体部位。
数据集构建过程
- 数据收集: 收集尽可能多的公共3D医学分割数据集,并编译其基本信息。
- 数据检查与标准化: 检查并标准化每个数据集中的图像扫描,包括方向、间距和强度。
- 标签标准化: 检查、标准化并合并每个数据集中的类别标签名称。
- 数据分割: 根据患者ID仔细将每个数据集分割为训练集和测试集。
数据集提供的资源
- 数据访问: 提供SAT-DS中每个数据集的访问权限。
- 数据获取代码: 提供获取每个数据集样本的代码。
- 数据加载代码: 提供加载样本的代码,包括标准化图像和标准化类别名称。
- 数据可视化代码: 提供可视化和检查样本的代码。
- 数据准备代码: 提供准备SAT所需格式的数据代码。
- 数据分割代码: 提供将数据集分割为训练集和测试集的代码。
数据集用途
- 预处理和统一化: 用于预处理和统一化大规模、全面的3D医学分割数据集,适合训练基于文本提示的通用分割模型。
- 数据准备: 用于准备训练和测试数据,以供SAT使用。
数据集详细列表
| 数据集名称 | 成像模式 | 部位 | 类别数 | 扫描数 | 下载链接 |
|---|---|---|---|---|---|
| AbdomenCT1K | CT | 腹部 | 4 | 988 | https://github.com/JunMa11/AbdomenCT-1K |
| ACDC | CT | 胸部 | 4 | 300 | https://humanheart-project.creatis.insa-lyon.fr/database/ |
| AMOS CT | CT | 腹部 | 16 | 300 | https://zenodo.org/records/7262581 |
| AMOS MRI | MRI | 胸部 | 16 | 60 | https://zenodo.org/records/7262581 |
| ATLASR2 | MRI | 大脑 | 1 | 654 | http://fcon_1000.projects.nitrc.org/indi/retro/atlas.html |
| ATLAS | MRI | 腹部 | 2 | 60 | https://atlas-challenge.u-bourgogne.fr |
| autoPET | PET | 全身 | 1 | 501 | https://wiki.cancerimagingarchive.net/pages/viewpage.action?pageId=93258287 |
| ... | ... | ... | ... | ... | ... |
| WORD | CT | 腹部 | 18 | 150 | https://github.com/HiLab-git/WORD |
此列表包含了所有数据集的详细信息,包括成像模式、部位、类别数、扫描数和下载链接。
搜集汇总
数据集介绍

构建方式
在构建SAT-DS数据集时,研究团队广泛收集了72个公开的医学分割数据集,涵盖了超过22,000个3D图像、302,000个分割掩码以及497个类别,涉及MRI、CT和PET三种成像模态以及人体八个主要部位。团队对每个数据集进行了图像扫描的校正和标准化处理,包括方向、间距和强度,并统一了标签名称,确保数据集之间的兼容性。此外,团队还根据患者ID对每个数据集进行了训练集和测试集的划分,以确保数据集的完整性和可用性。
使用方法
使用SAT-DS数据集时,用户可以选择从官方提供的下载链接获取数据,并将其解压至指定目录。对于需要进一步预处理的数据集,用户可以运行processor.py脚本,生成包含图像和掩码信息的jsonl文件。随后,用户可以使用loader.py脚本加载数据,该脚本会自动对图像进行标准化处理,并输出统一格式的图像张量、掩码张量、类别名称列表和成像模态信息。用户可以根据需要调整加载脚本,以适应不同的模型训练需求。
背景与挑战
背景概述
SAT-DS数据集是由Zhao Ziheng及其团队创建的一个综合性医学数据集,旨在推动3D放射影像的分割研究。该数据集汇集了72个公开的分割数据集,包含超过22,000个3D图像、302,000个分割掩码和497个类别,涵盖MRI、CT和PET三种成像模态以及人体8个主要区域。SAT-DS的构建不仅为医学图像分割领域提供了丰富的资源,还为开发基于文本提示的通用分割模型奠定了基础。该数据集的创建时间可追溯至2023年,其核心研究问题是如何通过整合多模态和多区域的医学图像数据,提升分割模型的泛化能力和准确性。SAT-DS的发布对医学图像分析领域产生了深远影响,为研究人员提供了一个标准化的数据平台,促进了跨模态和跨区域的分割算法研究。
当前挑战
SAT-DS数据集在构建过程中面临多项挑战。首先,整合来自不同模态和区域的72个公开数据集,确保数据的一致性和标准化处理是一个复杂的过程。其次,数据集的预处理和归一化,包括图像方向、间距和强度的校正,需要精确的技术和大量的计算资源。此外,标签名称的标准化和合并,以及根据患者ID进行训练和测试集的划分,都是构建过程中必须解决的问题。这些挑战不仅涉及技术层面的难题,还包括对数据隐私和伦理的严格遵守。尽管如此,SAT-DS通过提供预处理和打包的数据集,极大地简化了用户的使用流程,但如何进一步优化数据处理效率和提升模型的泛化能力仍是未来研究的重点。
常用场景
经典使用场景
在医学影像分析领域,SAT-DS数据集以其庞大的规模和多样的数据类型成为研究者们的宝贵资源。该数据集包含了72个公开的分割数据集,涵盖了超过22,000个3D图像、302,000个分割掩码以及497个类别,涉及MRI、CT和PET三种成像模态以及人体8个主要区域。这些数据被广泛用于训练和微调通用分割模型,如基于文本提示驱动的3D放射扫描分割模型。通过标准化和归一化处理,SAT-DS确保了不同数据集之间的一致性,从而为跨模态和跨区域的分割任务提供了坚实的基础。
解决学术问题
SAT-DS数据集在解决医学影像分析中的多个学术问题上具有重要意义。首先,它通过整合多种模态和区域的医学影像数据,解决了数据异质性问题,使得跨模态和跨区域的分割模型训练成为可能。其次,数据集的标准化和归一化处理,有效解决了不同数据集之间图像质量和标签不一致的问题,提升了模型的泛化能力和鲁棒性。此外,SAT-DS还为研究者提供了丰富的数据资源,推动了医学影像分割技术的发展,特别是在多模态融合和自动化分割算法的研究上,具有深远的影响。
实际应用
在实际应用中,SAT-DS数据集为医学影像分析提供了强大的支持。例如,在临床诊断中,医生可以利用基于SAT-DS训练的分割模型,快速准确地识别和定位病变区域,从而提高诊断效率和准确性。此外,该数据集还支持药物研发过程中的影像分析,帮助研究人员更精确地评估药物疗效和副作用。在公共卫生领域,SAT-DS的应用也有助于大规模流行病学研究,通过自动化影像分析,快速识别和跟踪疾病传播情况。总之,SAT-DS在提升医学影像分析的效率和精度方面具有广泛的应用前景。
数据集最近研究
最新研究方向
在医学影像分析领域,SAT-DS数据集的最新研究方向主要集中在构建通用的3D放射影像分割模型。该数据集整合了来自MRI、CT和PET三种模态的超过22,000个3D图像和302,000个分割掩码,涵盖8个不同的人体区域和497个类别。研究者们致力于通过文本提示驱动的方法,开发能够处理多种模态和复杂解剖结构的通用分割模型。这一研究不仅推动了医学影像分析技术的前沿发展,还为临床诊断和治疗提供了更为精确和高效的工具,具有重要的实际应用价值。
以上内容由遇见数据集搜集并总结生成



