SAROS
收藏数据集概述
数据集名称
- SAROS - A large, heterogeneous, and sparsely annotated segmentation dataset on CT imaging data
数据集内容
- CT图像数据及其分割信息
- 包含多个病例,每个病例包含图像和分割数据
数据集下载
- 安装包管理器poetry
- 克隆仓库:
git clone https://github.com/UMEssen/saros-dataset - 安装依赖:
poetry install --no-dev - 从TCIA下载NIfTI分割数据
- 运行下载脚本:
poetry run python3 download.py
数据集存储
- 默认存储目录为
data,可通过--target-dir参数更改 - 分割信息CSV文件可通过
--info-csv参数指定位置
特殊注意事项
- 部分CT病例(
case_609,case_623,case_816)具有异常的CT值(如-3000 HU),使用时需注意
数据集使用示例
- 提供了使用nnUNet模型进行训练和评估的示例
- 需要将数据转换为nnUNet格式后进行训练和评估
引用信息
-
使用此数据集时,请引用:
Koitka, S., Baldini, G., Kroll, L., van Landeghem, N., Haubold, J., Sung Kim, M., Kleesiek, J., Nensa, F., & Hosch, R. (2023). SAROS - A large, heterogeneous, and sparsely annotated segmentation dataset on CT imaging data (SAROS) (Version 1) [Data set]. The Cancer Imaging Archive. https://doi.org/10.25737/SZ96-ZG60
Clark, K., Vendt, B., Smith, K., Freymann, J., Kirby, J., Koppel, P., Moore, S., Phillips, S., Maffitt, D., Pringle, M., Tarbox, L., & Prior, F. (2013). The Cancer Imaging Archive (TCIA): Maintaining and Operating a Public Information Repository. In Journal of Digital Imaging (Vol. 26, Issue 6, pp. 1045–1057). Springer Science and Business Media LLC. https://doi.org/10.1007/s10278-013-9622-7




