five

RAOS|医学影像数据集|器官分割数据集

收藏
arXiv2024-06-20 更新2024-06-24 收录
医学影像
器官分割
下载链接:
https://github.com/Luoxd1996/RAOS
下载链接
链接失效反馈
资源简介:
RAOS数据集是由中国电子科技大学和上海AI实验室合作创建,包含413个腹部CT扫描数据,涵盖约80k 2D图像和8k 3D器官标注,涉及19种不同器官。该数据集特别关注临床挑战性案例,如器官切除后的情况,旨在评估模型在复杂场景下的鲁棒性。数据集的创建过程包括由资深肿瘤学家手动标注,确保了数据的高质量和准确性。RAOS数据集的应用领域主要集中在腹部器官分割,特别是在放射治疗规划中,以提高诊断和治疗的精确性。
提供机构:
中国电子科技大学
创建时间:
2024-06-20
原始信息汇总

RAOS 数据集概述

数据集内容

  • 类型与数量:包含413个真实临床CT扫描和413x9个MR扫描。
  • 标注内容:所有19个器官均由资深肿瘤学家(MD. Wenjun Liao,10年经验)进行标注。
  • 特殊标注:包含一些在先前公开数据集中未出现的器官标注,如前列腺、精囊等。

数据集特点

  • 挑战性案例:包含一些临床实践中具有挑战性的案例,有助于评估深度学习方法的泛化能力和鲁棒性。

数据获取

  • 申请流程
    1. 使用Google邮箱申请下载权限。
    2. 使用机构邮箱获取解压密码或百度网盘访问码。
  • 回复时间:申请后将在两天内回复。
  • 申请要求:仅处理实名邮箱,且邮箱后缀必须与机构匹配。

引用信息

  • 推荐引用: plaintext @article{luo2022word, title={{WORD}: A large-scale dataset, benchmark and clinically applicable study for abdominal organ segmentation from CT image}, author={Xiangde Luo, Wenjun Liao, Jianghong Xiao, Jieneng Chen, Tao Song, Xiaofan Zhang, Kang Li, Dimitris N. Metaxas, Guotai Wang, and Shaoting Zhang}, journal={Medical Image Analysis}, volume={82}, pages={102642}, year={2022}, publisher={Elsevier}}

    @article{luo2024rethinking, title={Rethinking Abdominal Organ Segmentation (RAOS) in the clinical scenario: A robustness evaluation benchmark with challenging cases}, author={Luo, Xiangde and Li, Zihan and Zhang, Shaoting and Liao, Wenjun and Wang, Guotai}, booktitle={Medical Image Computing and Computer Assisted Intervention -- MICCAI 2024}, year={2024}, pages={}}

AI搜集汇总
数据集介绍
main_image_url
构建方式
RAOS数据集的构建基于413例患者的CT扫描图像,这些患者均患有腹部病变并接受了不同的治疗策略。数据集包含了约80,000张2D图像和约8,000个3D器官标注,涵盖了17(女性)或19(男性)种腹部器官。这些标注由资深肿瘤学家手动绘制,并根据临床信息将扫描分为三类:诊断/放疗、部分切除但器官未缺失、以及器官完全缺失的切除手术。RAOS数据集的构建旨在提供一个评估模型鲁棒性的基准,特别是针对临床中的复杂和极端情况。
特点
RAOS数据集的显著特点在于其全面性和临床相关性。首先,它包含了大量的高质量手动标注,涵盖了多种腹部器官,包括一些在公共数据集中难以获取的器官,如直肠、结肠、肠道、前列腺和精囊。其次,数据集中的病例涵盖了多种临床治疗策略,包括手术、放疗、化疗和免疫疗法,这使得数据集能够有效评估模型在不同临床场景下的鲁棒性和泛化能力。此外,RAOS数据集还特别关注了器官切除手术后的情况,引入了新的解剖学变化,从而增加了模型的挑战性。
使用方法
RAOS数据集主要用于评估和提升腹部器官分割模型的鲁棒性和泛化能力。研究者可以使用该数据集来训练和验证其分割算法,特别是在处理复杂临床情况和极端病例时的表现。数据集的三个子集(无手术、部分切除和完全切除)可以分别用于模型的训练、内部评估和鲁棒性测试。此外,RAOS数据集还可以用于跨数据集的泛化能力研究,通过与其他公共数据集(如BTCV、AMOS和AbdomenCT-1K)的对比,评估模型在不同数据分布下的表现。
背景与挑战
背景概述
在临床场景中,腹部多器官分割的准确性和鲁棒性对于恶性肿瘤的诊断、治疗和随访至关重要。近年来,深度学习技术在腹部多器官分割任务中取得了显著进展,甚至在常见病例中超越了初级肿瘤学家。然而,在边缘病例和复杂器官的分割中,模型的鲁棒性仍然是一个开放的挑战。为了研究模型的鲁棒性,RAOS数据集由电子科技大学和上海人工智能实验室的研究团队于2024年创建,包含了413例患者的413个CT扫描数据(约8万张2D图像和约8千个3D器官标注)。该数据集根据临床信息分为三组:诊断/放疗、部分切除未缺失整个器官、以及切除导致整个器官缺失。RAOS数据集不仅提供了全面的器官标注,还引入了一些在公共数据集中难以获取的器官,如直肠、结肠、肠道、前列腺和精囊。该数据集的建立为评估模型在临床挑战性病例中的鲁棒性提供了潜在的基准。
当前挑战
RAOS数据集在构建过程中面临多个挑战。首先,数据集需要涵盖广泛的临床场景,包括不同类型的癌症和治疗策略,这要求数据集具有高度的多样性和代表性。其次,数据集中的器官标注需要由资深肿瘤学家手动完成,确保标注的准确性和可靠性。此外,数据集中包含了手术干预后的病例,这些病例的正常解剖结构被破坏,引入了新的领域偏移,进一步增加了模型的鲁棒性要求。最后,数据集还需要解决器官幻觉问题,即模型在器官缺失后仍可能产生错误的器官预测。这些挑战不仅影响了数据集的构建过程,也对其在实际临床应用中的有效性提出了更高的要求。
常用场景
经典使用场景
RAOS数据集在腹部多器官分割领域中被广泛应用于评估模型的鲁棒性和泛化能力。其经典使用场景包括对常见病例和复杂病例的分割性能进行基准测试,特别是在放射治疗规划中,对19种腹部器官进行精确分割。此外,RAOS还用于研究手术后器官缺失情况下的分割幻觉问题,为临床应用提供了重要的数据支持。
实际应用
RAOS数据集在实际应用中主要用于放射治疗规划和腹部手术后的器官分割。在放射治疗中,准确的器官分割对于剂量计算至关重要,而RAOS提供的详细标注和复杂病例数据极大地提升了治疗计划的精确性。此外,手术后器官缺失的分割问题在临床实践中具有重要意义,RAOS为此类问题的研究提供了宝贵的数据资源。
衍生相关工作
基于RAOS数据集,研究者们开发了多种先进的分割算法,如nnUNet、Swin UNETR和3DUXNET等,这些算法在RAOS的基准测试中表现出色。此外,RAOS还促进了跨数据集的泛化能力研究,推动了领域内模型在不同数据集上的适应性和鲁棒性评估。这些相关工作不仅提升了医学图像分割技术的水平,也为未来的研究提供了新的方向。
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

LFW

人脸数据集;LFW数据集共有13233张人脸图像,每张图像均给出对应的人名,共有5749人,且绝大部分人仅有一张图片。每张图片的尺寸为250X250,绝大部分为彩色图像,但也存在少许黑白人脸图片。 URL: http://vis-www.cs.umass.edu/lfw/index.html#download

AI_Studio 收录

LibriSpeech

LibriSpeech 是一个大约 1000 小时的 16kHz 英语朗读语音语料库,由 Vassil Panayotov 在 Daniel Povey 的协助下编写。数据来自 LibriVox 项目的已读有声读物,并经过仔细分割和对齐。

OpenDataLab 收录

Houston2013, Berlin, Augsburg

本研究发布了三个多模态遥感基准数据集:Houston2013(高光谱和多光谱数据)、Berlin(高光谱和合成孔径雷达数据)和Augsburg(高光谱、合成孔径雷达和数字表面模型数据)。这些数据集用于土地覆盖分类,旨在通过共享和特定特征学习模型(S2FL)评估多模态基线。数据集包含不同模态和分辨率的图像,适用于评估和开发新的遥感图像处理技术。

arXiv 收录

Obstacle-dataset OD

该数据集用于十五种障碍物检测,包含VOC格式和YOLO训练的.txt文件,数据集中的图像来自VOC数据集、COCO数据集、TT100K数据集以及作者团队实地收集的图片。

github 收录

Wind Turbine Data

该数据集包含风力涡轮机的运行数据,包括风速、风向、发电量等参数。数据记录了多个风力涡轮机在不同时间点的运行状态,适用于风能研究和风力发电系统的优化分析。

www.kaggle.com 收录