five

QiaoyuZheng/RP3D-DiagDS

收藏
Hugging Face2024-06-08 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/QiaoyuZheng/RP3D-DiagDS
下载链接
链接失效反馈
官方服务:
资源简介:
# RP3D-DiagDS **Overview of RP3D-DiagDS.** There are **39,026 cases (192,675 scans)** across 7 human anatomy regions and 9 diverse modalities covering **930 ICD-10-CM codes**. ![results](./RP3D-DiagDS.png) ## About Dataset There are totally 4 json files: 1. **RP3D_train**.json: Data used for model training. This file is organized at case level (there may be more than one kind of modality and anatomy in a case. For more details, refer to the paper [Large-scale Long-tailed Disease Diagnosis on Radiology](https://qiaoyu-zheng.github.io/RP3D-Diag). 2. **RP3D_test_json**: Data used for model evaluation. 3. **disorder_label_dict.json**: For disorder granularity. There are totally 5569 ( 5568 abnormal and 1 noraml) label. There disorders are sorted in descending order based on the corresponding case number for evaluation. 4. **icd10_label_dict.json**: For ICD-10-CM granularity. There are totally 931 ( 930 abnormal and 1 noraml) label. There disorders are sorted in descending order based on the corresponding case number for evaluation. **Attention! In RP3D_{train/test}.json file. A 'url' key corresponds to a 'Case', and there maybe multiple 'samples' in a 'Case' under the 'Samples' key.** ## About Model Checkpoint Please refer to [RP3D-DiagModel](https://huggingface.co/QiaoyuZheng/RP3D-DiagModel) For more information about the code please refer to our instructions on [github](https://github.com/qiaoyu-zheng/RP3D-Diag) to download and use.

# RP3D-DiagDS ## RP3D-DiagDS 概述 该数据集涵盖7个人体解剖区域、9种多样化模态,总计39026例病例(含192675次扫描),覆盖930个ICD-10-CM(International Classification of Diseases, 10th Revision, Clinical Modification)编码。 ![results](./RP3D-DiagDS.png) ## 数据集说明 该数据集共包含4个JSON文件: 1. **RP3D_train.json**:用于模型训练的数据集。该文件以病例为单位进行组织(单病例可包含多种模态与解剖结构数据)。如需了解更多细节,请参阅论文《Large-scale Long-tailed Disease Diagnosis on Radiology》(链接:https://qiaoyu-zheng.github.io/RP3D-Diag)。 2. **RP3D_test_json**:用于模型评估的数据集。 3. **disorder_label_dict.json**:用于疾病粒度标注。共包含5569个标签(其中5568个为异常标签,1个为正常标签)。为便于评估,所有疾病标签均按对应病例数降序排列。 4. **icd10_label_dict.json**:用于ICD-10-CM粒度标注。共包含931个标签(其中930个为异常标签,1个为正常标签)。为便于评估,所有疾病标签均按对应病例数降序排列。 **注意!在RP3D_{train/test}.json文件中,一个`url`键对应一个`Case`(病例),且单个`Case`在`Samples`键下可包含多个`samples`(样本)。** ## 模型检查点说明 请参阅 [RP3D-DiagModel](https://huggingface.co/QiaoyuZheng/RP3D-DiagModel) 获取模型检查点相关内容。 如需获取更多代码相关信息,请参阅我们在GitHub上的说明文档(https://github.com/qiaoyu-zheng/RP3D-Diag)以进行下载与使用。
提供机构:
QiaoyuZheng
原始信息汇总

RP3D-DiagDS 数据集概述

数据集概览

RP3D-DiagDS 数据集包含 39,026 个病例(192,675 次扫描),涵盖 7 个人体解剖区域和 9 种不同模态,涉及 930 个 ICD-10-CM 编码

数据文件说明

数据集包含 4 个 JSON 文件:

  1. RP3D_train.json: 用于模型训练的数据文件,按病例级别组织(一个病例可能包含多种模态和解剖区域)。更多细节请参考论文 Large-scale Long-tailed Disease Diagnosis on Radiology
  2. RP3D_test.json: 用于模型评估的数据文件。
  3. disorder_label_dict.json: 用于疾病粒度标签,共包含 5569 个标签(5568 个异常和 1 个正常),按相应病例数量降序排列,用于评估。
  4. icd10_label_dict.json: 用于 ICD-10-CM 粒度标签,共包含 931 个标签(930 个异常和 1 个正常),按相应病例数量降序排列,用于评估。

注意:在 RP3D_{train/test}.json 文件中,url 键对应一个 Case,一个 Case 下可能包含多个 samples 在 Samples 键下。

搜集汇总
数据集介绍
main_image_url
构建方式
RP3D-DiagDS数据集的构建,是基于大规模医学影像资料,涵盖7个人体解剖区域和9种不同的成像模态,总计包含39,026个案例(192,675次扫描)。该数据集的构建采用了病例级别的组织方式,每个病例可能包含多种模态和解剖结构。数据集的构建旨在服务于大规模、长尾分布疾病的放射学诊断任务,其详细构建逻辑可在相关论文中查阅。
特点
该数据集的特点在于其规模宏大,覆盖了930个ICD-10-CM编码,并提供了5569个疾病标签,其中包含5568个异常标签和1个正常标签。数据集的标签按照病例数量进行了降序排列,便于评估模型性能。此外,数据集通过四个JSON文件提供,分别用于模型训练、模型评估、疾病细粒度标签和ICD-10-CM细粒度标签。
使用方法
在使用RP3D-DiagDS数据集时,用户可以访问四个JSON文件,其中RP3D_train.json和RP3D_test.json分别用于模型训练和评估。每个JSON文件中的'Case'键对应一个URL,每个'Case'下可能包含多个样本。用户需遵循数据集的使用指南,在GitHub上获取代码,并根据相关说明下载和使用数据集。
背景与挑战
背景概述
RP3D-DiagDS数据集是在医学影像分析领域中的一项重要成果,由Qiaoyu Zheng等人创建于近年来。该数据集集合了39,026个病例,包含192,675次扫描,跨越了人体七个解剖区域,并涵盖了九种不同的成像模式,对应930个ICD-10-CM诊断代码。其研究背景旨在推动大规模医学影像诊断技术的发展,特别是在应对长尾分布疾病诊断的挑战上。该数据集的构建,不仅丰富了医学影像诊断领域的资源,也为相关研究提供了强有力的数据支撑,对促进医学影像分析技术的发展具有显著影响。
当前挑战
该数据集在构建和应用过程中面临了多重挑战。首先,在领域问题上,RP3D-DiagDS需解决的是如何提高医学影像中长尾分布疾病的诊断准确率。其次,在构建过程中,数据集的多样性和大规模特性带来了数据清洗、标注一致性以及数据隐私保护等方面的挑战。此外,不同成像模式和疾病种类的广泛覆盖要求模型具有高度的泛化能力,这对数据集的构建和质量控制提出了更高的要求。
常用场景
经典使用场景
在医学影像分析领域,RP3D-DiagDS数据集的运用尤为关键。该数据集以其大规模和多样性,成为构建和训练医学诊断模型的基石。经典的使用场景包括,研究者利用RP3D_train.json文件进行模型的训练,通过其中丰富的病例和多种模态的影像资料,使得模型能够学习到不同解剖区域和疾病之间的复杂关联,进而提高疾病诊断的准确性和效率。
衍生相关工作
RP3D-DiagDS数据集的发布,促进了医学影像分析领域的一系列相关工作。例如,基于该数据集的研究成果不断涌现,包括疾病诊断模型的构建、优化以及多模态影像数据的融合处理等,这些研究进一步拓宽了医学影像分析的应用领域,推动了医疗信息化和智能化的进程。
数据集最近研究
最新研究方向
RP3D-DiagDS数据集汇聚了大规模的医学影像资料,其研究领域聚焦于医学影像诊断的深度学习模型训练与评估。近期,该数据集推动了针对放射学影像的细粒度疾病诊断研究,尤其是在长尾分布疾病诊断方面的探索。通过整合多种模态和人体解剖区域的影像数据,该数据集使得研究者能够构建更为精确的疾病诊断模型,对于提升医学影像分析领域的智能诊断能力具有重要意义。此外,该数据集的应用还与当前的医疗信息化趋势紧密相关,为临床决策提供了有力的数据支撑。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作