lidc-idri-patches
收藏Hugging Face2024-12-05 更新2024-12-12 收录
下载链接:
https://huggingface.co/datasets/ykeselman/lidc-idri-patches
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含多个特征,如annotation_id、calcification、cluster_id、image、image_8bit、internalstructure、lobulation、malignancy、margin、patch_id和patient_id。每个特征都有其数据类型,并且对于类别标签,提供了可能的值及其含义。patient_id特征列出了LIDC-IDRI数据集中特定的患者标识符。
本数据集涵盖多类特征字段,包括标注ID(annotation_id)、钙化(calcification)、簇ID(cluster_id)、图像(image)、8位图像(image_8bit)、内部结构(internalstructure)、分叶征(lobulation)、恶性程度(malignancy)、边缘(margin)、斑块ID(patch_id)及患者ID(patient_id)。各特征均配有对应的数据类型;针对类别型标签,同步提供了其全部可选取值与相应语义。其中,患者ID(patient_id)字段的取值为LIDC-IDRI数据集中特定患者的标识符。
创建时间:
2024-12-02
原始信息汇总
LIDC-IDRI Patches 数据集概述
数据集配置
- 配置名称: default
- 数据文件路径:
- 训练集: data/train-*
数据集信息
特征
- annotation_id:
- 数据类型: int32
- calcification:
- 数据类型: class_label
- 类别名称:
- 0: Absent
- 1: Central
- 2: Laminated
- 3: Non-central
- 4: Popcorn
- 5: Solid
- cluster_id:
- 数据类型: int32
- image:
- 数据类型: image
- image_8bit:
- 数据类型: image
- internalstructure:
- 数据类型: class_label
- 类别名称:
- 0: Air
- 1: Fat
- 2: Fluid
- 3: Soft Tissue
- 4: Unknown
- lobulation:
- 数据类型: class_label
- 类别名称:
- 0: No Lobulation
- 1: Nearly No Lobulation
- 2: Medium Lobulation
- 3: Near Marked Lobulation
- 4: Marked Lobulation
- 5: Unknown
- malignancy:
- 数据类型: class_label
- 类别名称:
- 0: Highly Unlikely
- 1: Moderately Unlikely
- 2: Indeterminate
- 3: Moderately Suspicious
- 4: Highly Suspicious
- 5: Unknown
- margin:
- 数据类型: class_label
- 类别名称:
- 0: Poorly Defined
- 1: Near Poorly Defined
- 2: Medium Margin
- 3: Near Sharp
- 4: Sharp
- 5: Unknown
- patch_id:
- 数据类型: int32
- patient_id:
- 数据类型: class_label
- 类别名称:
- 0: LIDC-IDRI-0001
- 1: LIDC-IDRI-0002
- 2: LIDC-IDRI-0003
- 3: LIDC-IDRI-0004
- 4: LIDC-IDRI-0005
- 5: LIDC-IDRI-0006
- 6: LIDC-IDRI-0007
- 7: LIDC-IDRI-0008
- 8: LIDC-IDRI-0009
- 9: LIDC-IDRI-0010
- 10: LIDC-IDRI-0011
- 11: LIDC-IDRI-0012
- 12: LIDC-IDRI-0013
- 13: LIDC-IDRI-0014
- 14: LIDC-IDRI-0015
- 15: LIDC-IDRI-0016
- 16: LIDC-IDRI-0017
- 17: LIDC-IDRI-0018
- 18: LIDC-IDRI-0019
- 19: LIDC-IDRI-0020
- 20: LIDC-IDRI-0021
- 21: LIDC-IDRI-0022
- 22: LIDC-IDRI-0023
- 23: LIDC-IDRI-0024
- 24: LIDC-IDRI-0025
- 25: LIDC-IDRI-0026
- 26: LIDC-IDRI-0027
- 27: LIDC-IDRI-0029
- 28: LIDC-IDRI-0030
- 29: LIDC-IDRI-0031
- 30: LIDC-IDRI-0033
- 31: LIDC-IDRI-0034
- 32: LIDC-IDRI-0035
- 33: LIDC-IDRI-0036
- 34: LIDC-IDRI-0037
- 35: LIDC-IDRI-0038
- 36: LIDC-IDRI-0039
- 37: LIDC-IDRI-0040
- 38: LIDC-IDRI-0041
- 39: LIDC-IDRI-0042
- 40: LIDC-IDRI-0043
- 41: LIDC-IDRI-0044
- 42: LIDC-IDRI-0045
- 43: LIDC-IDRI-0046
- 44: LIDC-IDRI-0047
- 45: LIDC-IDRI-0048
- 46: LIDC-IDRI-0049
- 47: LIDC-IDRI-0050
- 48: LIDC-IDRI-0051
- 49: LIDC-IDRI-0052
- 50: LIDC-IDRI-0053
- 51: LIDC-IDRI-0054
- 52: LIDC-IDRI-0055
- 53: LIDC-IDRI-0056
- 54: LIDC-IDRI-0057
- 55: LIDC-IDRI-0058
- 56: LIDC-IDRI-0059
- 57: LIDC-IDRI-0060
- 58: LIDC-IDRI-0061
- 59: LIDC-IDRI-0063
- 60: LIDC-IDRI-0064
- 61: LIDC-IDRI-0065
- 62: LIDC-IDRI-0066
- 63: LIDC-IDRI-0067
- 64: LIDC-IDRI-0068
- 65: LIDC-IDRI-0069
- 66: LIDC-IDRI-0070
- 67: LIDC-IDRI-0072
- 68: LIDC-IDRI-0073
- 69: LIDC-IDRI-0074
- 70: LIDC-IDRI-0075
- 71: LIDC-IDRI-0076
- 72: LIDC-IDRI-0077
- 73: LIDC-IDRI-0078
- 74: LIDC-IDRI-0079
- 75: LIDC-IDRI-0080
- 76: LIDC-IDRI-0081
- 77: LIDC-IDRI-0082
- 78: LIDC-IDRI-0083
- 79: LIDC-IDRI-0084
- 80: LIDC-IDRI-0085
- 81: LIDC-IDRI-0086
- 82: LIDC-IDRI-0087
- 83: LIDC-IDRI-0088
- 84: LIDC-IDRI-0089
- 85: LIDC-IDRI-0090
- 86: LIDC-IDRI-0091
- 87: LIDC-IDRI-0092
- 88: LIDC-IDRI-0093
- 89: LIDC-IDRI-0094
- 90: LIDC-IDRI-0095
- 91: LIDC-IDRI-0096
- 92: LIDC-IDRI-0097
- 93: LIDC-IDRI-0098
- 94: LIDC-IDRI-0099
- 95: LIDC-IDRI-0101
- 96: LIDC-IDRI-0102
- 97: LIDC-IDRI-0103
- 98: LIDC-IDRI-0104
- 99: LIDC-IDRI-0105
- 100: LIDC-IDRI-0106
- 101: LIDC-IDRI-0107
- 102: LIDC-IDRI-0108
- 103: LIDC-IDRI-0109
- 104: LIDC-IDRI-0110
- 105: LIDC-IDRI-0111
- 106: LIDC-IDRI-0112
- 107: LIDC-IDRI-0113
- 108: LIDC-IDRI-0114
- 109: LIDC-IDRI-0115
- 110: LIDC-IDRI-0116
- 111: LIDC-IDRI-0117
- 112: LIDC-IDRI-0118
- 113: LIDC-IDRI-0119
- 114: LIDC-IDRI-0120
- 115: LIDC-IDRI-0121
- 116: LIDC-IDRI-0122
- 117: LIDC-IDRI-0123
- 118: LIDC-IDRI-0124
- 119: LIDC-IDRI-0125
- 120: LIDC-IDRI-0126
- 121: LIDC-IDRI-0127
- 122: LIDC-IDRI-0128
- 123: LIDC-IDRI-0129
- 124: LIDC-IDRI-0130
- 125: LIDC-IDRI-0131
- 126: LIDC-IDRI-0132
- 127: LIDC-IDRI-0133
- 128: LIDC-IDRI-0134
- 129: LIDC-IDRI-0135
- 130: LIDC-IDRI-0136
- 131: LIDC-IDRI-0137
- 132: LIDC-IDRI-0138
- 133: LIDC-IDRI-0139
- 134: LIDC-IDRI-0140
- 135: LIDC-IDRI-0141
- 136: LIDC-IDRI-0142
- 137: LIDC-IDRI-0144
- 138: LIDC-IDRI-0145
- 139: LIDC-IDRI-0146
- 140: LIDC-IDRI-0147
- 141: LIDC-IDRI-0148
- 142: LIDC-IDRI-0149
- 143: LIDC-IDRI-0150
- 144: LIDC-IDRI-0151
- 145: LIDC-IDRI-0152
- 146: LIDC-IDRI-0153
- 147: LIDC-IDRI-0154
- 148: LIDC-IDRI-0155
- 149: LIDC-IDRI-0156
- 150: LIDC-IDRI-0157
- 151: LIDC-IDRI-0158
- 152: LIDC-IDRI-0159
- 153: LIDC-IDRI-0160
- 154: LIDC-IDRI-0161
- 155: LIDC-IDRI-0162
- 156: LIDC-IDRI-0163
- 157: LIDC-IDRI-0164
- 158: LIDC-IDRI-0165
- 159: LIDC-IDRI-0166
- 160: LIDC-IDRI-0167
- 161: LIDC-IDRI-0168
- 162: LIDC-IDRI-0169
- 163: LIDC-IDRI-0170
- 164: LIDC-IDRI-0171
- 165: LIDC-IDRI-0172
- 166: LIDC-IDRI-0173
- 167: LIDC-IDRI-0175
- 168: LIDC-IDRI-0176
- 169: LIDC-IDRI-0177
- 170: LIDC-IDRI-0178
- 171: LIDC-IDRI-0179
- 172: LIDC-IDRI-0180
- 173: LIDC-IDRI-0181
- 174: LIDC-IDRI-0182
- 175: LIDC-IDRI-0183
- 176: LIDC-IDRI-0184
- 177: LIDC-IDRI-0185
- 178: LIDC-IDRI-0186
- 179: LIDC-IDRI-0187
- 180: LIDC-IDRI-0188
- 181: LIDC-IDRI-0190
- 182: LIDC-IDRI-0191
- 183: LIDC-IDRI-0192
- 184: LIDC-IDRI-0193
- 185: LIDC-IDRI-0194
- 186: LIDC-IDRI-0195
- 187: LIDC-IDRI-0196
- 188: LIDC-IDRI-0198
- 189: LIDC-IDRI-0199
- 190: LIDC-IDRI-0200
- 191: LIDC-IDRI-0201
- 192: LIDC-IDRI-0202
搜集汇总
数据集介绍

构建方式
LIDC-IDRI-Patches数据集的构建基于LIDC-IDRI数据库,该数据库包含了大量肺癌患者的CT扫描图像。数据集通过将原始CT图像分割成小块(patches),并对其进行标注,从而形成了包含多种特征的图像块集合。每个图像块都附带了详细的标注信息,如钙化程度、内部结构、边缘特征等,这些标注信息由专业放射科医生提供,确保了数据集的高质量和临床相关性。
特点
LIDC-IDRI-Patches数据集的显著特点在于其丰富的标注信息和多样化的图像特征。数据集不仅包含了图像本身,还提供了多种分类标签,如钙化程度、内部结构、边缘特征等,这些标签为研究者提供了多维度的分析视角。此外,数据集的图像块大小一致,便于模型训练和评估。通过这些特征,该数据集为肺癌的计算机辅助诊断提供了强有力的支持。
使用方法
LIDC-IDRI-Patches数据集适用于多种医学图像分析任务,尤其是肺癌的检测和分类。研究者可以通过加载数据集中的图像块和相应的标注信息,进行模型的训练和验证。数据集的多样性和详细标注使其成为开发和评估肺癌诊断算法的理想选择。使用时,建议结合深度学习框架,如TensorFlow或PyTorch,以充分利用数据集的特征进行模型训练和性能评估。
背景与挑战
背景概述
LIDC-IDRI-Patches数据集源自LIDC-IDRI(Lung Image Database Consortium and Image Database Resource Initiative)项目,该项目的核心目标是通过多模态影像数据集推动肺癌的早期检测与诊断研究。LIDC-IDRI数据集由美国国家癌症研究所(NCI)主导,汇集了多家研究机构和医院的贡献,涵盖了超过1000名患者的CT影像及其相应的专家标注。LIDC-IDRI-Patches数据集则进一步细化了这些影像数据,提取了局部区域(patches),旨在为计算机辅助诊断(CAD)系统提供更精细的训练和验证数据。该数据集的创建不仅为肺癌的影像学研究提供了丰富的资源,还为深度学习算法在医学影像分析中的应用奠定了基础。
当前挑战
LIDC-IDRI-Patches数据集在构建过程中面临多项挑战。首先,影像数据的异质性问题显著,不同医院和设备采集的CT影像在分辨率、对比度等方面存在差异,增加了数据预处理的复杂性。其次,专家标注的一致性问题也是一大挑战,不同放射科医生对病灶的识别和分类可能存在主观差异,导致标注结果的不一致性。此外,数据集的规模和多样性虽然丰富,但也带来了计算资源和模型训练效率的挑战。最后,如何在保持数据隐私的前提下,有效利用这些敏感的医学影像数据,也是该数据集应用中的重要问题。
常用场景
经典使用场景
在医学影像分析领域,LIDC-IDRI-Patches数据集被广泛用于肺结节检测与分类任务。该数据集提供了丰富的肺部CT图像切片,并附带详细的结节特征标注,如钙化程度、内部结构、边缘清晰度等。研究者常利用这些标注信息训练深度学习模型,以实现对肺结节的自动检测与恶性程度评估,从而辅助医生进行早期肺癌诊断。
衍生相关工作
基于LIDC-IDRI-Patches数据集,研究者们开展了多项经典工作。例如,一些研究通过该数据集训练卷积神经网络(CNN)模型,显著提升了肺结节的检测精度。另一些工作则专注于结节特征的多维度分析,开发了基于特征融合的分类模型,进一步提高了恶性结节的识别率。此外,该数据集还激发了跨学科的研究,如结合自然语言处理技术,自动生成影像报告,为临床决策提供更全面的支持。
数据集最近研究
最新研究方向
近年来,LIDC-IDRI-Patches数据集在医学影像分析领域引起了广泛关注,尤其是在肺结节检测与分类方面。该数据集通过提供详细的肺部CT图像切片及其相关的病理特征标注,为研究人员提供了丰富的实验数据。当前的研究方向主要集中在利用深度学习技术,如卷积神经网络(CNN)和Transformer模型,来提高肺结节的自动检测和分类精度。此外,随着多模态学习的发展,研究者们也在探索如何将图像特征与临床数据相结合,以进一步提升诊断的准确性和可靠性。这些研究不仅有助于推动医学影像分析技术的进步,还为肺癌的早期诊断和治疗提供了新的可能性。
以上内容由遇见数据集搜集并总结生成



