five

lidc-idri-patches|医学影像分析数据集

收藏
huggingface2024-12-05 更新2024-12-12 收录
医学影像分析
下载链接:
https://huggingface.co/datasets/ykeselman/lidc-idri-patches
下载链接
链接失效反馈
资源简介:
该数据集包含多个特征,如annotation_id、calcification、cluster_id、image、image_8bit、internalstructure、lobulation、malignancy、margin、patch_id和patient_id。每个特征都有其数据类型,并且对于类别标签,提供了可能的值及其含义。patient_id特征列出了LIDC-IDRI数据集中特定的患者标识符。
创建时间:
2024-12-02
原始信息汇总

LIDC-IDRI Patches 数据集概述

数据集配置

  • 配置名称: default
  • 数据文件路径:
    • 训练集: data/train-*

数据集信息

特征

  • annotation_id:
    • 数据类型: int32
  • calcification:
    • 数据类型: class_label
    • 类别名称:
      • 0: Absent
      • 1: Central
      • 2: Laminated
      • 3: Non-central
      • 4: Popcorn
      • 5: Solid
  • cluster_id:
    • 数据类型: int32
  • image:
    • 数据类型: image
  • image_8bit:
    • 数据类型: image
  • internalstructure:
    • 数据类型: class_label
    • 类别名称:
      • 0: Air
      • 1: Fat
      • 2: Fluid
      • 3: Soft Tissue
      • 4: Unknown
  • lobulation:
    • 数据类型: class_label
    • 类别名称:
      • 0: No Lobulation
      • 1: Nearly No Lobulation
      • 2: Medium Lobulation
      • 3: Near Marked Lobulation
      • 4: Marked Lobulation
      • 5: Unknown
  • malignancy:
    • 数据类型: class_label
    • 类别名称:
      • 0: Highly Unlikely
      • 1: Moderately Unlikely
      • 2: Indeterminate
      • 3: Moderately Suspicious
      • 4: Highly Suspicious
      • 5: Unknown
  • margin:
    • 数据类型: class_label
    • 类别名称:
      • 0: Poorly Defined
      • 1: Near Poorly Defined
      • 2: Medium Margin
      • 3: Near Sharp
      • 4: Sharp
      • 5: Unknown
  • patch_id:
    • 数据类型: int32
  • patient_id:
    • 数据类型: class_label
    • 类别名称:
      • 0: LIDC-IDRI-0001
      • 1: LIDC-IDRI-0002
      • 2: LIDC-IDRI-0003
      • 3: LIDC-IDRI-0004
      • 4: LIDC-IDRI-0005
      • 5: LIDC-IDRI-0006
      • 6: LIDC-IDRI-0007
      • 7: LIDC-IDRI-0008
      • 8: LIDC-IDRI-0009
      • 9: LIDC-IDRI-0010
      • 10: LIDC-IDRI-0011
      • 11: LIDC-IDRI-0012
      • 12: LIDC-IDRI-0013
      • 13: LIDC-IDRI-0014
      • 14: LIDC-IDRI-0015
      • 15: LIDC-IDRI-0016
      • 16: LIDC-IDRI-0017
      • 17: LIDC-IDRI-0018
      • 18: LIDC-IDRI-0019
      • 19: LIDC-IDRI-0020
      • 20: LIDC-IDRI-0021
      • 21: LIDC-IDRI-0022
      • 22: LIDC-IDRI-0023
      • 23: LIDC-IDRI-0024
      • 24: LIDC-IDRI-0025
      • 25: LIDC-IDRI-0026
      • 26: LIDC-IDRI-0027
      • 27: LIDC-IDRI-0029
      • 28: LIDC-IDRI-0030
      • 29: LIDC-IDRI-0031
      • 30: LIDC-IDRI-0033
      • 31: LIDC-IDRI-0034
      • 32: LIDC-IDRI-0035
      • 33: LIDC-IDRI-0036
      • 34: LIDC-IDRI-0037
      • 35: LIDC-IDRI-0038
      • 36: LIDC-IDRI-0039
      • 37: LIDC-IDRI-0040
      • 38: LIDC-IDRI-0041
      • 39: LIDC-IDRI-0042
      • 40: LIDC-IDRI-0043
      • 41: LIDC-IDRI-0044
      • 42: LIDC-IDRI-0045
      • 43: LIDC-IDRI-0046
      • 44: LIDC-IDRI-0047
      • 45: LIDC-IDRI-0048
      • 46: LIDC-IDRI-0049
      • 47: LIDC-IDRI-0050
      • 48: LIDC-IDRI-0051
      • 49: LIDC-IDRI-0052
      • 50: LIDC-IDRI-0053
      • 51: LIDC-IDRI-0054
      • 52: LIDC-IDRI-0055
      • 53: LIDC-IDRI-0056
      • 54: LIDC-IDRI-0057
      • 55: LIDC-IDRI-0058
      • 56: LIDC-IDRI-0059
      • 57: LIDC-IDRI-0060
      • 58: LIDC-IDRI-0061
      • 59: LIDC-IDRI-0063
      • 60: LIDC-IDRI-0064
      • 61: LIDC-IDRI-0065
      • 62: LIDC-IDRI-0066
      • 63: LIDC-IDRI-0067
      • 64: LIDC-IDRI-0068
      • 65: LIDC-IDRI-0069
      • 66: LIDC-IDRI-0070
      • 67: LIDC-IDRI-0072
      • 68: LIDC-IDRI-0073
      • 69: LIDC-IDRI-0074
      • 70: LIDC-IDRI-0075
      • 71: LIDC-IDRI-0076
      • 72: LIDC-IDRI-0077
      • 73: LIDC-IDRI-0078
      • 74: LIDC-IDRI-0079
      • 75: LIDC-IDRI-0080
      • 76: LIDC-IDRI-0081
      • 77: LIDC-IDRI-0082
      • 78: LIDC-IDRI-0083
      • 79: LIDC-IDRI-0084
      • 80: LIDC-IDRI-0085
      • 81: LIDC-IDRI-0086
      • 82: LIDC-IDRI-0087
      • 83: LIDC-IDRI-0088
      • 84: LIDC-IDRI-0089
      • 85: LIDC-IDRI-0090
      • 86: LIDC-IDRI-0091
      • 87: LIDC-IDRI-0092
      • 88: LIDC-IDRI-0093
      • 89: LIDC-IDRI-0094
      • 90: LIDC-IDRI-0095
      • 91: LIDC-IDRI-0096
      • 92: LIDC-IDRI-0097
      • 93: LIDC-IDRI-0098
      • 94: LIDC-IDRI-0099
      • 95: LIDC-IDRI-0101
      • 96: LIDC-IDRI-0102
      • 97: LIDC-IDRI-0103
      • 98: LIDC-IDRI-0104
      • 99: LIDC-IDRI-0105
      • 100: LIDC-IDRI-0106
      • 101: LIDC-IDRI-0107
      • 102: LIDC-IDRI-0108
      • 103: LIDC-IDRI-0109
      • 104: LIDC-IDRI-0110
      • 105: LIDC-IDRI-0111
      • 106: LIDC-IDRI-0112
      • 107: LIDC-IDRI-0113
      • 108: LIDC-IDRI-0114
      • 109: LIDC-IDRI-0115
      • 110: LIDC-IDRI-0116
      • 111: LIDC-IDRI-0117
      • 112: LIDC-IDRI-0118
      • 113: LIDC-IDRI-0119
      • 114: LIDC-IDRI-0120
      • 115: LIDC-IDRI-0121
      • 116: LIDC-IDRI-0122
      • 117: LIDC-IDRI-0123
      • 118: LIDC-IDRI-0124
      • 119: LIDC-IDRI-0125
      • 120: LIDC-IDRI-0126
      • 121: LIDC-IDRI-0127
      • 122: LIDC-IDRI-0128
      • 123: LIDC-IDRI-0129
      • 124: LIDC-IDRI-0130
      • 125: LIDC-IDRI-0131
      • 126: LIDC-IDRI-0132
      • 127: LIDC-IDRI-0133
      • 128: LIDC-IDRI-0134
      • 129: LIDC-IDRI-0135
      • 130: LIDC-IDRI-0136
      • 131: LIDC-IDRI-0137
      • 132: LIDC-IDRI-0138
      • 133: LIDC-IDRI-0139
      • 134: LIDC-IDRI-0140
      • 135: LIDC-IDRI-0141
      • 136: LIDC-IDRI-0142
      • 137: LIDC-IDRI-0144
      • 138: LIDC-IDRI-0145
      • 139: LIDC-IDRI-0146
      • 140: LIDC-IDRI-0147
      • 141: LIDC-IDRI-0148
      • 142: LIDC-IDRI-0149
      • 143: LIDC-IDRI-0150
      • 144: LIDC-IDRI-0151
      • 145: LIDC-IDRI-0152
      • 146: LIDC-IDRI-0153
      • 147: LIDC-IDRI-0154
      • 148: LIDC-IDRI-0155
      • 149: LIDC-IDRI-0156
      • 150: LIDC-IDRI-0157
      • 151: LIDC-IDRI-0158
      • 152: LIDC-IDRI-0159
      • 153: LIDC-IDRI-0160
      • 154: LIDC-IDRI-0161
      • 155: LIDC-IDRI-0162
      • 156: LIDC-IDRI-0163
      • 157: LIDC-IDRI-0164
      • 158: LIDC-IDRI-0165
      • 159: LIDC-IDRI-0166
      • 160: LIDC-IDRI-0167
      • 161: LIDC-IDRI-0168
      • 162: LIDC-IDRI-0169
      • 163: LIDC-IDRI-0170
      • 164: LIDC-IDRI-0171
      • 165: LIDC-IDRI-0172
      • 166: LIDC-IDRI-0173
      • 167: LIDC-IDRI-0175
      • 168: LIDC-IDRI-0176
      • 169: LIDC-IDRI-0177
      • 170: LIDC-IDRI-0178
      • 171: LIDC-IDRI-0179
      • 172: LIDC-IDRI-0180
      • 173: LIDC-IDRI-0181
      • 174: LIDC-IDRI-0182
      • 175: LIDC-IDRI-0183
      • 176: LIDC-IDRI-0184
      • 177: LIDC-IDRI-0185
      • 178: LIDC-IDRI-0186
      • 179: LIDC-IDRI-0187
      • 180: LIDC-IDRI-0188
      • 181: LIDC-IDRI-0190
      • 182: LIDC-IDRI-0191
      • 183: LIDC-IDRI-0192
      • 184: LIDC-IDRI-0193
      • 185: LIDC-IDRI-0194
      • 186: LIDC-IDRI-0195
      • 187: LIDC-IDRI-0196
      • 188: LIDC-IDRI-0198
      • 189: LIDC-IDRI-0199
      • 190: LIDC-IDRI-0200
      • 191: LIDC-IDRI-0201
      • 192: LIDC-IDRI-0202
AI搜集汇总
数据集介绍
main_image_url
构建方式
LIDC-IDRI-Patches数据集的构建基于LIDC-IDRI数据库,该数据库包含了大量肺癌患者的CT扫描图像。数据集通过将原始CT图像分割成小块(patches),并对其进行标注,从而形成了包含多种特征的图像块集合。每个图像块都附带了详细的标注信息,如钙化程度、内部结构、边缘特征等,这些标注信息由专业放射科医生提供,确保了数据集的高质量和临床相关性。
特点
LIDC-IDRI-Patches数据集的显著特点在于其丰富的标注信息和多样化的图像特征。数据集不仅包含了图像本身,还提供了多种分类标签,如钙化程度、内部结构、边缘特征等,这些标签为研究者提供了多维度的分析视角。此外,数据集的图像块大小一致,便于模型训练和评估。通过这些特征,该数据集为肺癌的计算机辅助诊断提供了强有力的支持。
使用方法
LIDC-IDRI-Patches数据集适用于多种医学图像分析任务,尤其是肺癌的检测和分类。研究者可以通过加载数据集中的图像块和相应的标注信息,进行模型的训练和验证。数据集的多样性和详细标注使其成为开发和评估肺癌诊断算法的理想选择。使用时,建议结合深度学习框架,如TensorFlow或PyTorch,以充分利用数据集的特征进行模型训练和性能评估。
背景与挑战
背景概述
LIDC-IDRI-Patches数据集源自LIDC-IDRI(Lung Image Database Consortium and Image Database Resource Initiative)项目,该项目的核心目标是通过多模态影像数据集推动肺癌的早期检测与诊断研究。LIDC-IDRI数据集由美国国家癌症研究所(NCI)主导,汇集了多家研究机构和医院的贡献,涵盖了超过1000名患者的CT影像及其相应的专家标注。LIDC-IDRI-Patches数据集则进一步细化了这些影像数据,提取了局部区域(patches),旨在为计算机辅助诊断(CAD)系统提供更精细的训练和验证数据。该数据集的创建不仅为肺癌的影像学研究提供了丰富的资源,还为深度学习算法在医学影像分析中的应用奠定了基础。
当前挑战
LIDC-IDRI-Patches数据集在构建过程中面临多项挑战。首先,影像数据的异质性问题显著,不同医院和设备采集的CT影像在分辨率、对比度等方面存在差异,增加了数据预处理的复杂性。其次,专家标注的一致性问题也是一大挑战,不同放射科医生对病灶的识别和分类可能存在主观差异,导致标注结果的不一致性。此外,数据集的规模和多样性虽然丰富,但也带来了计算资源和模型训练效率的挑战。最后,如何在保持数据隐私的前提下,有效利用这些敏感的医学影像数据,也是该数据集应用中的重要问题。
常用场景
经典使用场景
在医学影像分析领域,LIDC-IDRI-Patches数据集被广泛用于肺结节检测与分类任务。该数据集提供了丰富的肺部CT图像切片,并附带详细的结节特征标注,如钙化程度、内部结构、边缘清晰度等。研究者常利用这些标注信息训练深度学习模型,以实现对肺结节的自动检测与恶性程度评估,从而辅助医生进行早期肺癌诊断。
衍生相关工作
基于LIDC-IDRI-Patches数据集,研究者们开展了多项经典工作。例如,一些研究通过该数据集训练卷积神经网络(CNN)模型,显著提升了肺结节的检测精度。另一些工作则专注于结节特征的多维度分析,开发了基于特征融合的分类模型,进一步提高了恶性结节的识别率。此外,该数据集还激发了跨学科的研究,如结合自然语言处理技术,自动生成影像报告,为临床决策提供更全面的支持。
数据集最近研究
最新研究方向
近年来,LIDC-IDRI-Patches数据集在医学影像分析领域引起了广泛关注,尤其是在肺结节检测与分类方面。该数据集通过提供详细的肺部CT图像切片及其相关的病理特征标注,为研究人员提供了丰富的实验数据。当前的研究方向主要集中在利用深度学习技术,如卷积神经网络(CNN)和Transformer模型,来提高肺结节的自动检测和分类精度。此外,随着多模态学习的发展,研究者们也在探索如何将图像特征与临床数据相结合,以进一步提升诊断的准确性和可靠性。这些研究不仅有助于推动医学影像分析技术的进步,还为肺癌的早期诊断和治疗提供了新的可能性。
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

GME Data

关于2021年GameStop股票活动的数据,包括每日合并的GME短期成交量数据、每日失败交付数据、可借股数、期权链数据以及不同时间框架的开盘/最高/最低/收盘/成交量条形图。

github 收录

全国 1∶200 000 数字地质图(公开版)空间数据库

As the only one of its kind, China National Digital Geological Map (Public Version at 1∶200 000 scale) Spatial Database (CNDGM-PVSD) is based on China' s former nationwide measured results of regional geological survey at 1∶200 000 scale, and is also one of the nationwide basic geosciences spatial databases jointly accomplished by multiple organizations of China. Spatially, it embraces 1 163 geological map-sheets (at scale 1: 200 000) in both formats of MapGIS and ArcGIS, covering 72% of China's whole territory with a total data volume of 90 GB. Its main sources is from 1∶200 000 regional geological survey reports, geological maps, and mineral resources maps with an original time span from mid-1950s to early 1990s. Approved by the State's related agencies, it meets all the related technical qualification requirements and standards issued by China Geological Survey in data integrity, logic consistency, location acc racy, attribution fineness, and collation precision, and is hence of excellent and reliable quality. The CNDGM-PVSD is an important component of China' s national spatial database categories, serving as a spatial digital platform for the information construction of the State's national economy, and providing informationbackbones to the national and provincial economic planning, geohazard monitoring, geological survey, mineral resources exploration as well as macro decision-making.

DataCite Commons 收录

TCIA

TCIA(The Cancer Imaging Archive)是一个公开的癌症影像数据集,包含多种癌症类型的医学影像数据,如CT、MRI、PET等。这些数据通常与临床和病理信息相结合,用于癌症研究和临床试验。

www.cancerimagingarchive.net 收录

猫狗图像数据集

该数据集包含猫和狗的图像,每类各12500张。训练集和测试集分别包含10000张和2500张图像,用于模型的训练和评估。

github 收录

FAOSTAT

FAOSTAT provides time-series data about agriculture, nutrition, fisheries, forestry and food aid by country and region from 1961 to present. FAOSTAT is a multilingual database. Data can be searched, browsed, and downloaded.

re3data.org 收录