five

Emory Knee Radiograph Dataset (MRKR)

收藏
arXiv2024-10-31 更新2024-11-06 收录
下载链接:
http://arxiv.org/abs/2411.00866v1
下载链接
链接失效反馈
官方服务:
资源简介:
Emory Knee Radiograph Dataset (MRKR) 是由埃默里大学创建的一个大型、多样化的膝关节放射图像数据集,包含503,261张膝关节放射图像,来自83,011名患者,其中40%为非洲裔美国人。数据集提供DICOM格式的影像数据以及详细的临床信息,包括患者报告的疼痛评分、诊断代码和手术代码。数据集的创建过程结合了自动化和半自动化技术,确保数据的高质量和多样性。MRKR数据集主要用于研究骨关节炎及其相关结果,特别是在少数族裔群体中的应用,为临床医生和研究人员提供了一个宝贵的资源。

Emory Knee Radiograph Dataset (MRKR) is a large, diverse knee radiograph dataset created by Emory University. It encompasses 503,261 knee radiograph images from 83,011 patients, with 40% of the patient cohort being African American. The dataset offers DICOM-format imaging data and detailed clinical information, including patient-reported pain scores, diagnostic codes, and procedural codes. Its development utilized a combination of automated and semi-automated technologies to ensure high data quality and diversity. The MRKR dataset is primarily intended for research on osteoarthritis and its related outcomes, particularly among minority populations, and serves as a valuable resource for clinicians and researchers.
提供机构:
埃默里大学
创建时间:
2024-10-31
搜集汇总
数据集介绍
main_image_url
构建方式
Emory Knee Radiograph Dataset (MRKR) 的构建过程始于对四家附属医院(包括两家社区医院、一家城市医院和一家学术医院)的回顾性数据收集。研究团队从2002年至2021年间,筛选出83,011名成年患者(年龄≥18岁)的膝关节X光片,这些影像资料涵盖了门诊、住院、急诊以及术前和术后的放射检查。影像数据通过Niffler系统从医院的图片存档与通信系统(PACS)中提取,并以DICOM格式存储。临床数据,包括患者报告的疼痛评分、诊断代码和手术代码,从临床数据仓库(CDW)中提取。数据的去识别化处理确保了患者隐私的保护,同时保留了影像和临床数据之间的关联性。此外,通过ConvNeXt模型对非膝关节影像进行筛选,以及手动标注影像的侧位、视图类型和负重状态,进一步提升了数据集的质量和适用性。
特点
MRKR数据集的显著特点在于其庞大的规模和多样化的患者群体,包含503,261张膝关节X光片,覆盖83,011名患者,其中40%为非洲裔美国人。该数据集不仅提供了丰富的影像数据,还包括详细的临床信息,如患者报告的疼痛评分、诊断代码和手术代码,这些信息在类似数据集中较为罕见。此外,影像元数据如影像侧位、视图类型和硬件的存在,增强了数据集的研究和模型开发价值。MRKR数据集通过提供更具代表性的样本,填补了现有数据集在研究骨关节炎及其相关结果,特别是在少数族裔群体中的空白。
使用方法
MRKR数据集的使用方法多样,适用于多种研究目的。研究者可以利用该数据集进行深度学习模型的训练,以评估膝关节骨关节炎的严重程度和预测患者的疼痛评分。数据集中的DICOM格式影像和详细的临床数据为模型提供了丰富的输入信息。此外,数据集的结构化设计使得研究者可以轻松访问和分析影像元数据,如影像侧位、视图类型和负重状态,从而进行更精细的研究。MRKR数据集还提供了多种CSV文件,包括CPT代码、ICD代码、疼痛评分和患者人口统计信息,这些文件为临床研究和数据分析提供了便利。通过这些数据,研究者可以探索骨关节炎的流行病学特征、疼痛与影像学表现之间的关系,以及不同种族和性别群体的差异。
背景与挑战
背景概述
Emory Knee Radiograph Dataset (MRKR) 是由Emory大学放射学系主导开发的一个大规模、多样化的膝关节放射图像数据集,包含503,261张来自83,011名患者的膝关节放射图像,其中40%为非洲裔美国人。该数据集不仅提供了DICOM格式的影像数据,还包含了详细的临床信息,如患者自报的疼痛评分、诊断代码和手术代码,这些信息在类似数据集中并不常见。MRKR数据集通过提供更具代表性的样本,填补了现有数据集在研究骨关节炎及其相关结果方面的空白,特别是在少数族裔群体中的应用,为临床医生和研究人员提供了宝贵的资源。
当前挑战
MRKR数据集在构建过程中面临多项挑战。首先,数据集的多样性要求模型在不同种族和民族背景下的泛化能力,这增加了模型训练的复杂性。其次,临床数据的提取和整合过程中,存在数据不一致和错误标签的问题,如图像的侧位和视图类型的错误分类。此外,患者自报的疼痛评分受心理社会因素和文化背景的影响,存在主观性和个体差异性,这为疼痛评分的准确性和一致性带来了挑战。最后,Duke大学开发的KLG评分预测模型在MRKR数据集上的系统验证不足,可能影响骨关节炎严重程度评估的精确性。
常用场景
经典使用场景
Emory Knee Radiograph Dataset (MRKR) 的经典应用场景主要集中在膝关节疾病的诊断与研究领域。该数据集通过提供大量多样化的膝关节放射图像,结合详细的临床信息,如患者报告的疼痛评分、诊断代码和手术代码,为研究人员和临床医生提供了一个全面的资源。这些数据可用于训练和验证深度学习模型,以自动评估膝关节骨性关节炎的严重程度,预测患者的疼痛水平,并辅助临床决策。
解决学术问题
MRKR 数据集解决了现有膝关节放射图像数据集在代表性和临床信息丰富性方面的不足。通过包含大量非洲裔美国患者的数据,该数据集有助于研究膝关节骨性关节炎在不同种族群体中的表现和进展,从而解决研究中的种族偏见问题。此外,数据集中的疼痛评分和临床代码为研究膝关节疾病的病理生理学提供了宝贵的数据支持,有助于深入理解疾病机制和患者体验。
衍生相关工作
MRKR 数据集的发布催生了一系列相关研究工作。例如,研究人员利用该数据集开发了自动化的膝关节骨性关节炎分级系统,显著提高了诊断效率和准确性。此外,基于 MRKR 数据集的研究还推动了疼痛评估模型的改进,使得疼痛评分与放射图像的关联分析更加精确。这些研究成果不仅在学术界产生了广泛影响,也为临床实践提供了新的工具和方法。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作