siim-dataset
收藏github2017-07-24 更新2024-05-31 收录
下载链接:
https://github.com/clinical-meteor/siim-dataset
下载链接
链接失效反馈官方服务:
资源简介:
包含FHIR JSON对象的数据集,用于模拟患者病例,支持SIIM Hackathon和HackPack项目。
A dataset comprising FHIR JSON objects for simulating patient cases, intended to support the SIIM Hackathon and HackPack projects.
创建时间:
2017-04-01
原始信息汇总
siim-dataset
数据集概述
该数据集包含一系列FHIR JSON对象,这些对象代表虚构的患者病例,用于在hackathon环境中使用。数据集由Society for Imaging Informatics in Medicine (SIIM)支持,旨在促进DICOMWEB和FHIR标准的应用。
数据来源
数据集使用了来自The Cancer Imaging Archive (TCIA)的图像,并创建了虚构但可信的病例叙述,这些叙述在成像领域中很常见。
数据集内容
数据集包含围绕这些患者叙述的FHIR JSON对象。每个FHIR文档都有一个注释头,格式如下: plaintext // filename // id: random
如果ID设置为非随机值,则将用于创建FHIR资源。数据集并非详尽无遗,类型选择基于与成像患者的相关性。
数据组织结构
数据集的顶层目录包含跨患者的资源目录(如药物、从业者、组织)。每个患者都有一个子文件夹,子文件夹中包含与FHIR资源对应的目录,目录内包含JSON格式的FHIR文档。
命名约定
- 原始TCIA ID保留为MRN
- 访问号用作诊断报告的FHIR ID
患者病例示例
Sally SIIM (mrn: BreastDx-01-0003)
- 58岁女性,1950年4月12日出生
- 病史:自我乳房检查发现可触及的左乳房肿块,2008年4月12日进行诊断性乳房X光检查,2008年5月24日进行乳房肿瘤切除术。
- 既往病史:甲状腺功能减退
- 过敏史:无
- 药物:左甲状腺素钠50mcg每日一次
Ravi SIIM (mrn: LIDC-IDRI-0132)
- 60岁男性,慢性肺病史
- 影像检查:2000年1月1日进行胸部CT扫描,显示左上叶空洞性病变和其他肺部异常。
Joe SIIM (mrn: TCGA-17-Z058)
- 60岁男性,有肺腺癌病史
- 影像检查:1986年3月30日进行胸部CT扫描,显示左肺门肿块和其他肺部异常。
贡献流程
- 在GitHub上Fork此仓库
- 进行更改/改进
- 发送拉取请求
搜集汇总
数据集介绍

构建方式
siim-dataset数据集的构建是基于FHIR JSON对象,这些对象代表了虚构的患者病历,用于支持医学影像信息学会(SIIM)的新DICOMWEB和FHIR标准。数据集利用来自癌症影像档案(TCIA)的图像,并围绕这些图像创建虚构但可信的患者叙事,以展示医学影像中的常见概念。
特点
该数据集的特点在于,它不是一个详尽无遗的集合,而是选择了与影像患者相关的类型。它保留了原始TCIA ID作为医疗记录号码(MRN),并使用检查接入号作为FHIR ID用于诊断报告。数据集的组织结构清晰,顶层目录中包含跨患者的资源目录,以及每个患者的子目录,其中包含与FHIR资源相对应的顶级目录。
使用方法
使用数据集时,首先需要配置fhir_server.yml文件以适应个人需求,然后安装ruby和bundler依赖。通过运行ruby脚本,可以上传子目录中的所有资源到FHIR服务器。此外,还可以通过指定顶级目录来更新资源子集。对于贡献者,建议通过GitHub进行fork,进行更改后发送pull请求。
背景与挑战
背景概述
siim-dataset是一个由[Society for Imaging Informatics in Medicine (SIIM)]创建的集合,旨在支持DICOMWEB和FHIR标准,通过年度会议和Hackathon/HackPack项目,为成员提供与这些系统互动的机会。该数据集利用[The Cancer Imaging Archive (TCIA)]的图像,创建了围绕成像的虚构但可信的患者叙事。该数据集包含了与患者叙述相关的FHIR JSON对象。它的创建源于hackathon中对丰富、连贯数据集的需求,以支持构建有趣的应用程序。
当前挑战
siim-dataset面临的挑战主要包括:1)所解决的领域问题是医学成像信息的标准化和互通,挑战在于如何将患者叙述与医学图像有效结合,形成可用于研究和开发的标准化数据集;2)构建过程中遇到的挑战包括确保数据的一致性和准确性,处理大量的医疗信息,并且遵守隐私和数据保护法规。此外,数据集的动态更新和扩展也是一个持续的挑战,需要不断地整合新的医疗标准和数据格式。
常用场景
经典使用场景
siim-dataset数据集是一组虚构的患者病历,采用FHIR JSON对象形式,旨在为医学影像信息的交换和处理提供标准化支持。该数据集的经典使用场景在于模拟医学影像领域的实际应用,为研发和测试医学影像分析相关软件提供标准化的数据基础。通过该数据集,研究人员可以构建、验证和优化算法,以处理诸如患者影像诊断、病历记录自动化生成等问题。
解决学术问题
该数据集解决了学术研究中对于标准化医学影像数据的需求问题,提供了统一的FHIR JSON格式数据,有助于促进不同医疗机构间的数据交换和整合。它使得研究者能够在统一的数据结构上进行算法开发和性能评估,从而提高了研究的一致性和可重复性,对于提升医学影像分析领域的学术研究质量具有重要意义。
衍生相关工作
siim-dataset数据集的衍生工作包括了基于该数据集开发的各类医学影像分析工具和算法,如自动化诊断系统、智能辅助决策支持系统等。这些工作不仅推动了医学影像信息学的研究进展,也促进了医学影像在实际临床中的广泛应用,为精准医疗和智慧医疗的发展提供了支持。
以上内容由遇见数据集搜集并总结生成



