five

BoneMet/BoneMet|乳腺癌骨转移数据集|医学影像分析数据集

收藏
hugging_face2024-07-09 更新2024-06-12 收录
乳腺癌骨转移
医学影像分析
下载链接:
https://hf-mirror.com/datasets/BoneMet/BoneMet
下载链接
链接失效反馈
资源简介:
BoneMet数据集是一个针对乳腺癌骨转移(BTBM)诊断和预后的开放大规模多模态医学数据集。它提供了超过50TB的多模态医学数据,包括2D X射线图像、3D CT扫描和详细的生物数据(如医疗记录和骨定量分析),这些数据是从2019年至2024年间数千只小鼠中收集的。数据集分为六个主要部分:Rotation-X-Ray、Recon-CT、Seg-CT、Regist-CT、RoI-CT和MiceMediRec。此外,还开发了BoneMet包,包括三种API,用于CT图像分割、CT图像注册和基于感兴趣区域的CT图像裁剪,以促进数据集的易用性和广泛传播。

The BoneMet dataset is an open large-scale multi-modal medical dataset specifically targeting breast tumor bone metastasis (BTBM) for disease diagnosis and prognosis. It offers over 50 terabytes of multi-modal medical data, including 2D X-ray images, 3D CT scans, and detailed biological data (e.g., medical records and bone quantitative analysis), collected from thousands of mice spanning from 2019 to 2024. The dataset is well-organized into six components: Rotation-X-Ray, Recon-CT, Seg-CT, Regist-CT, RoI-CT, and MiceMediRec. Additionally, the BoneMet package has been developed, including three types of APIs for CT image segmentation, CT image registration, and RoI-based CT image cropping, to facilitate the datasets ease of access and wide dissemination.
提供机构:
BoneMet
原始信息汇总

BoneMet: An Open Large-Scale Multi-Modal Dataset for Breast Tumor Bone Metastasis Diagnosis and Prognosis

数据集概述

BoneMet数据集是一个针对乳腺癌骨转移(BTBM)诊断和预后的大型公开多模态医学数据集。该数据集包含超过50TB的多模态医学数据,包括2D X光图像、3D CT扫描和详细的生物数据(如医疗记录和骨定量分析),这些数据从2019年到2024年收集自数千只小鼠。

数据集组成

BoneMet数据集分为六个主要部分:

  1. Rotation-X-Ray:包含651,300张有肿瘤的小鼠X光图像和676,000张无肿瘤的小鼠X光图像,每张图像分辨率为4,032x4,032x1像素,总大小为20.93 TB。
  2. Recon-CT:包含3,005个有肿瘤的小鼠CT扫描和7,205个无肿瘤的小鼠CT扫描,每个扫描包含约1,700±200张2D切片,总大小为1.53 TB。
  3. Seg-CT:包含3,005个有肿瘤的小鼠CT扫描和7,205个无肿瘤的小鼠CT扫描,每个扫描包含约1,700±200张2D切片,总大小为1.53 TB。
  4. Regist-CT:包含3,005个有肿瘤的小鼠CT扫描和7,205个无肿瘤的小鼠CT扫描,每个扫描包含1,538张2D切片,总大小为0.18 TB。
  5. RoI-CT:包含3,005个有肿瘤的小鼠CT扫描和7,205个无肿瘤的小鼠CT扫描,每个2D切片分辨率为509x539x1像素,总大小为8.00 GB。
  6. MiceMediRec:包含501只有肿瘤的小鼠和520只无肿瘤的小鼠的详细医疗记录,总大小为9.44 MB。

数据集贡献

  • BoneMet数据集:第一个公开的、TB级别的多模态乳腺癌骨转移数据集,包含高分辨率的多角度旋转X光和CT图像以及详细的生物数据。
  • BoneMet包:包含三种类型的API,用于CT图像分割、CT图像配准和基于RoI的CT图像裁剪,方便数据访问和处理。

数据集使用

BoneMet数据集和包可通过以下链接获取:

许可证

BoneMet数据集采用Creative Commons Attribution-NonCommercial 4.0 International (CC BY-NC 4.0)许可证。

AI搜集汇总
数据集介绍
main_image_url
构建方式
BoneMet数据集的构建方法独特且全面,它汇聚了从2019年到2024年数千只小鼠的超过50TB的多模态医学数据。数据集分为六个主要部分:旋转X射线图像、重建CT图像、分割CT图像、注册CT图像、ROI-CT图像和小鼠医学记录。旋转X射线图像提供了从多个角度(前部、侧面和后部)拍摄的2D X射线图像,而重建CT图像和分割CT图像则提供了3D CT扫描的详细视图。注册CT图像是将不同时间点和不同动物获得的3D CT扫描对齐到参考点,而ROI-CT图像则专注于肿瘤影响最明显的近端胫骨部分。小鼠医学记录则包含了详细的医疗记录和骨定量分析数据。这一构建方式确保了数据集的多样性和完整性,为研究人员提供了丰富的数据资源。
特点
BoneMet数据集的特点在于其规模庞大、多模态和高分辨率。它不仅是首个公开可用的、专注于乳腺癌骨转移诊断和预后的高分辨率医学资源,而且提供了超过50TB的多模态医疗数据,包括2D X射线图像、3D CT扫描和详细的生物数据。数据集的多样性和高质量使得研究人员能够构建和训练大型AI模型,以进行精确的乳腺癌骨转移诊断和预后。此外,数据集的组织结构清晰,易于访问和广泛传播,进一步促进了其在医学研究中的应用。
使用方法
BoneMet数据集的使用方法便捷且高效。研究人员可以通过BoneMet包提供的三个API来灵活处理和下载数据。CT图像分割API能够将3D重建CT图像分割成独立的CT扫描;CT图像注册API能够将分割的CT扫描注册到参考点上;基于ROI的CT图像裁剪API能够从注册的CT图像中裁剪出感兴趣的区域。此外,研究人员还可以通过安装BoneMet包来获取最新的版本,并通过Python代码示例来学习如何使用这些API。BoneMet数据集的易用性和功能强大的API使得它成为医学研究领域的重要资源。
背景与挑战
背景概述
在医学影像分析和疾病诊断领域,高分辨率、多模态数据集对于研究乳腺癌骨转移(BTBM)的诊断和预后具有重要意义。BoneMet数据集正是为这一目的而生,它是由Tiankuo Chu等人于2019年至2024年间创建的,是一个大规模、公开可用的高分辨率医学资源。该数据集包含超过50TB的多模态医学数据,包括2D X光图像、3D CT扫描和详细的生物学数据(如医疗记录和骨定量分析),这些数据是从数千只小鼠中收集的。BoneMet数据集被精心组织成六个部分:Rotation-X-Ray、Recon-CT、Seg-CT、Regist-CT、RoI-CT和MiceMediRec。BoneMet数据集的创建不仅为构建用于管理BTBM疾病的通用、大型AI模型提供了数据基础,而且通过深度学习解决方案的各种实验验证了其有效性。为了方便访问和广泛传播,还创建了BoneMet软件包,提供了三种API,允许研究人员灵活地处理和下载BoneMet数据,并根据特定的时间段进行筛选,同时还可以开发和训练用于精确的BTBM诊断和预后的AI模型。
当前挑战
尽管BoneMet数据集为乳腺癌骨转移的研究提供了宝贵的资源,但在实际应用中仍面临一些挑战。首先,数据集的规模庞大,需要高效的数据处理和存储解决方案。其次,由于数据的多模态性质,如何有效地整合不同类型的数据并进行特征提取是一个关键问题。此外,构建准确的AI模型需要大量的标注数据,而这一过程耗时且成本高昂。最后,由于数据集的复杂性,开发能够处理多模态数据的算法模型也面临技术挑战。
常用场景
经典使用场景
BoneMet数据集是首个针对乳腺肿瘤骨转移(BTBM)进行疾病诊断、预后、高级图像处理和治疗管理的大规模、高分辨率医疗资源。该数据集包含超过50TB的多模态医疗数据,包括2D X光图像、3D CT扫描和详细的生物数据(如医疗记录和骨定量分析),从2019年到2024年收集自数千只小鼠。BoneMet数据集被组织成六个组件:旋转X射线、重建CT、分割CT、注册CT、ROI-CT和小鼠医疗记录。BoneMet数据集的广泛数据样本和有意义的图像处理、组织和数据标注工作,使得该数据集可以轻松地用于构建管理BTBM疾病的多功能、大规模AI模型,这些模型已经通过各种深度学习解决方案(无论是通过自监督预训练还是监督微调)进行了验证。为了方便其易于访问和广泛传播,我们创建了BoneMet包,提供三种API,使研究人员能够灵活地处理和下载通过特定时间段筛选的BoneMet数据,以及开发、训练大型AI模型以实现精确的BTBM诊断和预后。
衍生相关工作
BoneMet数据集的发布为乳腺肿瘤骨转移(BTBM)的研究开辟了新的可能性,并衍生了许多相关的研究工作。这些相关工作包括但不限于以下方面:1. BTBM诊断算法的研究:基于BoneMet数据集,研究人员可以开发新的BTBM诊断算法,以提高诊断的准确性和效率。2. BTBM预后模型的研究:BoneMet数据集提供的详细生物数据可以用于建立更精确的BTBM预后模型,为患者提供更好的治疗建议。3. 高级图像处理算法的研究:BoneMet数据集的高分辨率图像可以用于开发新的高级图像处理算法,如CT图像分割、注册和ROI裁剪,以支持更精确的BTBM诊断和预后。4. AI模型在BTBM研究中的应用:BoneMet数据集为AI模型在BTBM研究中的应用提供了数据基础,有助于推动BTBM研究的进展。
数据集最近研究
最新研究方向
BoneMet数据集作为首个大规模的乳腺癌骨转移诊断和预后数据集,为研究人员提供了丰富的多模态医学数据,包括2D X光图像、3D CT扫描和详细的生物学数据。该数据集的组织结构包括旋转X光图像、重建CT图像、分割CT图像、注册CT图像、感兴趣区域CT图像和小鼠医疗记录六个部分,涵盖了从2019年到2024年收集的数千只小鼠的数据。BoneMet数据集为构建管理乳腺癌骨转移疾病的大型AI模型提供了便利,并已被各种深度学习解决方案通过自监督预训练或监督微调进行了验证。BoneMet包提供了三种API,以方便研究人员处理和下载BoneMet数据,并开发用于精确诊断和预后的AI模型。
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

GME Data

关于2021年GameStop股票活动的数据,包括每日合并的GME短期成交量数据、每日失败交付数据、可借股数、期权链数据以及不同时间框架的开盘/最高/最低/收盘/成交量条形图。

github 收录

Nexdata/chinese_dialect

该数据集包含25,000小时的中文方言语音数据,收集自多个方言区域的本地方言使用者,涵盖闽南语、粤语、四川话、河南话、东北话、上海话、维吾尔语和藏语等。数据格式为16kHz、16bit、未压缩的wav文件,单声道。句子准确率超过95%。数据集支持的任务包括自动语音识别(ASR)和音频说话人识别。

hugging_face 收录

CHARLS

中国健康与养老追踪调查(CHARLS)数据集,旨在收集反映中国45岁及以上中老年人家庭和个人的高质量微观数据,用以分析人口老龄化问题,内容包括健康状况、经济状况、家庭结构和社会支持等。

charls.pku.edu.cn 收录

中国农村金融统计数据

该数据集包含了中国农村金融的统计信息,涵盖了农村金融机构的数量、贷款余额、存款余额、金融服务覆盖率等关键指标。数据按年度和地区分类,提供了详细的农村金融发展状况。

www.pbc.gov.cn 收录

中国气象数据

本数据集包含了中国2023年1月至11月的气象数据,包括日照时间、降雨量、温度、风速等关键数据。通过这些数据,可以深入了解气象现象对不同地区的影响,并通过可视化工具揭示中国的气温分布、降水情况、风速趋势等。

github 收录