MedFuncta
收藏github2025-03-04 更新2025-03-06 收录
下载链接:
https://github.com/pfriedri/medfuncta
下载链接
链接失效反馈官方服务:
资源简介:
MedFuncta是一个基于神经场的大型注释功能数据集,用于模态无关的连续数据表示。
MedFuncta is a large-scale annotated functional dataset based on neural fields, designed for modality-agnostic continuous data representation.
创建时间:
2025-02-18
原始信息汇总
MedFuncta数据集概述
基本信息
- 名称: MedFuncta
- 类型: 医学图像分析数据集
- 模态: 多模态(1D、2D、3D)
- 许可证: MIT
- 论文: MedFuncta: Modality-Agnostic Representations Based on Efficient Neural Fields
- 作者: Paul Friedrich, Florentin Bieder, Philippe C. Cattin
数据集内容
- 数据量: > 550k 标注的功能数据表示
- 数据类型:
- 1D: 心电图(ECG)
- 2D: 胸部X光、视网膜OCT、眼底相机、皮肤镜、结肠组织病理学、细胞显微镜
- 3D: 脑部MRI、肺部CT
数据来源
- MedMNIST: 标准化生物医学图像集合
- MIT-BIH Arryhythmia: 心跳分类数据集
- BRATS 2023: Adult Glioma: 脑肿瘤患者的多参数MRI扫描
- LIDC-IDRI: 肺癌患者的胸部CT扫描
数据预处理
- LIDC-IDRI预处理: 提供脚本将DICOM文件转换为NIFTI格式
数据目录结构
data
└───BRATS
└───BraTS-GLI-00000-000
└───BraTS-GLI-00000-000-seg.nii.gz
└───BraTS-GLI-00000-000-t1c.nii.gz
└───BraTS-GLI-00000-000-t1n.nii.gz
└───BraTS-GLI-00000-000-t2f.nii.gz
└───BraTS-GLI-00000-000-t2w.nii.gz
└───BraTS-GLI-00001-000
└───BraTS-GLI-00002-000
...
└───LIDC-IDRI └───LIDC-IDRI-0001 └───preprocessed.nii.gz └───LIDC-IDRI-0002 └───LIDC-IDRI-0003 ...
└───MIT-BIH └───mitbih_test.csv └───mitbih_train.csv
使用方法
- 训练: 使用
train.py和相应的config.yaml - 评估: 使用
eval.py和相应的config.yaml - 转换数据集: 使用
fit_NFset.py和相应的config.yaml
依赖环境
- 推荐环境: conda (
medfuncta) - 安装命令: sh mamba env create -f environment.yaml mamba activate medfuncta
引用
bibtex @article{friedrich2025medfuncta, title={MedFuncta: Modality-Agnostic Representations Based on Efficient Neural Fields}, author={Friedrich, Paul and Bieder, Florentin and Cattin, Philippe C}, journal={arXiv preprint arXiv:2502.14401}, year={2025} }
搜集汇总
数据集介绍

构建方式
MedFuncta数据集构建了一种基于神经场的模态无关连续数据表示方法。该方法通过挖掘医学信号中的冗余信息,并应用一种高效的元学习策略及上下文缩减方案,以合理的时间获取神经场。同时,为解决常用SIREN激活函数的频谱偏差问题,引入了ω_0调度策略,从而提高重建质量和收敛速度。
特点
该数据集具有模态无关性,能够处理多种维度和模态的医疗信号,如一维的ECG,二维的胸片、视网膜OCT等,以及三维的大脑MRI和肺部CT等。此外,数据集还提供了一个大规模的注解功能数据表示集,包含超过550k的数据,以促进该方向的研究。
使用方法
使用该数据集首先需要配置conda环境,安装必要的依赖。训练元学习共享模型参数可以通过指定的配置文件运行train.py脚本来完成。评估表示质量或进行重建实验,则可以通过运行eval.py脚本来实现。将现有数据集转换为MedFuncta表示,则需要使用fit_NFset.py脚本。
背景与挑战
背景概述
MedFuncta数据集,全称为Modality-Agnostic Representations Based on Efficient Neural Fields,是一项由Paul Friedrich、Florentin Bieder和Philippe C. Cattin等人提出的研究成果。该数据集创建于2025年,旨在通过神经场技术,为医学影像分析提供一种模态无关的连续数据表示方法。MedFuncta的提出,挑战了深度学习中医学影像分析领域长期依赖的网格或体素数据表示与卷积神经网络相结合的传统选择。该数据集在多个医学信号维度和模态上进行了验证,包括1D的ECG、2D的胸片、视网膜OCT等,并成功应用于下游相关任务。此外,研究团队还发布了超过55万注解的功能数据表示的大规模数据集,以促进该方向的研究。
当前挑战
MedFuncta数据集面临的挑战主要在于:1)打破传统医学影像分析的表示方法,提出并验证一种全新的模态无关连续数据表示技术;2)在构建过程中,需要处理多种医学信号的高效神经场获取,以及如何在保持重建质量和收敛速度的同时,解决常见的SIREN激活函数的频谱偏差问题;3)构建大规模的注解数据集,确保数据的质量和多样性,以适应不同研究和应用的需求。
常用场景
经典使用场景
MedFuncta数据集作为医学图像分析的模态无关连续数据表示,其经典使用场景在于通过神经场技术,实现对多种医学信号的高效处理与分析。该数据集能够处理一维至三维的多种医学图像,如心电图、胸部X射线、视网膜OCT、眼底相机、皮肤镜、结肠组织病理学以及细胞显微镜图像等,为医学图像分析提供了一个统一且高效的数据表示框架。
解决学术问题
该数据集解决了传统医学图像分析中依赖网格或体素数据表示的问题,通过引入基于神经场的模态无关表示,不仅降低了计算复杂性,还提升了重构质量与收敛速度。它能够有效地解决相关下游任务,如病变检测、分类和分割等,为医学图像分析领域提供了新的研究路径。
衍生相关工作
MedFuncta数据集的提出,促进了基于神经场表示的医学图像分析研究,衍生出了一系列相关工作。这些工作不仅包括对MedFuncta模型本身的各种改进和优化,还拓展了其在不同医学图像分析任务中的应用,如多模态图像融合、病变特征提取等,进一步推动了医学图像分析领域的发展。
以上内容由遇见数据集搜集并总结生成



