LUNA25-MedSAM2|医学图像分割数据集|肺结节检测数据集
收藏LUNA25-MedSAM2 数据集概述
基本信息
- 语言: 英文 (en)
- 标签: 医学 (medical)
- 许可证: CC-BY-NC-4.0
- 任务类别: 图像分割 (image-segmentation)
数据集描述
- 该数据集包含来自 LUNA25 挑战赛 的 6163 个肺结节标注。
- 标注过程分为两步:
- 使用 MedSAM2 Lesion CT 分割模型对每个病变进行点提示分割。
- 人工检查分割结果并修正(约 880 个结节经过人工修正)。
作者信息
- 主要作者: Jun Ma, Zongxin Yang (共同第一作者), Bo Wang (通讯作者)
- 机构:
- 多伦多大学健康网络 AI 协作中心
- 向量人工智能研究所
- 哈佛医学院生物医学信息学系
- 多伦多大学健康网络 Peter Munk 心脏中心
- 多伦多大学计算机科学系
- 多伦多大学实验室医学与病理生物学系
- Roche Canada 和 Genentech
使用方式
python
安装所需包
pip install datasets
加载数据集
from datasets import load_dataset
下载并加载数据集
dataset = load_dataset("wanglab/LUNA25-MedSAM2")
访问训练集
train_dataset = dataset["train"]
显示第一个示例
print(train_dataset[0])
引用要求
使用该数据集时需同时引用 LUNA25 和 MedSAM2: bash @misc{LUNA25-Image, doi = {10.5281/ZENODO.14223624}, url = {https://zenodo.org/doi/10.5281/zenodo.14223624}, author = {Peeters, Dré and Obreja, Bogdan and Antonissen, Noa and Jacobs, Colin}, keywords = {Lung Cancer, Artificial Intelligence, Computed Tomography, Radiologists, Computer-Aided Diagnosis}, title = {The LUNA25 Challenge: Public Training and Development set - Imaging Data}, publisher = {Zenodo}, year = {2025}, copyright = {Creative Commons Attribution 4.0 International} }
@misc{LUNA25-Annotation, doi = {10.5281/ZENODO.14673658}, url = {https://zenodo.org/doi/10.5281/zenodo.14673658}, author = {Peeters, Dré and Obreja, Bogdan and Antonissen, Noa and Jacobs, Colin}, keywords = {Lung Cancer, Artificial Intelligence, Computed Tomography, Radiologists, Computer-Aided Diagnosis}, title = {The LUNA25 Challenge: Public Training and Development set - Annotation Data}, publisher = {Zenodo}, year = {2025}, copyright = {Creative Commons Attribution Non Commercial 4.0 International} }
@article{MedSAM2, title={MedSAM2: Segment Anything in 3D Medical Images and Videos}, author={Ma, Jun and Yang, Zongxin and Kim, Sumin and Chen, Bihui and Baharoon, Mohammed and Fallahpour, Adibvafa and Asakereh, Reza and Lyu, Hongwei and Wang, Bo}, journal={arXiv preprint arXiv:2504.63609}, year={2025} }

WideIRSTD Dataset
WideIRSTD数据集包含七个公开数据集:SIRST-V2、IRSTD-1K、IRDST、NUDT-SIRST、NUDT-SIRST-Sea、NUDT-MIRSDT、Anti-UAV,以及由国防科技大学团队开发的数据集,包括模拟陆基和太空基数据,以及真实手动标注的太空基数据。数据集包含具有各种目标形状(如点目标、斑点目标、扩展目标)、波长(如近红外、短波红外和热红外)、图像分辨率(如256、512、1024、3200等)的图像,以及不同的成像系统(如陆基、空基和太空基成像系统)。
github 收录
全国景区数据
中华人民共和国旅游景区质量等级共分为五级,从高到低依次为AAAAA、AAAA、AAA、AA、A级五级。5A级景区代表着中国的世界级精品旅游风景区等级。 CnOpenData汇总整理了全国31个省份及直辖市的景区信息,涵盖了景区名称、省份、景区级别、地址、经纬度、简介等字段,为相关研究助力!
CnOpenData 收录
Tox21
Tox21数据集包含超过12,000种化学物质的生物活性数据,主要用于评估化学物质对12种不同生物学终点的毒性,包括核受体活性和应激反应。
tripod.nih.gov 收录
LIDC-IDRI
LIDC-IDRI 数据集包含来自四位经验丰富的胸部放射科医师的病变注释。 LIDC-IDRI 包含来自 1010 名肺部患者的 1018 份低剂量肺部 CT。
OpenDataLab 收录
中国区域交通网络数据集
该数据集包含中国各区域的交通网络信息,包括道路、铁路、航空和水路等多种交通方式的网络结构和连接关系。数据集详细记录了各交通节点的位置、交通线路的类型、长度、容量以及相关的交通流量信息。
data.stats.gov.cn 收录