five

Meply|医学影像数据集|直肠癌研究数据集

收藏
arXiv2024-04-13 更新2024-06-21 收录
医学影像
直肠癌研究
下载链接:
https://github.com/kanydao/CoSAM
下载链接
链接失效反馈
资源简介:
Meply是由中国科学技术大学计算机科学与技术学院创建的大型临床CT图像数据集,专注于直肠癌转移淋巴结的检测与分割。该数据集包含269名直肠癌患者的像素级标注,旨在通过精确的淋巴结分割辅助直肠癌的诊断和治疗。数据集的创建过程涉及经验丰富的医生进行细致的讨论和标注,确保数据质量。Meply的应用领域主要集中在直肠癌的病理分期和治疗效果评估,通过提高淋巴结检测的准确性,有助于改善患者的治疗方案和预后评估。
提供机构:
中国科学技术大学计算机科学与技术学院
创建时间:
2024-04-13
AI搜集汇总
数据集介绍
main_image_url
构建方式
Meply数据集的构建过程严谨而细致,涵盖了269例经诊断为直肠癌患者的增强计算机断层扫描(CT)图像。每例图像均经过像素级标注,由经验丰富的医生团队进行全面讨论,首先确定直肠癌的分期,随后精确标定转移性淋巴结的位置和边界。这一过程确保了数据集的高质量和临床相关性,为直肠癌转移性淋巴结的分割提供了宝贵的资源。
特点
Meply数据集的显著特点在于其针对性强、标注精细且规模庞大。该数据集专注于直肠癌转移性淋巴结的分割,克服了现有数据集在像素级标注上的不足。转移性淋巴结因其小尺寸、不规则形状和低对比度而难以识别,Meply通过精细的像素级标注,为研究者提供了丰富的形态和尺寸多样性,极大地提升了分割任务的挑战性和实用性。
使用方法
Meply数据集适用于开发和验证直肠癌转移性淋巴结分割算法。研究者可以利用该数据集训练和评估模型,以提高对转移性淋巴结的定位和分割精度。具体使用方法包括将数据集划分为训练集和测试集,采用深度学习模型进行训练,并通过交叉验证和独立测试集评估模型性能。此外,数据集的公开性也促进了学术界和临床实践的交流与合作,推动了直肠癌诊疗技术的进步。
背景与挑战
背景概述
直肠癌是全球范围内常见的结直肠癌类型,其准确的分期和治疗依赖于对转移性淋巴结的精确分割。然而,现有的分割方法面临挑战,主要原因是缺乏针对直肠周围淋巴结的像素级标注数据集。为此,郭伟东等研究人员于2024年创建了Meply数据集,这是首个大规模的直肠周围转移性淋巴结CT图像数据集,包含269名直肠癌患者的像素级标注。该数据集的创建旨在解决现有方法在处理小尺寸、不规则形状和低对比度淋巴结时的局限性,推动直肠癌分期和治疗的发展。
当前挑战
Meply数据集在构建过程中面临多项挑战。首先,转移性淋巴结的尺寸小、形状不规则且与周围组织对比度低,这使得手动标注变得复杂且耗时。其次,由于直肠周围解剖结构的复杂性,淋巴结的识别易受邻近组织和器官的干扰。此外,现有方法在处理医学图像时,难以直接应用于复杂的医学场景,尤其是在处理边缘敏感的小器官和病变时。这些挑战要求开发新的分割技术,以提高对直肠周围转移性淋巴结的定位和分割精度。
常用场景
经典使用场景
Meply数据集的经典使用场景主要集中在直肠癌转移性淋巴结的检测与分割任务中。该数据集通过提供269例直肠癌患者的CT图像及其像素级标注,为研究人员和医疗从业者提供了一个高质量的基准,用于开发和验证针对直肠癌转移性淋巴结的自动分割算法。这些算法在直肠癌的临床分期、治疗规划和疗效评估中具有重要意义。
衍生相关工作
基于Meply数据集,研究者开发了多种先进的分割模型,如CoSAM,该模型结合了序列检测和分割任务,显著提高了转移性淋巴结的定位精度。此外,Meply数据集还激发了针对直肠癌转移性淋巴结分割的多种研究方向,包括深度学习模型的优化、多任务学习框架的构建以及跨模态数据融合技术的探索。这些工作不仅提升了分割性能,还推动了医学图像分析领域的发展。
数据集最近研究
最新研究方向
在直肠癌的精准治疗领域,Meply数据集的引入标志着对转移性直肠淋巴结检测与分割研究的重要进展。该数据集不仅提供了大规模的像素级标注,还为开发和验证先进的分割算法提供了坚实的基础。最新研究方向集中在利用深度学习技术,特别是基于SAM(Segment Anything Model)的协同学习框架,如CoSAM,以提高淋巴结的定位精度和分割效果。这些研究不仅解决了传统方法在处理小尺寸、不规则形状和低对比度淋巴结时的局限性,还推动了自动化和半自动化分割技术的发展,为直肠癌的临床诊断和治疗提供了新的工具和方法。
相关研究论文
  • 1
    Meply: A Large-scale Dataset and Baseline Evaluations for Metastatic Perirectal Lymph Node Detection and Segmentation中国科学技术大学计算机科学与技术学院 · 2024年
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

TCIA

TCIA(The Cancer Imaging Archive)是一个公开的癌症影像数据集,包含多种癌症类型的医学影像数据,如CT、MRI、PET等。这些数据通常与临床和病理信息相结合,用于癌症研究和临床试验。

www.cancerimagingarchive.net 收录

FAOSTAT Agricultural Data

FAOSTAT Agricultural Data 是由联合国粮食及农业组织(FAO)提供的全球农业数据集。该数据集涵盖了农业生产、贸易、价格、土地利用、水资源、气候变化、人口统计等多个方面的详细信息。数据包括了全球各个国家和地区的农业统计数据,旨在为政策制定者、研究人员和公众提供全面的农业信息。

www.fao.org 收录

MedDialog

MedDialog数据集(中文)包含了医生和患者之间的对话(中文)。它有110万个对话和400万个话语。数据还在不断增长,会有更多的对话加入。原始对话来自好大夫网。

github 收录

广油工业旋转大机组故障诊断样本数据库

面向工业大机组故障诊断与维护的智能监测与预警系统,用于大型工业旋转机械,涵盖烟机、汽轮机、压缩机、发电机等多种类型的机组的实验数据研究。1、用途:能够用于大型工业旋转机械的故障诊断,包括早期故障预警、故障类型识别、故障严重程度评估等。2、起到的作用/解决的问题:大型机组故障诊断困难,依靠人工经验判断故障原因和部位,效率比较低下且成本高。利用该数据集研究构建泛化效果更好的智能诊断模型,可提高故障诊断的效率和准确性,降低维修成本,减少停机时间。3、带来的经济收益:据统计,工业大机组停机损失每天可达数十万至数百万元。利用该数据集构建的智能诊断系统,可以提前发现潜在故障并预警,从而避免计划外的停机,每年为工业大机组带来更大的经济效益。此外,通过数据驱动的智能维护,可减少人工成本,提高设备使用寿命,降低备件库存成本。随着工业互联网和智能制造的发展,该系统将具有广泛的应用前景和商业价值。

深圳市数据知识产权登记系统 收录

China Air Quality Historical Data

该数据集包含了中国多个城市的空气质量历史数据,涵盖了PM2.5、PM10、SO2、NO2、CO、O3等污染物浓度以及空气质量指数(AQI)等信息。数据按小时记录,提供了详细的空气质量监测数据。

www.cnemc.cn 收录