five

MMOTU|医疗图像处理数据集|癌症诊断数据集

收藏
arXiv2023-12-01 更新2024-06-21 收录
医疗图像处理
癌症诊断
下载链接:
https://github.com/cv516Buaa/MMOTU_DS2Net
下载链接
链接失效反馈
资源简介:
MMOTU数据集是由北京航空航天大学电子信息工程学院和首都医科大学北京世纪坛医院妇产科联合创建的,包含1639张卵巢肿瘤超声图像,其中1469张为二维超声图像,170张为对比增强超声图像。该数据集旨在解决多模态卵巢肿瘤超声图像的跨域语义分割问题,通过提供像素级和全局级标注,支持无监督跨域语义分割研究。数据集的应用领域包括早期卵巢肿瘤检测和计算机辅助诊断,旨在提高卵巢癌的早期诊断率和降低死亡率。
提供机构:
北京航空航天大学电子信息工程学院
创建时间:
2022-07-14
AI搜集汇总
数据集介绍
main_image_url
构建方式
MMOTU数据集的构建旨在解决卵巢肿瘤超声图像在多模态特征表示和跨域语义分割方面的研究不足。数据集包含了1469张二维超声图像和170张对比增强超声图像,均带有像素级和全局级注释。这些图像来源于北京世纪坛医院,由294名患者的卵巢超声图像构成,涵盖了8种典型的卵巢肿瘤类别。数据集被分为训练集和测试集,以确保在训练和测试过程中不存在患者重叠。图像注释由27名妇产科专家完成,保证了注释的质量和准确性。
特点
MMOTU数据集的特点在于其多模态性和跨域语义分割的应用。数据集包含两种模态的超声图像,即二维超声和对比增强超声,为研究多模态超声图像的特征表示能力提供了基础。此外,数据集还提供了像素级和全局级的注释,为跨域语义分割任务提供了必要的信息。MMOTU数据集的构建有助于推动卵巢肿瘤检测在多模态超声图像上的研究,为临床诊断和治疗提供了新的视角。
使用方法
MMOTU数据集的使用主要集中在对二维超声和对比增强超声图像进行跨域语义分割。研究者可以利用数据集中的像素级和全局级注释,训练深度学习模型进行肿瘤区域分割。此外,数据集还支持无监督域适应任务,研究者可以探索如何将源域中的训练模型应用于目标域中的图像,以解决域迁移问题。MMOTU数据集的公开和可用性,为研究者提供了宝贵的资源,有助于推动卵巢肿瘤检测和分割技术的发展。
背景与挑战
背景概述
卵巢癌是一种危害极大的妇科疾病,早期通过计算机辅助技术检测卵巢肿瘤可以有效降低死亡率。超声图像因其方便且对人体影响较小,在临床治疗中应用广泛。然而,现有研究主要集中在单一模态的超声卵巢肿瘤分割或识别,缺乏对多模态超声卵巢肿瘤图像表征能力的探索。为了解决这个问题,研究人员构建了多模态卵巢肿瘤超声图像数据集(MMOTU),包含1469张二维超声图像和170张对比增强超声图像,并提供了像素级和全局级的注释。基于MMOTU数据集,研究人员主要关注无监督跨域语义分割任务,并提出了名为双方案域选择网络(DS2Net)的特征对齐架构,以解决域偏移问题。该数据集和代码已在GitHub上公开,为相关领域的研究提供了重要的数据资源。
当前挑战
MMOTU数据集在卵巢肿瘤的早期检测和分类方面具有重要意义,但仍面临一些挑战。首先,数据集规模相对较小,尤其是对比增强超声图像的数量较少,这可能会影响模型的泛化能力。其次,数据集中的样本类别不平衡,某些肿瘤类型的数据较少,可能导致模型对这些类型肿瘤的识别能力不足。此外,数据集中存在一些标注符号,可能会对模型的训练和预测产生干扰。未来研究需要进一步扩大数据集规模,平衡样本类别,并探索去除标注符号对模型性能的影响。
常用场景
经典使用场景
MMOTU数据集主要被用于卵巢肿瘤超声图像的无监督跨域语义分割任务。该数据集包含了1469张二维超声图像和170张对比增强超声图像,并提供了像素级和全局级的标注。基于MMOTU数据集,研究者们可以探索多模态超声图像在卵巢肿瘤分割任务中的表示能力,以及无监督域自适应技术在该任务中的应用潜力。
解决学术问题
MMOTU数据集解决了卵巢肿瘤分割任务中缺乏多模态超声图像数据集的问题。以往的研究主要集中在单模态超声图像的分割或识别上,而MMOTU数据集提供了多模态超声图像,有助于研究者们探索多模态特征表示在卵巢肿瘤分割任务中的潜力。此外,MMOTU数据集还解决了跨域分割问题,通过无监督域自适应技术,可以有效地将源域上的分割模型应用于目标域上,从而提高了分割性能。
衍生相关工作
MMOTU数据集的提出衍生了许多相关的研究工作。例如,DS2Net方法通过特征对齐和特征解耦技术,有效地解决了跨域分割问题,并在MMOTU数据集上取得了优异的性能。此外,研究者们还可以将MMOTU数据集应用于其他医学图像分割任务,如心脏分割、肝脏分割等,以探索无监督域自适应技术在其他领域的应用潜力。
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

Figshare

Figshare是一个在线数据共享平台,允许研究人员上传和共享各种类型的研究成果,包括数据集、论文、图像、视频等。它旨在促进科学研究的开放性和可重复性。

figshare.com 收录

网易云音乐数据集

该数据集包含了网易云音乐平台上的歌手信息、歌曲信息和歌单信息,数据通过爬虫技术获取并整理成CSV格式,用于音乐数据挖掘和推荐系统构建。

github 收录

中国空气质量数据集(2014-2020年)

数据集中的空气质量数据类型包括PM2.5, PM10, SO2, NO2, O3, CO, AQI,包含了2014-2020年全国360个城市的逐日空气质量监测数据。监测数据来自中国环境监测总站的全国城市空气质量实时发布平台,每日更新。数据集的原始文件为CSV的文本记录,通过空间化处理生产出Shape格式的空间数据。数据集包括CSV格式和Shape格式两数数据格式。

国家地球系统科学数据中心 收录

Drone-type dataset

Drone-type数据集是由卡塔尔的Supreme Committee for Delivery and Legacy (SC)支持的研究团队创建,旨在为无人机检测和跟踪提供一个基准。该数据集包含7000张图像,涵盖了七种不同类型的无人机,图像来自YouTube视频,具有不同尺度和视野。数据集的创建过程包括从视频中提取图像并手动进行边界框标注。该数据集主要应用于无人机检测领域,旨在解决无人机类型识别的问题,提高检测系统的准确性和效率。

arXiv 收录

ChemBL

ChemBL是一个化学信息学数据库,包含大量生物活性数据,涵盖了药物发现和开发过程中的各种化学实体。数据集包括化合物的结构信息、生物活性数据、靶点信息等。

www.ebi.ac.uk 收录