five

Southern Medical University IVF-ET Dataset|体外受精数据集|医学图像分析数据集

收藏
arXiv2025-01-08 更新2025-01-10 收录
体外受精
医学图像分析
下载链接:
https://github.com/Ou-Young-1999/DFNet
下载链接
链接失效反馈
资源简介:
该数据集由南方医科大学创建,主要用于体外受精胚胎移植(IVF-ET)的妊娠预测研究。数据集包含4046个案例,每个案例包括胚胎发育前三天的显微图像和22个父母生育指标。数据集的标签为阳性或阴性,表示是否成功检测到胎心。数据集的应用领域为医学图像分析,旨在通过多模态信息融合提高妊娠预测的准确性。
提供机构:
华南理工大学计算机科学与工程学院, 南方医科大学南方医院妇产科, 罗切斯特理工学院计算与信息科学学院, 悉尼科技大学数据科学研究所
创建时间:
2025-01-08
AI搜集汇总
数据集介绍
main_image_url
构建方式
Southern Medical University IVF-ET Dataset 的构建基于南方医科大学收集的4046例胚胎移植案例,涵盖了胚胎发育前三天的显微图像和22项父母生育指标。数据集的构建过程包括从临床环境中获取胚胎图像和生育指标,并通过标准化处理确保数据的一致性和可用性。图像数据通过显微镜拍摄,记录了胚胎在不同发育阶段的变化,而生育指标则通过临床检查和实验室测试获得。每个案例的标签为阳性或阴性,表示是否成功检测到胎心。数据集的构建旨在为多模态融合模型提供高质量的训练和测试数据,以提升体外受精胚胎移植(IVF-ET)的妊娠预测准确性。
特点
该数据集的特点在于其多模态性,结合了胚胎发育的时间序列图像和父母的生育指标。胚胎图像记录了前三天的发育过程,提供了丰富的形态学信息,而生育指标则涵盖了父母的年龄、子宫内膜厚度、精子质量等关键临床数据。这种多模态数据的结合使得模型能够同时利用形态学和临床信息,从而更全面地评估胚胎的发育潜力和妊娠成功率。此外,数据集的标签明确,每个案例都有明确的妊娠结果,便于模型的监督学习。数据集的高质量和多样性使其成为IVF-ET领域研究的宝贵资源。
使用方法
Southern Medical University IVF-ET Dataset 的使用方法主要包括数据预处理、模型训练和评估。首先,胚胎图像和生育指标需要进行标准化处理,如图像的裁剪和归一化,以及生育指标的缺失值填补和归一化。随后,数据集可以用于训练多模态融合模型,如DeFusion网络,该网络通过解耦融合模块将不同模态的信息分解为相关和不相关特征,从而实现更精细的融合。模型的性能可以通过准确率、AUC和F1-score等指标进行评估。此外,数据集还可以用于交叉验证,以确保模型的泛化能力。通过该数据集,研究人员可以开发出更精准的IVF-ET妊娠预测模型,为临床决策提供支持。
背景与挑战
背景概述
Southern Medical University IVF-ET Dataset 是由南方医科大学与华南理工大学等机构合作创建的一个多模态数据集,专注于体外受精胚胎移植(IVF-ET)过程中的妊娠预测。该数据集于2025年首次发布,包含了4046例胚胎移植案例,涵盖了胚胎发育前三天的显微图像和22项父母生育指标。该数据集的核心研究问题是通过多模态信息的融合,提升IVF-ET妊娠预测的准确性。其创新之处在于首次将前三天的胚胎发育时序图像与父母生育指标相结合,为IVF-ET领域的研究提供了新的数据支持。该数据集不仅在IVF-ET领域具有重要影响力,还为多模态医学数据分析提供了新的研究方向。
当前挑战
Southern Medical University IVF-ET Dataset 面临的挑战主要体现在两个方面。首先,在领域问题方面,IVF-ET妊娠预测的准确性受限于胚胎形态学评估的主观性和不一致性,且胚胎形态与真实发育潜力之间的相关性较弱。现有的单模态方法(如图像或表格数据)无法充分利用多模态信息的互补性,导致预测性能受限。其次,在数据集构建过程中,挑战主要来自于多模态数据的对齐与融合。胚胎发育的时序图像与父母生育指标的数据格式差异较大,如何有效地提取和融合这些异构信息是一个技术难点。此外,数据集中存在缺失值和噪声,如何在不损失信息的情况下进行数据预处理也是构建过程中的一大挑战。
常用场景
经典使用场景
Southern Medical University IVF-ET Dataset 主要用于体外受精胚胎移植(IVF-ET)过程中的妊娠预测研究。该数据集结合了胚胎发育的时间序列图像和父母的生育指标表,为多模态信息融合提供了丰富的数据基础。通过该数据集,研究人员可以构建和验证多模态融合模型,以提升妊娠预测的准确性和可靠性。
解决学术问题
该数据集解决了IVF-ET领域中胚胎形态评估主观性强、一致性低的问题。通过结合胚胎发育的时间序列图像和父母的生育指标,数据集为多模态信息融合提供了新的研究方向,帮助研究人员更准确地预测妊娠结果。此外,该数据集还推动了多模态融合技术在医学领域的应用,提升了模型的泛化能力和预测性能。
衍生相关工作
基于该数据集,研究人员提出了多种多模态融合模型,如DeFusion网络。这些模型通过解耦不同模态的信息,实现了更精细的特征融合,显著提升了妊娠预测的准确性。此外,该数据集还催生了一系列相关研究,如基于时间序列图像的胚胎发育评估、基于生育指标的妊娠预测等,推动了IVF-ET领域的智能化发展。
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

中国农村金融统计数据

该数据集包含了中国农村金融的统计信息,涵盖了农村金融机构的数量、贷款余额、存款余额、金融服务覆盖率等关键指标。数据按年度和地区分类,提供了详细的农村金融发展状况。

www.pbc.gov.cn 收录

中国交通事故深度调查(CIDAS)数据集

交通事故深度调查数据通过采用科学系统方法现场调查中国道路上实际发生交通事故相关的道路环境、道路交通行为、车辆损坏、人员损伤信息,以探究碰撞事故中车损和人伤机理。目前已积累深度调查事故10000余例,单个案例信息包含人、车 、路和环境多维信息组成的3000多个字段。该数据集可作为深入分析中国道路交通事故工况特征,探索事故预防和损伤防护措施的关键数据源,为制定汽车安全法规和标准、完善汽车测评试验规程、

北方大数据交易中心 收录

Fruits-360

一个高质量的水果图像数据集,包含多种水果的图像,如苹果、香蕉、樱桃等,总计42345张图片,分为训练集和验证集,共有64个水果类别。

github 收录

China Air Quality Historical Data

该数据集包含了中国多个城市的空气质量历史数据,涵盖了PM2.5、PM10、SO2、NO2、CO、O3等污染物浓度以及空气质量指数(AQI)等信息。数据按小时记录,提供了详细的空气质量监测数据。

www.cnemc.cn 收录

VisDrone2019

VisDrone2019数据集由AISKYEYE团队在天津大学机器学习和数据挖掘实验室收集,包含288个视频片段共261,908帧和10,209张静态图像。数据集覆盖了中国14个不同城市的城市和乡村环境,包括行人、车辆、自行车等多种目标,以及稀疏和拥挤场景。数据集使用不同型号的无人机在各种天气和光照条件下收集,手动标注了超过260万个目标边界框,并提供了场景可见性、对象类别和遮挡等重要属性。

github 收录