Oxford Maternity (OxMat) dataset
收藏arXiv2024-04-11 更新2024-08-06 收录
下载链接:
http://arxiv.org/abs/2404.08024v1
下载链接
链接失效反馈官方服务:
资源简介:
OxMat数据集是全球最大的经过精心策划的CTG数据集,包含原始时间序列CTG数据和母亲及婴儿的广泛临床数据,非常适合机器学习。该数据集自1991年以来,经过临床专家的仔细审查和质量控制,提供了超过177,211个独特的CTG记录,涵盖51,036次妊娠。数据集还包含超过200个产前、产时和产后临床变量,确保关键结果如死胎和酸血症的数据完整性。该数据集特别关注未得到充分服务的产前时期,其中早期检测高风险胎儿可以显著改善健康结果。OxMat数据集为未来的AI驱动的产前护理奠定了基础,提供了一个强大的资源,用于开发和测试旨在改善母婴健康结果的算法。
The OxMat Dataset is the largest curated CTG dataset worldwide, containing raw time-series CTG data and comprehensive clinical data for both mothers and infants, making it highly suitable for machine learning applications. Since 1991, this dataset has undergone rigorous review and quality control by clinical experts, and includes over 177,211 unique CTG records spanning 51,036 pregnancies. It also encompasses more than 200 prenatal, intrapartum, and postnatal clinical variables, ensuring data integrity for critical outcomes such as stillbirth and acidemia. This dataset places particular emphasis on the underserved prenatal period, where early detection of high-risk fetuses can significantly improve health outcomes. The OxMat Dataset lays a foundation for future AI-driven prenatal care, serving as a robust resource for developing and testing algorithms aimed at improving maternal and infant health outcomes.
提供机构:
牛津大学女性与生殖健康纳菲尔德系
创建时间:
2024-04-11
搜集汇总
数据集介绍

构建方式
在产科监护领域,高质量数据的稀缺长期制约着人工智能技术的临床应用。牛津产科数据集(OxMat)的构建始于1991年,通过整合约翰·拉德克利夫医院内六大临床数据源系统化完成。数据采集涵盖Sonicaid Centrale胎心监护系统、ORBIT临床数据仓库、ViewPoint超声系统、BadgerNet新生儿记录服务及MBRRACE全国新生儿死亡调查。原始数据经过临床数据管理专家脱敏处理,采用匿名数字标识符替代可识别信息,并通过自动化数据字典实现变量标准化与异常值校正。最终形成包含51,036次妊娠中177,211条独特胎心监护记录的跨三十年纵向数据集,其中单胎妊娠占比96.46%,产前监护记录达94.23%。
使用方法
该数据集为围产期人工智能研究提供标准化分析框架。研究者可通过分层抽样策略,依据妊娠阶段、胎儿结局或临床变量构建特定亚组队列。原始胎心监护时间序列数据支持深度学习模型端到端训练,临床变量矩阵可用于多模态特征融合与可解释性分析。数据集支持三类典型研究范式:基于监督学习的胎儿风险分层模型开发,利用临床变量与监护信号的时序关联进行预后预测;无监督学习可用于发现新型胎心监护模式与妊娠并发症的潜在生物标志物;迁移学习框架下,该数据集可作为预训练资源增强小规模临床数据的建模效能。使用时应遵循伦理审查要求,结合临床专业知识进行数据解读,并注意产前与产时监护场景的算法适应性差异。
背景与挑战
背景概述
在人工智能技术迅猛渗透医疗领域的背景下,产科监护尤其是胎儿心电监护(CTG)的智能化分析成为提升围产期健康水平的关键路径。牛津产科(OxMat)数据集由牛津大学妇女与生殖健康系的研究团队于2024年正式发布,旨在填补女性健康数据科学的显著空白。该数据集汇集了自1991年以来积累的177,211条独特CTG记录,覆盖51,036次妊娠,并包含超过200项产前、产时及产后的临床变量。作为全球规模最大、经过临床专家精心校审的多模态资源,OxMat不仅提供了原始的时序CTG数据,还整合了母婴双方的详尽临床信息,为核心研究问题——如何通过机器学习实现胎儿窘迫的早期识别与干预——奠定了坚实的数据基础,对推动围产期人工智能技术的创新具有里程碑意义。
当前挑战
OxMat数据集致力于解决胎儿监护领域的关键挑战:如何克服传统CTG分析中因观察者间与观察者内变异导致的解读不一致性,以及如何提升对产前阶段(尤其是占总数94%的产前CTG)胎儿风险的预测精度。在构建过程中,研究团队面临多重挑战:其一,数据整合的复杂性,需将跨越三十余年、来自多个异构系统(如Sonicaid Centrale、ORBIT、ViewPoint等)的海量记录进行匿名化、标准化与融合;其二,确保临床变量的完整性与准确性,特别是针对死产、酸血症等关键结局的近100%数据完备性;其三,处理非随机缺失值与变量间的相互依赖关系,并通过自动化数据字典实现清洗流程的规范化,以维护数据集的机器学习适用性与科研可靠性。
常用场景
经典使用场景
在产科医学与人工智能交叉领域,Oxford Maternity (OxMat) 数据集为胎儿监护研究提供了前所未有的资源。其最经典的应用场景在于利用大规模、高质量的产前胎心宫缩监护(CTG)时间序列数据,结合丰富的临床变量,开发并验证机器学习模型以进行胎儿健康风险分层。该数据集特别侧重于常被忽视的产前期(占94%),使得研究者能够构建算法,在分娩前早期识别处于风险中的胎儿,从而为临床决策提供数据驱动的支持。
解决学术问题
OxMat 数据集有效解决了围产期健康研究中长期存在的若干关键问题。它填补了女性健康数据科学的显著空白,特别是缺乏大规模、高质量且包含详细临床背景的产前CTG数据。该数据集通过提供超过17万条独特的CTG记录和200多个临床变量,为克服现有数据集在数据量、临床细节和产前阶段覆盖不足等方面的局限性提供了解决方案。其意义在于为标准化CTG分析、减少解读中的观察者间差异、以及建立可重复的算法评估基准奠定了坚实基础,推动了胎儿监护从经验判断向精准预测的范式转变。
实际应用
在实际医疗场景中,OxMat 数据集是开发临床决策支持系统的核心资源。基于此数据集训练的AI模型,可集成到医院的胎儿监护系统中,为产科医生提供实时的、客观的胎儿健康状况辅助分析。这有助于在产前检查中更早、更准确地发现胎儿窘迫迹象,如潜在的酸血症或死产风险,从而指导及时干预,优化分娩时机和方式。此外,该数据集支持开发远程监护解决方案,使高危孕妇能在社区或家庭环境中获得专业的胎儿健康评估,提升医疗服务的可及性与连续性。
数据集最近研究
最新研究方向
在产科电子胎心监护领域,牛津产科学数据集(OxMat)的发布标志着人工智能驱动围产期健康研究进入了新阶段。该数据集以其前所未有的规模与多模态特性,正推动研究前沿聚焦于产前胎儿健康风险的早期精准预测。当前热点探索方向在于利用其海量原始胎心宫缩图时间序列数据与超过200项临床变量,开发端到端的深度学习模型,以克服传统方法在解读非平稳信号时面临的观察者间变异挑战。研究重点从传统的产时监护延伸至占据数据主体的产前期,旨在构建能够识别胎儿窘迫细微模式、预测不良结局(如死产与酸血症)的智能算法。这一进展不仅呼应了全球缩小女性健康数据鸿沟的倡议,也为实现个性化产前监护、优化临床决策提供了关键的数据基石,对提升母婴健康结局具有深远的科学与社会意义。
相关研究论文
- 1The OxMat dataset: a multimodal resource for the development of AI-driven technologies in maternal and newborn child health牛津大学女性与生殖健康纳菲尔德系 · 2024年
以上内容由遇见数据集搜集并总结生成



