five

Historical Obstetrics & Gynaecology Medical AI Archive (pre‑1930)

收藏
Snowflake2026-05-18 更新2026-05-19 收录
下载链接:
https://app.snowflake.com/marketplace/listing/GZSXZGPW4IM2
下载链接
链接失效反馈
官方服务:
资源简介:
This bundle contains the complete pre‑1930 runs of the two flagship journals of reproductive health: <p><br/></p> - American Journal of Obstetrics & Gynaecology (AJOG) - 1920‑1930 - British Journal of Obstetrics and Gynaecology (BJOG) - 1902‑1930 <p><br/></p> Together, these journals document the transformation of obstetrics and gynaecology from empirical craft to evidence‑based medical specialty. <p><br/></p> **Use this dataset to:** <p><br/></p> - Train LLMs on early 20th‑century obstetrical care, reproductive anatomy, and gynaecological surgery - Extract clinical entities (preeclampsia, cesarean section, puerperal fever, ovarian pathology) - Study maternal mortality reduction, antisepsis adoption, and the rise of hormonal therapy - Support research in women's health AI, reproductive epidemiology, and historical bias detection <p><br/></p> All content is professionally OCR‑cleaned, structured as JSONL, and bias‑audited with historical context notices. 100% public domain (pre‑1930). Snowflake‑optimized. <p><br/></p> 💡 **Example Cortex AI Agent Prompts:** To evaluate the deep clinical signal and semantic reach of this historical obstetrics and gynaecology archive, consumers can issue the following queries directly to the agent: <p><br/></p> 1. "Analyze the shifting clinical consensus regarding antiseptic labor practices, the use of early pharmacological anesthesia in obstetrics, and mortality rate documentation prior to 1920." 2. "Trace the historical evolution of surgical intervention protocols, including early cesarean section techniques and the management of puerperal complications recorded in specialized journals." 3. "Summarize the developmental trajectory of gynaecological diagnostic methodologies, instrumentation, and pathology tracking documented in major medical archives before 1930." <p><br/></p> Total rows: 29,993 Time period: 1902‑1930 Geographic coverage: United States and United Kingdom
提供机构:
Devin Media Corp.
创建时间:
2026-05-17
原始信息汇总

基于您提供的HTML内容,以下是该数据集的详细概述:

数据集名称

Historical Obstetrics & Gynaecology Medical AI Archive (pre‑1930)

数据提供方

Devin Media Corp.

数据集描述

该数据集包含两大妇产科旗舰期刊在1930年之前的完整卷期:

  • American Journal of Obstetrics & Gynaecology (AJOG):1920‑1930年
  • British Journal of Obstetrics and Gynaecology (BJOG):1902‑1930年

这些期刊共同记录了妇产科从经验技艺向循证医学专业转变的历程。所有内容均经过专业OCR清洗、结构化处理为JSONL格式,并进行了带有历史背景说明的偏差审计。数据集为公共领域(1930年之前)内容,并针对Snowflake进行了优化。

关键统计信息

  • 总行数:29,993
  • 时间跨度:1902‑1930年
  • 地理覆盖:美国与英国

数据用途

该数据集可用于:

  • 基于20世纪早期产科护理、生殖解剖学和妇科手术文献训练大语言模型(LLM)
  • 提取临床实体(如子痫前期、剖宫产、产褥热、卵巢病理)
  • 研究孕产妇死亡率降低、防腐技术的采用以及激素疗法的兴起
  • 支持女性健康AI、生殖流行病学和历史偏差检测研究

商业需求

  1. 模型开发:训练妇产科领域专用的大语言模型,支持女性健康AI、生殖医学等应用的预训练和微调。
  2. 实体识别:提取妇产科实体(子痫前期、前置胎盘、剖宫产、卵巢囊肿、产褥热),用于20世纪早期临床术语的高精度命名实体识别(NER)。
  3. 文本摘要:利用完整的文章与原始标题对,训练模型从冗长的历史病例报告和手术描述中生成简洁的临床摘要。
  4. 临床路径分析:分析三十年间产科和妇科护理的演变,从防腐方案到激素疗法兴起以及孕产妇死亡率的改善。

数据字典

数据集包含一个核心表 OBGYN_ARCHIVE,其列结构如下:

列名 数据类型 描述(基于预览数据推断)
ISSUE Varchar 出版物期号标识
TITLE Varchar 文章标题
AUTHOR Varchar 文章作者
TYPE Varchar 内容类型(如 article
TEXT Varchar 文章正文文本
INGESTION_DATE Timestamp_NTZ 数据收录日期

使用示例

  1. 查看数据内容: sql SELECT ISSUE, TITLE, AUTHOR FROM OBGYN_ARCHIVE WHERE TYPE = article LIMIT 10;

  2. 查找特定病症(如子痫前期)的相关文章: sql SELECT ISSUE, TITLE FROM OBGYN_ARCHIVE WHERE TEXT ILIKE %preeclampsia% OR TEXT ILIKE %eclampsia% LIMIT 20;

  3. 按期刊和年份统计文章数量: sql SELECT SPLIT_PART(ISSUE, _, 1) AS JOURNAL, LEFT(ISSUE, 4) AS YEAR, COUNT(*) AS ARTICLE_COUNT FROM OBGYN_ARCHIVE WHERE TYPE = article GROUP BY JOURNAL, YEAR ORDER BY JOURNAL, YEAR;

定价信息

  • Pricing: 需联系获取(页面显示 "Get Unlock New Insights")。

更新频率

  • Refreshes: 每年(Annually)。

交付方式

  • Delivery Method: 安全共享(Secure share)。

法律条款

  • Legal Terms: 标准(Standard)。

数据类别

  • Categories: AI & ML, Health and Life Sciences

联系信息

  • Sales: hello@devinmediacorp.com
  • Support: hello@devinmediacorp.com
二维码
社区交流群
二维码
科研交流群
商业服务