five

The New England Journal of Medicine Archive (1828-1930)

收藏
Snowflake2026-04-06 更新2026-04-07 收录
下载链接:
https://app.snowflake.com/marketplace/listing/GZSXZGPW3RVT
下载链接
链接失效反馈
官方服务:
资源简介:
**The NEJM Heritage Collection:** Complete pre-1930 archive of the Boston Medical and Surgical Journal, the direct ancestor of today's New England Journal of Medicine. **203,123 rows** of clean, structured medical text spanning the formative years of American medicine (1824–1930). **What this data does for your model:** - Your model learns authentic early 19th‑century American medicine from the direct ancestor of today's NEJM, originally published as the *Boston Medical and Surgical Journal*. - Your model retrieves original research from 1824–1900, including foundational work on cancer, tuberculosis, infectious disease, and surgical innovation. - Your model trains on the language of pre‑Civil War American medicine, documenting the transition from heroic therapies to evidence‑based practice. - Your model understands the evolution of American medical journalism from the earliest continuously published medical journal in the United States. **What's inside:** - Boylston Prize-winning dissertations (including Usher Parsons on cancer of the breast) - Original clinical case studies from early American physicians - Surgical innovations and treatment protocols - Foundational research on cancer, tuberculosis, and infectious disease - Medical debates that shaped 19th-century American medicine **Perfect for:** - LLM fine-tuning and medical NLP - Historical clinical research - Digital humanities and medical history - Healthcare AI training **Format:** Snowflake-native JSONL with columns: ISSUE, TITLE, AUTHOR, TYPE, TEXT. Fully cleaned, bias-audited, and ready for AI training. <p><br/></p>

**《新英格兰医学杂志(NEJM)典藏集》**:完整收录1930年之前的《波士顿医学与外科杂志》档案,该刊为今日《新英格兰医学杂志》的直接前身。 共计203,123条经清洗的结构化医学文本,覆盖美国医学发展的奠基阶段(1824年至1930年)。 **本数据集可为模型带来以下价值:** - 模型可通过这份今日《新英格兰医学杂志》的前身——最初以《波士顿医学与外科杂志》之名刊行的档案,学习真实可信的19世纪早期美国医学知识。 - 模型可检索1824年至1900年的原创研究,涵盖癌症、肺结核、传染病及外科手术创新领域的奠基性成果。 - 模型可基于美国内战前的医学语料进行训练,还原美国医学从19世纪激进疗法向循证实践转型的完整历程。 - 模型可通过这份美国历史最悠久的连续出版医学期刊档案,掌握美国医学传媒的发展演进脉络。 **数据集内容包含:** - 博伊尔斯顿奖(Boylston Prize)获奖学术论文(包括厄舍·帕森斯关于乳腺癌的研究) - 早期美国医师的原创临床病例研究 - 外科手术创新与诊疗规范 - 癌症、肺结核及传染病领域的奠基性研究 - 塑造19世纪美国医学发展轨迹的医学学术论战 **适用领域包括:** - 大语言模型(LLM)微调与医学自然语言处理 - 临床历史研究 - 数字人文与医学史研究 - 医疗人工智能训练 **格式:** 原生适配Snowflake的JSONL格式,字段包含:ISSUE、TITLE、AUTHOR、TYPE、TEXT。所有文本均已完成清洗与偏倚审核,可直接用于人工智能训练。 <p><br/></p>
提供机构:
Devin Media Corp.
创建时间:
2026-04-02
原始信息汇总

The New England Journal of Medicine Archive (1828-1930) 数据集概述

数据集基本信息

  • 数据集名称: The New England Journal of Medicine Archive (1828-1930)
  • 提供商: Devin Media Corp.
  • 数据格式: Snowflake-native JSONL
  • 数据行数: 203,123 行
  • 时间范围: 1824–1930年
  • 地理覆盖范围: 全球
  • 数据更新频率: 每年
  • 云区域可用性: 支持AWS多个区域,包括亚太(雅加达)、亚太(马来西亚)、亚太(孟买)、亚太(大阪)等

数据集内容描述

该数据集是《新英格兰医学杂志》的前身《波士顿医学与外科杂志》的完整1930年前档案,涵盖了美国医学形成时期(1824–1930年)的清洁、结构化医学文本。

包含内容

  • Boylston Prize获奖论文(包括Usher Parsons关于乳腺癌的研究)
  • 早期美国医生的原始临床病例研究
  • 外科创新和治疗方案
  • 关于癌症、结核病和传染病的基础研究
  • 塑造19世纪美国医学的医学辩论

数据结构

数据表名:NEJM_CORPUS 包含列:

  • ISSUE (Varchar)
  • TITLE (Varchar)
  • AUTHOR (Varchar)
  • TYPE (Varchar)
  • TEXT (Varchar)
  • INGESTION_DATE (Timestamp_NTZ)

适用场景

机器学习

  • 领域特定的LLM微调
  • 医学术语演变追踪
  • 临床NLP模型开发
  • 历史生物医学知识提取

真实世界数据(RWD)

  • 历史记录的临床病例、治疗结果和疾病描述
  • 记录的手术程序和结果
  • 癌症、结核病和传染病的临床观察
  • Boylston Prize获奖论文
  • 历史患者表现和治疗方案

生命科学商业化

  • 追踪100多年间治疗范式的演变
  • 理解塑造现代医学的基础研究
  • 分析历史临床方法学
  • 识别疾病管理和药物开发的长期模式

使用示例

查看元数据文档

sql SELECT TITLE, TEXT FROM NEJM_CORPUS WHERE TYPE = metadata LIMIT 5;

搜索获奖论文

sql SELECT ISSUE, TITLE, AUTHOR FROM NEJM_CORPUS WHERE TYPE = article AND TITLE ILIKE %prize% LIMIT 10;

按类型统计行数

sql SELECT TYPE, COUNT(*) FROM NEJM_CORPUS GROUP BY TYPE;

定价信息

  • 许可方式: 需联系获取许可
  • 联系方式:
    • 销售: hello@devinmediacorp.com
    • 支持: hello@devinmediacorp.com

数据特点

  • AI训练就绪
  • JSONL格式
  • 203,123行清洁医学文本
  • 1828–1930年连续覆盖
  • 包含Boylston Prize获奖论文
  • 经过专业OCR处理和清洁
  • 来源追踪和偏见审核
  • 预1930年且已验证公共领域/版权免费

法律条款

  • 条款类型: 标准条款

提供商其他数据集

  • Journal of the American Medical Association (JAMA) Dermatology Historical Archive
  • JAMA Surgery Dataset 1911 to 1930 Cleaned Structured AI Ready
  • JAMA Pediatrics Clinical Dataset (1911–1930)
  • JAMA: The Journal of the American Medical Association (1883-1930)
  • Johns Hopkins Medical Journal Archive (1890-1926)
  • Journal of the American Medical Association (Dermatology) — Complete Archive 1920-1930
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作