The New England Journal of Medicine Archive (1828-1930)
收藏Snowflake2026-04-06 更新2026-04-07 收录
下载链接:
https://app.snowflake.com/marketplace/listing/GZSXZGPW3RVT
下载链接
链接失效反馈官方服务:
资源简介:
**The NEJM Heritage Collection:** Complete pre-1930 archive of the Boston Medical and Surgical Journal, the direct ancestor of today's New England Journal of Medicine.
**203,123 rows** of clean, structured medical text spanning the formative years of American medicine (1824–1930).
**What this data does for your model:**
- Your model learns authentic early 19th‑century American medicine from the direct ancestor of today's NEJM, originally published as the *Boston Medical and Surgical Journal*.
- Your model retrieves original research from 1824–1900, including foundational work on cancer, tuberculosis, infectious disease, and surgical innovation.
- Your model trains on the language of pre‑Civil War American medicine, documenting the transition from heroic therapies to evidence‑based practice.
- Your model understands the evolution of American medical journalism from the earliest continuously published medical journal in the United States.
**What's inside:**
- Boylston Prize-winning dissertations (including Usher Parsons on cancer of the breast)
- Original clinical case studies from early American physicians
- Surgical innovations and treatment protocols
- Foundational research on cancer, tuberculosis, and infectious disease
- Medical debates that shaped 19th-century American medicine
**Perfect for:**
- LLM fine-tuning and medical NLP
- Historical clinical research
- Digital humanities and medical history
- Healthcare AI training
**Format:** Snowflake-native JSONL with columns: ISSUE, TITLE, AUTHOR, TYPE, TEXT. Fully cleaned, bias-audited, and ready for AI training.
<p><br/></p>
**《新英格兰医学杂志(NEJM)典藏集》**:完整收录1930年之前的《波士顿医学与外科杂志》档案,该刊为今日《新英格兰医学杂志》的直接前身。
共计203,123条经清洗的结构化医学文本,覆盖美国医学发展的奠基阶段(1824年至1930年)。
**本数据集可为模型带来以下价值:**
- 模型可通过这份今日《新英格兰医学杂志》的前身——最初以《波士顿医学与外科杂志》之名刊行的档案,学习真实可信的19世纪早期美国医学知识。
- 模型可检索1824年至1900年的原创研究,涵盖癌症、肺结核、传染病及外科手术创新领域的奠基性成果。
- 模型可基于美国内战前的医学语料进行训练,还原美国医学从19世纪激进疗法向循证实践转型的完整历程。
- 模型可通过这份美国历史最悠久的连续出版医学期刊档案,掌握美国医学传媒的发展演进脉络。
**数据集内容包含:**
- 博伊尔斯顿奖(Boylston Prize)获奖学术论文(包括厄舍·帕森斯关于乳腺癌的研究)
- 早期美国医师的原创临床病例研究
- 外科手术创新与诊疗规范
- 癌症、肺结核及传染病领域的奠基性研究
- 塑造19世纪美国医学发展轨迹的医学学术论战
**适用领域包括:**
- 大语言模型(LLM)微调与医学自然语言处理
- 临床历史研究
- 数字人文与医学史研究
- 医疗人工智能训练
**格式:**
原生适配Snowflake的JSONL格式,字段包含:ISSUE、TITLE、AUTHOR、TYPE、TEXT。所有文本均已完成清洗与偏倚审核,可直接用于人工智能训练。
<p><br/></p>
提供机构:
Devin Media Corp.
创建时间:
2026-04-02
原始信息汇总
The New England Journal of Medicine Archive (1828-1930) 数据集概述
数据集基本信息
- 数据集名称: The New England Journal of Medicine Archive (1828-1930)
- 提供商: Devin Media Corp.
- 数据格式: Snowflake-native JSONL
- 数据行数: 203,123 行
- 时间范围: 1824–1930年
- 地理覆盖范围: 全球
- 数据更新频率: 每年
- 云区域可用性: 支持AWS多个区域,包括亚太(雅加达)、亚太(马来西亚)、亚太(孟买)、亚太(大阪)等
数据集内容描述
该数据集是《新英格兰医学杂志》的前身《波士顿医学与外科杂志》的完整1930年前档案,涵盖了美国医学形成时期(1824–1930年)的清洁、结构化医学文本。
包含内容
- Boylston Prize获奖论文(包括Usher Parsons关于乳腺癌的研究)
- 早期美国医生的原始临床病例研究
- 外科创新和治疗方案
- 关于癌症、结核病和传染病的基础研究
- 塑造19世纪美国医学的医学辩论
数据结构
数据表名:NEJM_CORPUS 包含列:
- ISSUE (Varchar)
- TITLE (Varchar)
- AUTHOR (Varchar)
- TYPE (Varchar)
- TEXT (Varchar)
- INGESTION_DATE (Timestamp_NTZ)
适用场景
机器学习
- 领域特定的LLM微调
- 医学术语演变追踪
- 临床NLP模型开发
- 历史生物医学知识提取
真实世界数据(RWD)
- 历史记录的临床病例、治疗结果和疾病描述
- 记录的手术程序和结果
- 癌症、结核病和传染病的临床观察
- Boylston Prize获奖论文
- 历史患者表现和治疗方案
生命科学商业化
- 追踪100多年间治疗范式的演变
- 理解塑造现代医学的基础研究
- 分析历史临床方法学
- 识别疾病管理和药物开发的长期模式
使用示例
查看元数据文档
sql SELECT TITLE, TEXT FROM NEJM_CORPUS WHERE TYPE = metadata LIMIT 5;
搜索获奖论文
sql SELECT ISSUE, TITLE, AUTHOR FROM NEJM_CORPUS WHERE TYPE = article AND TITLE ILIKE %prize% LIMIT 10;
按类型统计行数
sql SELECT TYPE, COUNT(*) FROM NEJM_CORPUS GROUP BY TYPE;
定价信息
- 许可方式: 需联系获取许可
- 联系方式:
- 销售: hello@devinmediacorp.com
- 支持: hello@devinmediacorp.com
数据特点
- AI训练就绪
- JSONL格式
- 203,123行清洁医学文本
- 1828–1930年连续覆盖
- 包含Boylston Prize获奖论文
- 经过专业OCR处理和清洁
- 来源追踪和偏见审核
- 预1930年且已验证公共领域/版权免费
法律条款
- 条款类型: 标准条款
提供商其他数据集
- Journal of the American Medical Association (JAMA) Dermatology Historical Archive
- JAMA Surgery Dataset 1911 to 1930 Cleaned Structured AI Ready
- JAMA Pediatrics Clinical Dataset (1911–1930)
- JAMA: The Journal of the American Medical Association (1883-1930)
- Johns Hopkins Medical Journal Archive (1890-1926)
- Journal of the American Medical Association (Dermatology) — Complete Archive 1920-1930



