five

JAMA: The Journal of the American Medical Association (1883-1930)

收藏
Snowflake2026-04-06 更新2026-04-07 收录
下载链接:
https://app.snowflake.com/marketplace/listing/GZSXZGPW3S41
下载链接
链接失效反馈
官方服务:
资源简介:
Complete pre-1930 archive of the Journal of the American Medical Association. **1,007,047 rows** of clean, structured medical text spanning 48 years of medical history, from the acceptance of germ theory to the eve of the antibiotic era. **What this data does for your model:**<br/>Reduces clinical hallucination by grounding your model in 1.2 million rows of peer‑reviewed medical literature from one of the world's most trusted journals. Your model will learn real diagnostic reasoning, surgical techniques, and treatment outcomes from original case studies and clinical lectures. - *When asked about historical pneumonia treatments, the model will cite specific 1910 JAMA articles describing mercury and quinine protocols, including dosages and mortality data.* - *Trains the model on authentic medical terminology evolution, reducing anachronistic errors (e.g., knowing that "consumption" meant tuberculosis).* - *Improves the model's ability to follow ethical reasoning in medical contexts, as JAMA has debated clinical ethics since its founding.* **Includes:** Complete issues from 1883 through 1930, **fully cleaned, with provenance tracking, bias-audited, and ready for AI training**. Features original research, clinical case studies, surgical innovations, pandemic documentation (including the 1918 Spanish flu), and medical debates that shaped modern medicine. **Perfect for:** LLM fine-tuning, medical NLP, historical research, and clinical knowledge extraction. **Format:** Snowflake-native JSONL with columns: ISSUE, TITLE, AUTHOR, TYPE, TEXT. <p><br/></p>
提供机构:
Devin Media Corp.
创建时间:
2026-04-05
原始信息汇总

JAMA: The Journal of the American Medical Association (1883-1930) 数据集概述

数据集基本信息

  • 数据集名称: JAMA: The Journal of the American Medical Association (1883-1930)
  • 提供方: Devin Media Corp.
  • 描述: 现代医学诞生期的权威数字档案,为AI训练而结构化。包含1883年至1930年完整的《美国医学会杂志》预存档。
  • 数据量: 1,007,047 行
  • 时间跨度: 48年(1883-1930年)
  • 内容概述: 涵盖从细菌理论被接受到抗生素时代前夕的医学史,包含原始研究、临床病例研究、外科创新、大流行记录(包括1918年西班牙流感)以及塑造现代医学的医学辩论。
  • 数据状态: 完全清洗、具有来源追踪、经过偏见审核、可用于AI训练。

数据结构与格式

  • 数据格式: Snowflake原生JSONL
  • 数据表名称: JAMA_CORPUS
  • 包含列:
    • ISSUE (Varchar)
    • TITLE (Varchar)
    • AUTHOR (Varchar)
    • TYPE (Varchar)
    • TEXT (Varchar)
    • INGESTION_DATE (Timestamp_NTZ)

主要应用场景

机器学习

  • 在超过100万行经过整理的JAMA历史医学文本上训练、微调和部署机器学习模型。
  • 适用于:领域特定的LLM微调、医学术语提取和演变跟踪、临床NLP模型开发、历史生物医学知识图谱。

真实世界数据

  • 利用历史记录的临床病例、治疗结果和疾病描述作为真实世界数据进行研究和分析。
  • 包含:1883-1930年的原始病例研究、记录的手术程序和结果、对结核病、糖尿病、流感、心血管疾病等疾病的临床观察、1918年西班牙流感的第一手大流行记录、历史患者表现和治疗方案。

生命科学商业化

  • 支持生命科学研究和开发,提供记录治疗方法发现和早期应用的整理历史医学文献。
  • 支持:追踪五十年间治疗范式的演变、理解导致现代疗法的基础研究、分析历史临床试验方法学、识别疾病管理和药物开发的长期模式。

使用示例

  1. 查看元数据文档 sql SELECT TITLE, TEXT FROM JAMA_CORPUS WHERE TYPE = metadata LIMIT 5;

  2. 按年份搜索文章(1918年西班牙流感) sql SELECT ISSUE, TITLE, AUTHOR FROM JAMA_CORPUS WHERE TYPE = article AND ISSUE LIKE 1918% LIMIT 10;

  3. 按类型统计行数 sql SELECT TYPE, COUNT(*) FROM JAMA_CORPUS GROUP BY TYPE;

数据获取与支持

  • 定价方案: "The JAMA Century Collection - 1 Million Rows of Medical History"
  • 数据更新频率: 每年
  • 地理覆盖范围: 全球
  • 云区域可用性: 支持AWS多个区域,包括亚太(雅加达)、亚太(孟买)、亚太(大阪)、亚太(首尔)等。
  • 法律条款: 标准条款
  • 联系信息:
    • 销售: hello@devinmediacorp.com
    • 支持: hello@devinmediacorp.com

提供方其他相关数据集

  • Journal of the American Medical Association (JAMA) Dermatology Historical Archive
  • JAMA Surgery Dataset 1911 to 1930 Cleaned Structured AI Ready
  • JAMA Pediatrics Clinical Dataset (1911–1930)
  • Johns Hopkins Medical Journal Archive (1890-1926)
  • Journal of the American Medical Association (Dermatology) — Complete Archive 1920-1930
  • Brain: A Journal of Neurology Historical Dataset for AI Training and Research

数据集分类

  • AI & ML
  • Life Sciences Commercialization
  • Machine Learning
  • Real World Data (RWD)
二维码
社区交流群
二维码
科研交流群
商业服务