five

New York Journal of Medicine Archive (1843-1860)

收藏
Snowflake2026-04-02 更新2026-04-03 收录
下载链接:
https://app.snowflake.com/marketplace/listing/GZSXZGPW3RA8
下载链接
链接失效反馈
官方服务:
资源简介:
Complete archive of the New York Journal of Medicine from 1843-1860, converted from historical content to AI training ready data. **What this data does for your model:** - Your model learns authentic mid‑19th‑century American medical practice from a leading New York‑based medical journal, predating the Civil War. - Your model retrieves original clinical case studies, surgical reports, and medical observations from one of America's earliest medical periodicals. - Your model trains on the language of pre‑modern therapeutics, including bleeding, blistering, calomel, and opium, as they were actually prescribed. - Your model understands the professionalization of American medicine at a time when the country was still establishing its medical institutions. Contains 11,105 rows of clean, historically significant medical text documenting early American medical practice, including studies on opium, smallpox vaccination, typhus, yellow fever, and surgical innovations. Fully processed, bias-audited, and ready for AI training.
提供机构:
Devin Media Corp.
创建时间:
2026-04-01
原始信息汇总

New York Journal of Medicine Archive (1843-1860) 数据集概述

数据集基本信息

  • 数据集名称: New York Journal of Medicine Archive (1843-1860)
  • 数据提供方: Devin Media Corp.
  • 数据集描述: 1843年至1860年《纽约医学杂志》的完整档案,已从历史内容转换为AI训练就绪数据。包含11,105行清洁、具有历史意义的医学文本,记录了早期美国医学实践,包括关于鸦片、天花疫苗接种、斑疹伤寒、黄热病和外科创新的研究。经过完全处理、偏见审核,可用于AI训练。
  • 数据刷新频率: 每年
  • 地理覆盖范围: 全球
  • 云区域可用性: 支持AWS的多个区域,包括亚太(雅加达)、亚太(孟买)、亚太(大阪)、亚太(首尔)等。

数据字典

表名: NY_JOURNAL_CORPUS

列结构:

  • ISSUE: Varchar
  • TITLE: Varchar
  • AUTHOR: Varchar
  • TYPE: Varchar
  • TEXT: Varchar
  • INGESTION_DATE: Timestamp_NTZ

数据预览示例:

  • ISSUE: 1857-Vol._2_No._2
  • TITLE: On admission skin hot pg in the hypogastrium very
  • AUTHOR: Unknown
  • TYPE: article
  • TEXT: On admission skin hot pg in the hypogastrium very Unilocular Ovarian Peritonitis—Death.—I been sent to him by a dis developed in the peritone
  • INGESTION_DATE: null

特殊记录:

  • TYPE 包含 metadata 类型,用于存储偏见审核元数据。
  • 偏见审核元数据: 包含来自伦理AI基金会(Foundation for Ethical AI)的审核声明,指出文本可能包含反映其时代种族、性别、文化和社会偏见的语言和术语。该语言不代表当代标准、价值观或医学理解。AI训练指导:在此语料库上训练的模型应将任何历史偏见语言视为有记载的历史背景,而不是当前规范、公认术语或认可的观点。

业务需求与应用场景

机器学习

  • 使用1843-1844年的高质量历史医学文本数据训练、微调和部署机器学习模型。
  • 该语料库提供11,000多行精选医学文献,记录早期美国医学,适用于:
    • 领域特定的大型语言模型(LLM)微调
    • 医学术语演变追踪
    • 临床自然语言处理(NLP)模型开发
    • 历史生物医学知识提取

真实世界数据

  • 利用历史记录的临床病例、治疗结果和疾病描述作为真实世界数据进行研究和分析。
  • 该档案包含:
    • 早期美国医生的原始病例研究
    • 19世纪40年代记录的外科手术程序和结果
    • 包括天花、斑疹伤寒、伤寒热和黄热病在内的疾病的临床观察
    • 早期疫苗接种记录和结果
    • 内战前的流行病学数据

生命科学商业化

  • 用记录早期美国治疗方法的精选历史医学文献支持生命科学研究和开发。
  • 该数据集支持:
    • 追踪美国内战前治疗范式的演变
    • 理解影响后来医学进步的基础研究
    • 分析传染病管理的历史方法
    • 在美国医学形成时代的主要医学文献来源上训练模型

使用示例

查看元数据文档

sql SELECT TITLE, TEXT FROM PUBLIC.NY_JOURNAL_CORPUS WHERE TYPE = metadata LIMIT 5;

按医学主题搜索文章

sql SELECT TITLE, AUTHOR, ISSUE FROM PUBLIC.NY_JOURNAL_CORPUS WHERE TYPE = article AND TEXT ILIKE %smallpox% OR TEXT ILIKE %vaccination% LIMIT 10;

按类型统计文章数量

sql SELECT TYPE, COUNT(*) FROM PUBLIC.NY_JOURNAL_CORPUS GROUP BY TYPE;

定价

  • 产品名称: New York Journal of Medicine Enterprise Archive
  • 标语: Train your model on the foundation of medical knowledge

数据提供方其他数据集

  • Journal of the American Medical Association (JAMA) Dermatology Historical Archive
  • JAMA Surgery Dataset 1911 to 1930 Cleaned Structured AI Ready
  • JAMA Pediatrics Clinical Dataset (1911–1930)
  • Johns Hopkins Medical Journal Archive (1890-1926)
  • Journal of the American Medical Association (Dermatology) — Complete Archive 1920-1930
  • Brain: A Journal of Neurology Historical Dataset for AI Training and Research

类别

  • AI & ML
  • Life Sciences Commercialization
  • Machine Learning
  • Real World Data (RWD)

联系信息

  • 销售: hello@devinmediacorp.com
  • 支持: hello@devinmediacorp.com

法律条款

  • 条款类型: Standard

关于数据提供方

Devin Media Corp. 专门提供用于AI训练的高级历史数据。我们提供全面的、来源可追溯的、经过偏见审核的、1930年以前的出版物和档案,经过专业清洁和结构化,适用于机器学习应用。我们的数据集涵盖医学、金融、时尚、法律和文化领域,包括一些社会最负盛名和标志性的出版物,如《美国医学会杂志》(JAMA)、《时代》杂志、《公告牌》杂志、《Vogue》、《House & Garden》和《纽约邮报》。每个数据集都具备以下特点:

  • 1930年以前,并验证为公共领域/无版权
  • 经过专业OCR处理和深度清洁
  • 来源可追溯且经过偏见审核
  • 格式化为JSONL,便于AI使用
  • 通过安全API交付(无文件下载) 我们创建了AI训练的伦理历史基础设施。
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作