five

Historical Ophthalmology Full Dataset (JAMA, 1870s–1890s)

收藏
Snowflake2026-03-26 更新2026-03-27 收录
下载链接:
https://app.snowflake.com/marketplace/listing/GZSXZGPW3Q8R
下载链接
链接失效反馈
官方服务:
资源简介:
This dataset contains a structured collection of historical ophthalmology publications derived from JAMA archives, spanning the late 19th century. The data has been cleaned, standardized, and formatted into JSONL for direct use in AI model training, research, and historical analysis. **What this data does for your model:** - Your model learns authentic late 19th‑century ophthalmology from the first American journal dedicated to eye medicine, founded in 1869 by Hermann Knapp . - Your model retrieves original research on eye surgery, vision disorders, ophthalmic pathology, and the early use of the ophthalmoscope . - Your model trains on the language of 19th‑century clinical examination, surgical techniques, and the evolution of eye care from the Civil War era through the Roaring Twenties . - Your model understands the formative debates in American ophthalmology, including the transition from general surgery to a distinct medical specialty Each record includes: - Issue (volume + number) - Article title - Author (where available) - Full cleaned text - Provenance and licensing markers The dataset is fully queryable and optimized for filtering by time period, authorship, and content structure. **Key Features:** - Structured JSONL format - Cleaned and normalized text - Historical medical corpus (ophthalmology focus) - Query-ready (tested in Snowflake) - Suitable for:LLM trainingMedical NLPHistorical researchData enrichment pipelines
提供机构:
Devin Media Corp.
创建时间:
2026-03-25
原始信息汇总

Historical Ophthalmology Full Dataset (JAMA, 1870s–1890s)

数据集概述

该数据集包含一个结构化的历史眼科学出版物集合,源自JAMA档案,时间跨度为19世纪末。数据经过清洗、标准化,并格式化为JSONL,可直接用于AI模型训练、研究和历史分析。

关键特征

  • 结构化JSONL格式
  • 已清洗和规范化的文本
  • 历史医学语料库(眼科学重点)
  • 查询就绪(已在Snowflake中测试)
  • 适用于:LLM训练、医学NLP、历史研究、数据丰富管道

数据内容

每条记录包含:

  • 期号(卷号+编号)
  • 文章标题
  • 作者(如可用)
  • 完整的清洗后文本
  • 来源和许可标记

数据集完全可查询,并针对按时间段、作者和内容结构进行过滤进行了优化。

业务需求

训练特定领域的医学AI模型

利用历史眼科学文献的精选语料库训练高度专业化的AI模型。该数据集提供结构化、经过偏见审核的医学内容,可提高模型准确性,减少幻觉,并增强临床和研究应用中的领域专业知识。

增强RAG系统

将高质量、来源可溯的医学文本集成到RAG管道中,以提供更准确和可解释的输出。适用于需要可信源材料进行问答、摘要和临床洞察生成的医疗保健AI系统。

支持学术和机构研究

访问一个罕见的、结构化的眼科学出版物档案,用于学术研究、历史分析和数据集基准测试。该收藏支持对医学演变的深入探索,同时为可重复的AI和数据科学研究提供可靠的基础。

数据字典

表名:OPHTHALMOLOGY_FULL

列:

  • ISSUE (Varchar)
  • TITLE (Varchar)
  • AUTHOR (Varchar)
  • TYPE (Varchar)
  • TEXT (Varchar)

使用示例

检索清洗后的眼科学文章(1880年代)

sql SELECT issue, title, author FROM PUBLIC.OPHTHALMOLOGY_FULL WHERE issue LIKE 188% AND title NOT LIKE ===% AND author != Unknown LIMIT 25;

识别数据集中最频繁出现的作者

sql SELECT author, COUNT(*) AS article_count FROM PUBLIC.OPHTHALMOLOGY_FULL WHERE author != Unknown GROUP BY author ORDER BY article_count DESC LIMIT 20;

分析随时间变化的文章数量

sql SELECT SUBSTRING(issue, 1, 4) AS year, COUNT(*) AS article_count FROM PUBLIC.OPHTHALMOLOGY_FULL GROUP BY year ORDER BY year;

定价

眼科历史数据集访问企业咨询

提供商其他数据集

  • Journal of the American Medical Association (JAMA) Dermatology Historical Archive
  • JAMA Surgery Dataset 1911 to 1930 Cleaned Structured AI Ready
  • JAMA Pediatrics Clinical Dataset (1911–1930)
  • Journal of the American Medical Association (Dermatology) — Complete Archive 1920-1930
  • Journal of the American Podiatric Medical Association 1907-1930 Dataset

技术详情

  • 类别:AI & ML
  • 刷新频率:每年
  • 地理覆盖范围:全球
  • 云区域可用性(AWS):EU (Frankfurt)、EU (Ireland)、EU (London)、EU (Paris) 等
  • 法律条款:标准

提供商信息

  • 提供商:Devin Media Corp.
  • 销售联系:hello@devinmediacorp.com
  • 支持联系:hello@devinmediacorp.com
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作