Historical Ophthalmology Full Dataset (JAMA, 1870s–1890s)
收藏Historical Ophthalmology Full Dataset (JAMA, 1870s–1890s)
数据集概述
该数据集包含一个结构化的历史眼科学出版物集合,源自JAMA档案,时间跨度为19世纪末。数据经过清洗、标准化,并格式化为JSONL,可直接用于AI模型训练、研究和历史分析。
关键特征
- 结构化JSONL格式
- 已清洗和规范化的文本
- 历史医学语料库(眼科学重点)
- 查询就绪(已在Snowflake中测试)
- 适用于:LLM训练、医学NLP、历史研究、数据丰富管道
数据内容
每条记录包含:
- 期号(卷号+编号)
- 文章标题
- 作者(如可用)
- 完整的清洗后文本
- 来源和许可标记
数据集完全可查询,并针对按时间段、作者和内容结构进行过滤进行了优化。
业务需求
训练特定领域的医学AI模型
利用历史眼科学文献的精选语料库训练高度专业化的AI模型。该数据集提供结构化、经过偏见审核的医学内容,可提高模型准确性,减少幻觉,并增强临床和研究应用中的领域专业知识。
增强RAG系统
将高质量、来源可溯的医学文本集成到RAG管道中,以提供更准确和可解释的输出。适用于需要可信源材料进行问答、摘要和临床洞察生成的医疗保健AI系统。
支持学术和机构研究
访问一个罕见的、结构化的眼科学出版物档案,用于学术研究、历史分析和数据集基准测试。该收藏支持对医学演变的深入探索,同时为可重复的AI和数据科学研究提供可靠的基础。
数据字典
表名:OPHTHALMOLOGY_FULL
列:
ISSUE(Varchar)TITLE(Varchar)AUTHOR(Varchar)TYPE(Varchar)TEXT(Varchar)
使用示例
检索清洗后的眼科学文章(1880年代)
sql SELECT issue, title, author FROM PUBLIC.OPHTHALMOLOGY_FULL WHERE issue LIKE 188% AND title NOT LIKE ===% AND author != Unknown LIMIT 25;
识别数据集中最频繁出现的作者
sql SELECT author, COUNT(*) AS article_count FROM PUBLIC.OPHTHALMOLOGY_FULL WHERE author != Unknown GROUP BY author ORDER BY article_count DESC LIMIT 20;
分析随时间变化的文章数量
sql SELECT SUBSTRING(issue, 1, 4) AS year, COUNT(*) AS article_count FROM PUBLIC.OPHTHALMOLOGY_FULL GROUP BY year ORDER BY year;
定价
眼科历史数据集访问企业咨询
提供商其他数据集
- Journal of the American Medical Association (JAMA) Dermatology Historical Archive
- JAMA Surgery Dataset 1911 to 1930 Cleaned Structured AI Ready
- JAMA Pediatrics Clinical Dataset (1911–1930)
- Journal of the American Medical Association (Dermatology) — Complete Archive 1920-1930
- Journal of the American Podiatric Medical Association 1907-1930 Dataset
技术详情
- 类别:AI & ML
- 刷新频率:每年
- 地理覆盖范围:全球
- 云区域可用性(AWS):EU (Frankfurt)、EU (Ireland)、EU (London)、EU (Paris) 等
- 法律条款:标准
提供商信息
- 提供商:Devin Media Corp.
- 销售联系:hello@devinmediacorp.com
- 支持联系:hello@devinmediacorp.com



