five

Rx Inspector Public Data Release

收藏
github2026-01-23 更新2026-01-24 收录
下载链接:
https://github.com/propublica/rx-inspector-data
下载链接
链接失效反馈
官方服务:
资源简介:
ProPublica发布的一个前所未有的数据集,将通用药物与其制造工厂联系起来。该数据集通过链接多个FDA数据集创建,允许任何人通过链接国家药物代码(NDC)编号与FDA设施标识符(FEI)来将处方药与其制造工厂联系起来。数据集最后一次更新是在2025年11月。

An unprecedented dataset released by ProPublica that links generic medications to their manufacturing facilities. This dataset was created by linking multiple FDA datasets, enabling anyone to connect prescription drugs with their manufacturing facilities by linking National Drug Code (NDC) numbers and FDA Facility Identifier (FEI). The dataset was last updated in November 2025.
创建时间:
2026-01-23
原始信息汇总

Rx Inspector Public Data Release 数据集概述

数据集基本信息

  • 数据集名称:Rx Inspector Public Data Release
  • 发布机构:ProPublica
  • 数据最后更新日期:2025年11月
  • 数据用途:连接通用药物与其生产工厂,并关联美国食品药品监督管理局(FDA)的工厂检查记录。
  • 数据来源:通过链接多个FDA数据集创建,这些数据此前从未由FDA公开提供。
  • 许可协议:知识共享署名-非商业性使用 4.0 国际许可协议 (CC BY-NC 4.0)。

数据内容与结构

数据集通过链接国家药品代码(NDC)与FDA工厂标识符(FEI),将处方药与其生产工厂关联起来。

数据字典

  • ndc:药品的国家药品代码(NDC),为产品NDC(仅包含前两段)。
  • fei:与该药品关联的工厂的FDA工厂标识符(FEI)。
  • registrant_name:向FDA注册该工厂的公司名称。
  • country:工厂所在国家的ISO 3166-1 alpha-2代码(例如US、IN)。
  • api_mfr:布尔值,若标签商指明该设施仅为药品生产原料药(API),则设为TRUE。
  • linkage_method:ProPublica用于将药品与FDA工厂列表连接的方法。可能值:
    • SPL_DUNS_FEI:使用药品标签中的FEI或邓白氏(DUNS)标识符进行关联。
    • ADDRESS_MATCH:通过地址匹配进行关联。地址来源有两种:
      1. 通过起诉FDA获得的记录中的简化新药申请(ANDA)号查找工厂地址。
      2. 通过模糊文本匹配和地理编码,匹配药品标签文本中印刷的工厂地址。
  • anda:简化新药申请(ANDA)号,用于唯一标识FDA批准的通用药品。
  • bla:生物制品许可申请(BLA)号,用于标识通用生物制品的生产批准。
  • nda:新药申请(NDA)号,用于标识品牌药批准。包含此字段的记录表示该药品为授权仿制药。

数据范围与覆盖

  • 包含的药品:主要关注通用处方药的安全性,包含生物制品(如胰岛素)和授权仿制药。不包括品牌药、非处方药、气体(如氧气罐)及皮内给药途径的药品。
  • 数据局限性:FDA的信息可能不是最新的(例如公司收购或生产地点变更)。

数据应用

  • 支持在Rx Inspector工具之外进行聚合分析和摘要。
  • 研究人员可以分析通用药制造商在标签上提供生产地点和ID的比例。
  • 通过结合其他包含FEI和NDC的数据源,可以跨国或跨药品类别比较制药商。
  • 通过交叉引用FDA的公开检查仪表板,可以分析FDA按国家进行常规生产检查的频率。

相关资源链接

  • Rx Inspector工具:https://projects.propublica.org/rx-inspector/
  • FDA国家药品代码目录:https://www.fda.gov/drugs/drug-approvals-and-databases/national-drug-code-directory
  • FDA当前注册工厂列表:https://www.fda.gov/drugs/drug-approvals-and-databases/drug-establishments-current-registration-site
  • 结构化产品标签(SPL)数据库:https://dailymed.nlm.nih.gov/dailymed/spl-resources.cfm
  • FDA关于NDC的文档:https://www.fda.gov/media/173715/download
  • FDA工厂标识符查询:https://www.accessdata.fda.gov/scripts/cdrh/cfdocs/cfRL/rl.cfm
  • ISO 3166-1 alpha-2代码:https://en.wikipedia.org/wiki/ISO_3166-1_alpha-2
  • FDA授权仿制药列表:https://www.fda.gov/drugs/abbreviated-new-drug-application-anda/fda-list-authorized-generic-drugs
  • ProPublica详细方法说明:https://www.propublica.org/article/rx-inspector-fda-generic-drug-tool-methodology
  • 知识共享许可协议:https://creativecommons.org/licenses/by-nc/4.0/

反馈与联系

如发现信息有误,或作为记者/研究人员希望分享使用情况,请联系:FDA@propublica.org。

搜集汇总
数据集介绍
main_image_url
构建方式
在药品监管透明度日益受到关注的背景下,Rx Inspector公共数据集的构建体现了数据整合的创新路径。该数据集通过链接美国食品药品监督管理局(FDA)的多个独立数据库,包括结构化产品标签数据库、国家药品代码目录以及电子药品注册与上市系统,并融合了通过法律诉讼获取的工厂地址信息与《信息自由法》请求获得的检查报告。构建过程中采用了双重链接方法:一方面直接利用药品标签中的机构标识符进行匹配,另一方面通过模糊文本匹配与地理编码技术实现地址关联,从而将药品与其生产工厂精准对应。
特点
该数据集的核心特点在于首次公开了通用药物与其生产工厂之间的关联信息,填补了FDA数据公开的空白。数据集覆盖了美国市场绝大多数处方通用药物,包含国家药品代码、FDA机构标识符、注册公司名称、生产国别及原料药生产标识等关键字段。特别值得注意的是,数据集通过“链接方法”字段清晰标注了每条记录的关联依据,增强了数据的可追溯性与可信度。此外,数据集排除了品牌药与非处方药,但纳入了授权仿制药,反映了对消费者信息需求的细致考量。
使用方法
研究人员与记者可利用该数据集进行深入的聚合分析与跨源研究。用户可通过匹配国家药品代码与FDA机构标识符,将处方记录关联至具体生产设施,进而结合FDA的公共检查仪表板,分析不同国家或药物类别的生产工厂的检查频率与合规状况。数据集中的链接分类字段便于快速统计药品标签中公开生产信息的比例。使用时应遵循知识共享署名-非商业性使用4.0许可协议,确保非商业用途并注明来源,同时可通过指定邮箱反馈数据不准确之处以促进持续完善。
背景与挑战
背景概述
在药品监管与公共卫生领域,追踪仿制药的生产源头对于确保药品质量与安全至关重要。由非营利新闻机构ProPublica于2025年创建的Rx Inspector公共数据集,首次整合了美国食品药品监督管理局(FDA)多个分散数据库,将国家药品代码(NDC)与FDA机构标识符(FEI)进行关联,从而揭示了仿制药与其生产工厂之间的直接联系。该数据集的核心研究问题聚焦于提升药品供应链透明度,使研究人员、记者及公众能够追溯仿制药的生产地点并查阅相关FDA检查记录,对推动药品监管公开化、增强消费者知情权具有显著影响力。
当前挑战
该数据集致力于解决仿制药生产溯源这一复杂领域问题,面临的主要挑战在于FDA数据本身存在碎片化与更新滞后性,例如企业并购或生产转移可能导致信息不准确。在构建过程中,ProPublica团队需克服多源异构数据的整合难题,包括通过法律诉讼获取部分工厂地址数据,并运用模糊文本匹配与地理编码技术进行地址匹配,同时还需处理品牌药与仿制药的区分、排除非相关药品类别等数据清洗工作,以确保数据集的可靠性与实用性。
常用场景
经典使用场景
在药物监管与公共卫生研究领域,Rx Inspector数据集通过整合美国食品药品监督管理局(FDA)的多源数据,为追踪仿制药的生产源头提供了关键支持。该数据集最经典的使用场景在于,研究人员能够利用其链接的国家药品代码(NDC)与FDA机构标识符(FEI),系统性地分析特定仿制药的生产设施及其监管历史。例如,学者可以借此评估不同制造工厂的质量合规性,或探究药品供应链中的地理分布模式,从而揭示仿制药生产网络的整体结构与潜在风险点。
衍生相关工作
围绕该数据集,已衍生出多项经典研究工作。例如,基于其链接的设施与药品数据,学者开展了关于仿制药生产全球化对质量影响的大规模实证研究;另有工作利用检查记录与地理编码信息,构建了预测工厂合规风险的机器学习模型。这些研究不仅拓展了药物监管科学的分析方法,还催生了开源工具的开发,如自动化数据清洗管道与可视化平台,进一步推动了该领域的数据驱动创新。
数据集最近研究
最新研究方向
在药物监管透明度与公共卫生领域,Rx Inspector数据集通过整合FDA多源异构数据,为追踪仿制药生产链提供了前所未有的可视性。当前研究聚焦于利用该数据集进行跨国制药设施的质量风险评估,结合地理信息系统分析全球供应链中的监管漏洞。热点事件如仿制药安全危机促使学者探索数据驱动的预警模型,通过关联检查记录与药品编码,评估不同国家制造商的合规表现。这些研究不仅推动了监管科学的数据标准化进程,也为公众参与药物安全监督提供了实证基础,深刻影响着全球药品监管政策的演进方向。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作