Inventaire des bases de données relatives à la santé
收藏www.data.gouv.fr2023-09-13 更新2025-03-22 收录
下载链接:
https://www.data.gouv.fr/fr/datasets/inventaire-des-bases-de-donnees-relatives-a-la-sante/
下载链接
链接失效反馈官方服务:
资源简介:
Dans le cadre de ses missions, le département Etalab a réalisé un travail de recensement le plus complet possible des bases et jeux de données publiques existantes dans le domaine de la santé, et publie cet inventaire en open data. 172 bases de données de 79 gestionnaires ont été recensés. Pour faciliter la découverte des données, une sélection des principales bases disponibles en format ouvert sur data.gouv.fr est également accessible ici. La liste n'est pas exhaustive et est ouverte aux contributions. Méthodologie Le travail de réalisation de l’inventaire a été fait gestionnaire après gestionnaire, en travaillant en priorité sur les gestionnaires principaux, et ceux pour lesquelles le réalisation d’un entretien était possible. Deux méthodologies différentes ont été suivies selon les gestionnaires : Gestionnaires avec entretien : travail de recherche en chambre en amont de l’entretien, afin de lister l’ensemble des bases concernées, ainsi que l’ensemble des informations manquantes et questions à poser. L’entretien permet ensuite de valider la pertinence de chaque base identifiée, et d'obtenir les informations requises. Gestionnaires sans entretiens (ces gestionnaires sont ceux qui produisent un nombre réduit de jeux de données) : Travail de recherche en chambre uniquement. Des entretiens ont été réalisés avec les gestionnaires suivants : Agence technique de l'information sur l'hospitalisation (ATIH) ; Assistance Publique - Hôpitaux de Paris (AP-HP) ; Agence nationale de sécurité du médicament et des produits de santé (ANSM). Limites Une première limite réside dans la compréhension de l’origine des données de chaque jeu, ainsi de l’entité ou la/les personne(s) propriétaire des données. Cette information a généralement été obtenue à travers les entretiens réalisés. Les bases gérées par les gestionnaires que n'ont pas été contactés ont donc une probabilité d’erreur plus importante pour la partie « origine des données » et « propriétaire des données ». Une autre limite rencontrée réside dans la compréhension de la notion de secret statistique rattaché aux enquêtes couvertes par Loi n° 51-711 du 7 juin 1951 sur l'obligation, la coordination et le secret en matière de statistiques. Les enquêtes concernées par cette loi sont des enquêtes avec informations à caractère personnel et identifiant. Par conséquent, aucune des enquêtes concernées ne sont publiables en l’état. En revanche, ces enquêtes servent en règle générale de base pour la construction d’indicateurs synthétiques et de séries chronologiques qui, eux, sont publiables et publiés. Cette distinction concerne plusieurs enquêtes présentes dans le périmètre de recherche. Ressources Ce jeu de données contient quatre ressources : Une liste des gestionnaires des bases recensées ; Un inventaire des bases de données ; Un inventaire des publications et des études réalisées à partir des bases recensées ; Une liste des thématiques groupées par catégorie. Détails sur les métadonnées Nous détaillons ci-dessous les quelques métadonnées notables Thématique : Nous avons identifié quatre thématiques possibles, afin de réaliser un premier travail de catégorisation au sein même de l’inventaire. Données de santé publique et épidémiologie : données sur les habitudes de vie, les inégalités de santé, l'épidémiologie, etc. Données sur les offres de soins : informations sur les infrastructures, les services proposés, le personnel, les honoraires, etc. Données sur les consommations de soins et dépenses : données sur les activités des établissements de santé, les consultations, les médicaments et dispositifs, etc. Données sur les performances et opérations : informations sur les performances financières, les performances opérationnelles, etc. Typologie : l’inventaire est composé de trois types de données : Les données provenant de documents administratifs Les données provenant d’enquêtes Les données présentant un annuaire Présence sur data.gouv.fr : sur ce champ, nous avons notifié si les bases étaient présentes ou non sur data.gouv.fr. Nous avons également notifié une présence partielle lorsque, par exemple, certains millésimes sont manquants sur data.gouv.fr. Origine des données : dans ce champ, nous nous efforçons d’expliquer de manière synthétique le processus ayant abouti à la production des données, et de mentionner les acteurs impliqués.
在履行其职责的过程中,法国国家数据实验室(Etalab)对健康领域现存的公共数据库和数据集进行了尽可能全面的梳理,并将此清单以开放数据的形式发布。共收录了来自79个管理者的172个数据库。为便于数据的发现,本处亦提供data.gouv.fr上可用的主要开放式数据库的精选。此清单并非详尽无遗,并欢迎各界贡献。在编制清单的过程中,我们逐个管理者进行梳理,优先处理主要管理者,以及可以实施访谈的管理者。针对不同管理者,我们采用了两种不同的方法:对于实施访谈的管理者,我们在访谈前进行室内研究,以列出所有相关数据库以及缺失的信息和需提出的问题。访谈随后用于验证每个识别出的数据库的相关性,并获取所需信息。对于未实施访谈的管理者(这些管理者产生较少的数据集):仅进行室内研究。我们与以下管理者进行了访谈:信息与技术医院技术局(ATIH)、巴黎公立医院集团(AP-HP)和法国国家药品和健康产品安全局(ANSM)。局限性:首先,在理解每个数据集的数据来源以及数据所有者或所有者的实体方面存在一定局限性。此类信息通常通过访谈获得。因此,那些未曾接触到的管理者所管理的数据库在“数据来源”和“数据所有者”部分存在较大的错误概率。另一个局限性在于理解与1951年6月7日第51-711号关于统计义务、协调和保密法的调查相关的统计保密概念。受该法律约束的调查涉及包含个人信息的标识调查。因此,受该法律约束的所有调查均无法公开发布。相反,这些调查通常作为构建综合指标和时序数据的基石,而这些指标和数据集是公开发布的。这一区别涉及了研究范围内的多个调查。资源:此数据集包含四个资源:收录的数据库管理者名单;数据库清单;基于收录数据库进行的出版物和研究清单;按类别分组的主题列表。元数据详细信息:以下详细描述了一些显著元数据。主题:我们识别出四种可能的主题,以便在清单中进行初步分类。公共卫生和流行病学数据:关于生活方式、健康不平等、流行病学等数据。医疗服务提供数据:关于基础设施、提供的服务、人员、费用等数据。医疗服务消费和支出数据:关于医疗机构活动、咨询、药物和设备等数据。性能和运营数据:关于财务绩效、运营绩效等信息。类型:清单由三种类型的数据组成:来自行政文件的数据、来自调查的数据、以及呈现为目录的数据。data.gouv.fr上的存在性:在此字段中,我们标明数据库是否存在于data.gouv.fr上。当例如某些年份缺失于data.gouv.fr时,我们也标明部分存在性。数据来源:在此字段中,我们努力以简洁的方式解释导致数据产生的过程,并提及涉及的参与者。
提供机构:
www.data.gouv.fr



