Données synthétiques - top diabète
收藏www.data.gouv.fr2024-04-26 更新2025-03-21 收录
下载链接:
https://www.data.gouv.fr/en/datasets/donnees-synthetiques-top-diabete/
下载链接
链接失效反馈官方服务:
资源简介:
Description de la base de données : Objectifs et finalités initiales de la base de données : Ce jeu de données synthétiques a été créé dans le cadre de la traduction et l’implémentation de l’algorithme utilisé par la CNAM pour construire le top diabète (lien de la fiche descriptive de l'algorithme). Les versions Python et SAS adaptés par le HDH portent sur des données synthétiques pour les années 2018-2019 mais peuvent être étendues à d’autres années. Le programme source de la CNAM a été développé en SAS et tourne sur les données des années 2015 à 2019. L’algorithme évoqué ci-dessus a pour objectif de cibler les personnes prises en charge pour un diabète dans la base principale du SNDS afin de créer le « Top Diabète » de la cartographie des pathologies créée et maintenue par la CNAM (version G8). Contexte de création : La mise en œuvre de l'algorithme top diabète a nécessité la mobilisation des tables et variables synthétiques (fictives). Public cible : Communauté data/SNDS. Résultats associés à la création de la base : L'algorithme utilisé par la CNAM pour construire le top diabète : version source (CNAM), version Python et version SAS (HDH). Présentation des données : Méthodologie de collecte et critères d’inclusion : Ce jeu de données a été généré en utilisant le schéma des tables de la base principale du SNDS de l’année 2019. Les programmes fonctionnent sur les données synthétiques du HDH avec quelques adaptations : -la fusion de tables annuelles en une table unique pour ER_PRS_F, ER_ETE_F, ER_PHA_F, -le renommage de NUM_ENQ en BEN_NIR_PSA, -la conversion du format des dates en yymmdd10. L’identification des patients repose sur le ciblage de médicaments spécifiques et/ou une ALD et/ou une hospitalisation en MCO. Les algorithmes de la cartographie visent à maximiser la spécificité (et non la sensibilité), c'est-à-dire à s'assurer de l'absence de non-diabétiques parmi les patients ciblés. Les patients ayant moins de 3 délivrances de médicaments spécifiques, n'ayant pas l'ALD et n'ayant pas été hospitalisés dans les 5 ans pour le diabète ne sont pas retenus. Choix des variables : La mise en œuvre de l'algorithme nécessite la mobilisation des tables et variables suivantes (l'historique requis est indiqué dans la case correspondante) : Les programmes adaptés en SAS et Python tournent sur des données synthétiques des années 2018 et 2019. Le code source de la CNAM (en SAS) a été conçu pour fonctionner sur les données des années de 2015 à 2019. Limites de ce jeu de données : L'utilisation de données synthétiques, bien qu'utiles pour manipuler les données du SNDS, revêt des limites : l'absence de cohérence médicale, l'absence de mise à jour des évolutions annuelles, un schéma de tables évolutif qui peut être incomplet et imparfait. Ce programme n'inclut pas l'analyse de l’estimation des postes des dépenses remboursées par l'Assurance Maladie. L'algorithme repère les patients prévalents atteints de diabète sur une année donnée (2019). Il ne permet pas de déterminer la date exacte d'apparition du diabète dans la base. Instructions/pré-requis d’utilisation de la base : Plus d’informations sur l’utilisation de la base de données dans le cadre des programmes top diabète (CNAM) sur le dépôt GitLab des programmes (lien du dépôt GitLab). Support : Point de contact : dir.donnees-SNDS@health-data-hub.fr Contribution : Sur Gitlab (faire un ticket ou une merge-request)
数据集描述:本数据库旨在构建并实施由法国国家社会保障医疗管理局(CNAM)所采用的糖尿病分类算法,以构建并维护由CNAM创建和更新的糖尿病病患图谱(版本G8)。数据集的初始目标和目的是:此套合成数据集的创建是在对CNAM糖尿病分类算法进行翻译和实施的过程中产生的。HDH对Python和SAS版本的调整侧重于2018-2019年的合成数据,但可扩展至其他年份。CNAM的源代码是用SAS编写的,运行于2015至2019年的数据上。所述的算法旨在从SNDS主数据库中定位接受糖尿病治疗的个体,以构建“糖尿病病患图谱”。创建背景:实施糖尿病分类算法需要动员合成表和变量(虚构的)。目标受众:数据/SNDS社区。与创建数据库相关的结果:CNAM所采用的糖尿病分类算法:源代码版本(CNAM)、Python版本和SAS版本(HDH)。数据集的展示:数据收集的方法论和纳入标准:本数据集是基于2019年SNDS主数据库的表格结构生成的。程序在HDH的合成数据上运行,并进行了以下调整:将年度表融合为单一表ER_PRS_F、ER_ETE_F、ER_PHA_F,将NUM_ENQ重命名为BEN_NIR_PSA,将日期格式转换为yymmdd10。患者识别基于特定药物的使用、ALD或MCO中的住院。映射算法旨在最大化特异性(而非敏感性),即确保目标患者中不存在非糖尿病个体。具有少于3次特定药物配方的患者、无ALD且在过去5年内未因糖尿病住院的患者被排除在外。变量选择:算法的实施需要以下表和变量的支持(历史需求在相应栏中标注):经过调整的SAS和Python程序在2018年和2019年的合成数据上运行。CNAM的源代码(SAS)旨在在2015至2019年的数据上运行。数据集的限制:尽管合成数据的运用对于处理SNDS数据有益,但仍存在局限性:缺乏医学一致性、年度变化的缺失、可能不完整或不完美的表格结构。本程序不包括由医疗保险报销的支出估算分析。算法识别了在特定年份(2019年)内存在的糖尿病现患患者,但无法确定糖尿病在数据库中的确切出现日期。使用数据库的说明/先决条件:有关在CNAM糖尿病分类算法(GitLab程序库)中使用本数据库的更多信息(GitLab程序库的链接)。支持:联系方式:dir.donnees-SNDS@health-data-hub.fr。贡献:在Gitlab上(提交ticket或merge-request)。
提供机构:
www.data.gouv.fr



