Fiches fictives de Réunion de Concertation Pluridisciplinaire (RCP)
收藏www.data.gouv.fr2022-06-23 更新2025-01-22 收录
下载链接:
https://www.data.gouv.fr/fr/datasets/fiches-fictives-de-reunion-de-concertation-pluridisciplinaire-rcp/
下载链接
链接失效反馈官方服务:
资源简介:
Ce jeu d'exercice comporte des fiches fictives de traçabilité de Réunions de Concertation Pluridisciplinaire (RCP) de cancers du sein dans un document CSV mais aussi dans des CDA (XML) du cadre national d'interopérabilité dans le cadre du Défi iDoc Santé organisé par la Haute Autorité de Santé et l'INCa. Motivations pour la création du jeu de données Pourquoi le jeu de données a-t-il été initialement créé ? Ces fiches tracent les décisions des professionnels de santé de différentes disciplines (médecin cancérologue, chirurgien, radiothérapeute, chimiothérapeute, …) au cours d'une réunion dédiée nommée Réunion de Concertation Pluridisciplinaire (RCP). Ce document sert ensuite de support de coordination des soins entre différents professionnels de santé. L'objectif de ces fiches est d'assurer la qualité des soins, par le recueil d'un socle minimal d'informations nécessaire à la décision. Ce jeu de données a été créé pour le défi 1C du Défi iDoc Santé, qui vise à identifier automatiquement les recommandations de bonnes pratiques pertinentes dans les situations cliniques décrites dans ces RCP. Pour quelles autres tâches le jeu de données pourrait-il être utilisé ? Dans un contexte général, les fiches de RCP pourraient être utilisées pour effectuer des recherches, études ou évaluations sur la qualité des soins et les pratiques des professionnels mais ce n'est pas le cas pour les données présentées ici. Ces données n'ont pas non plus été testées pour leur interopérabilité et il n'est pas conseillé de les utiliser pour tester ou modéliser un processus d'interopérabilité. De plus, le format CDA utilisé n'est pas le plus récent pour ce type de document. Quelles sont les utilisations trompeuses du jeu de données ? RAS Qui a financé ou soutenu la création du jeu de données ? La HAS et l'INCa sont à l'origine de la rédaction de ces fiches RCP pour des patients fictifs, qui s'inspirent de véritables fiches issues de RCP qui ont été initialement préparées par le réseau régional de cancérologie de Nouvelle-Aquitaine. Les fiches réelles ont servi d'inspiration pour inventer des situations emblématiques dans le même cadre pour la pathologie principale, les pathologies et antécédents associés et les traitements proposés. Deux professionnels de santé ont rédigé à titre gracieux les fiches RCP inventées : Philippe Rochigneux, chef de clinique en oncologie médicale à l'Institut Paoli Calmettes, et Marguerite Tyran, radiothérapeute à l'Institut Paoli Calmettes. Ils ont été supervisés par Mathieu Morey de la coopérative Datactivist. Les fiches ont été mises en cohérence et ensuite utilisées pour resynthétiser des document CDA par Pierre Liot, HAS. Composition du jeu de données Que contient le jeu de données principalement ? Les principales informations de ces données sont des informations médicales et des décisions de traitement. Dispose-t-on d'un schéma décrivant les variables du jeu de données ? Les fiches RCP suivent le standard Clinical Document Architecture (CDA). Ce jeu de données contient des fiches suivant la version 2.0.0 du Volet Fiche de Réunion de Concertation Pluridisciplinaire (FRCP) du Cadre d'Interopérabilité des Systèmes d'Information de Santé (CI-SIS), publiée en novembre 2015 par l'Agence du Numérique en Santé. Les documentations fonctionnelles et techniques sont disponibles en ressources pdf sur cette page. Que contient chaque champ du jeu de données ? Se référer à la documentation pdf. Les valeurs des colonnes TNM suivent la 8e édition de la classification TNM pour le cancer du sein. Est-ce que le contenu du jeu de données dépend de ressources externes ? Oui pour certaines sémantiques et pour certains attributs mais par construction, les documents au standard CDA sont autoporteurs du point de vue du contenu médical. De quelles garanties dispose-t-on concernant la pérennité de ces ressources ? Le contenu médical ne dépend pas de sources externes. Processus de collecte des données Comment les données ont été collectées (avec des capteurs, manuellement par des outils informatiques…) ? Les données des fiches RCP d'origine, servant d'inspiration, ont été saisies manuellement dans des outils informatiques dédiés. Les données des fiches RCP inventées ont été saisies manuellement dans un tableur. Elles ont ensuite été réinsérées, par un script, dans une trame XML pour mimer des documents CDA de même nature. Qui a assuré le processus de collecte de données (des agents, des bénévoles, des étudiants…) ? Les fiches initiales ont été saisies par des professionnels de santé en Nouvelle-Aquitaine pour tracer des RCP. Les fiches RCP inventées ont été saisies par des professionnels de santé dans des outils bureautiques. Le script de réinsertion XML a été écrit par un professionnel de santé. Quelle a été la période de collecte des données ? De janvier à mai 2022. Les données ont-elles été collectées directement ou inférées à partir d'autres données ? Les données ont été collectées directement. Les données ont-elles été collectées sur un échantillon ? Selon quelles méthodes ? Ces données représentent un échantillon très restreint, défini heuristiquement par des professionnels de santé pour illustrer une variété de situations cliniques. Quelles sont les erreurs connues, les limites, les sources de bruit ou de redondances associées à ces données ? Ces données suivent la version du référentiel de 2015 du Volet Fiche de Réunion de Concertation Pluridisciplinaire (FRCP). La version 2021.01, publiée en novembre 2021, offre plus de détails et plus de latitude pour décrire finement le type de cancer, via certaines classifications. À noter par ailleurs que les fiches RCP ne reprennent pas la totalité de l'histoire des patientes. Elles ne reprennent que les informations utiles à la prise de décision. Pré-traitement des données Comment les données ont-elles nettoyées ou préparées ? Les données des fiches RCP utilisées pour l'inspiration avaient été pseudonymisées manuellement. Notamment, les noms, prénoms, identifiants ont été supprimés ou complètement remplacés. La date de naissance a été tronquée à l'année, puis floutée à quelques années près. Les dates d'information cliniques et de RCP ont été ramenées et tronquées à 2022. Les lieux ont été placés à l'échelle de la région. Ces fiches réelles pseudonymisées ont ensuite servi d'inspiration pour inventer des situations emblématiques dans le même cadre pour la pathologie principale, les pathologies et antécédents associés et les traitements proposés. Les données présentées dans les fiches RCP publiées sont donc inventées et ne sont donc pas en relation avec des patientes réelles. Les données « brutes » ont-elles été conservées ? Sont-elles diffusées ? Les données sources, des fiches RCP ayant servi d'inspiration, ne sont pas diffusées. L'outil de prétraitement des données est-il disponible ? À décider pour la partie automatique. Sous forme CSV le jeu de données comporte les colonnes : DDN : date de naissance DateRCP : date de la Réunion de Concertation Pluridisciplinaire (RCP) DatePrelevement : date de prélèvement NaturePrelevement : acte source du prélèvement ResiduTumoralApresChirurgie : éventuel résidu après chirurgie T, N et M : classification de l'étendue du cancer selon les axes TNM (https://www.e-cancer.fr/Dictionnaire/C/classification-TNM ) Histologie : type histologique du cancer MotifRCP : raison de la discussion du cas en RCP ATCD : antécédents médicaux, histoire médicale en dehors de la maladie cancéreuse HDM : histoire de la maladie cancéreuse Question : question(s) posée(s) lors de la RCP OMS : classification OMS Decouverte : modalité de découverte PhaseMaladie : phase de la maladie DPD : activité enzymatique de la DihydroPyrimidine Déshydrogénase, dont le déficit est susceptible d'accroitre la toxicité de certaines chimiothérapie (https://www.has-sante.fr/jcms/c\_2966449/fr/cancer-recherche-d-un-deficit-en-enzyme-dihydropyrimidine-deshydrogenase-dpd-avant-chimiotherapie) TypeTT : type du principal traitement proposé DetailTT : traitement proposé en langue naturelle PhaseTT : niveau de réalisation du traitement principal proposé TypeTT2 : éventuel type du traitement proposé secondaire TypeTT3 : éventuel type d'un autre traitement proposé Diffusion du jeu de données Les données sont-elles diffusées en ligne ? Selon quelles modalités (sur un portail open data, un site web, une API…) ? Oui, sur cette page data.gouv.fr. Selon quelle licence les données sont-elles diffusées ? License Ouverte version 2.0 Des redevances ou des restrictions sont-elles appliquées dans l'accès aux données ? Non. Maintenance du jeu de données Qui assure la maintenance du jeu de données ? Comment peut-on contacter cette personne ? Quel est le service responsable du jeu de données ? Ce jeu de données n'est pas maintenu. La publication est réalisée par l'Institut national du cancer. Est-ce que les rôles sont distincts entre la production des données, leur éditorialisation et leur diffusion ? Oui. L'anonymisation des données des fiches RCP d'inspiration a été réalisée par le réseau régional de cancérologie et la mission Data de la HAS. La production des données des fiches RCP inventées a été réalisée par des professionnels de santé, à titre gracieux, pour la mission Data de la HAS. La diffusion est assurée par la mission data de la HAS. Le jeu de données sera-t-il mis à jour ? Si oui, à quelle fréquence ? Non Si les données deviennent obsolètes, comment cette information sera-t-elle communiquée ? Sur cette page. Est-il possible de contribuer à l'amélioration des données ? Selon quelles modalités ? Non Considérations légales et éthiques Si le jeu de données concerne des individus, ont-ils exprimé leur consentement de manière claire ? Les fiches RCP inventées ne concernent plus des individus. Le jeu de données peut-il exposer de manière directe ou indirecte des individus ? Non. Les données publiées correspondent à des fiches RCP inventées, s'inspirant d'un petit nombre de fiches RCP anonymisées automatiquement puis manuellement. Ces données sont-elles conformes au RGPD ? Oui Les données peuvent-elles avantager ou désavantager des groupes sociaux ? Non. Le jeu de données contient-il des informations pouvant être considérées comme inappropriées ou offensantes ? Non.
本练习集包含虚构的多学科乳腺癌讨论会(RCP)的可追溯性记录,这些记录以CSV格式呈现,同时也以国家互操作性框架中的CDA(XML)格式呈现,作为由高等卫生署和法国癌症研究所(INCa)组织的iDoc健康挑战的一部分。创建数据集的动机:为何最初创建此数据集?这些记录追踪了不同学科(如肿瘤科医生、外科医生、放射治疗师、化疗师等)专业人员在名为多学科讨论会(RCP)的专门会议中的决策。该文件随后作为不同专业人员在护理协调中的支持文件。这些记录的目标是通过收集必要的信息基础以确保决策质量。此数据集是为iDoc健康挑战的第1C挑战而创建,旨在自动识别描述在这些RCP中所描述的临床情况下的相关良好实践推荐。数据集可用于哪些其他任务?在一般背景下,RCP记录可用于进行护理质量和专业人员实践的研究、评估,但在此处展示的数据中并不适用。这些数据也没有被测试用于互操作性测试或建模。此外,所使用的CDA格式不是此类文档的最新格式。数据集的误用有哪些?资源分配状态(RAS)。谁资助或支持了数据集的创建?高等卫生署和法国癌症研究所是这些虚构RCP记录的原始编写者,这些记录以源自新阿基坦地区癌症区域网络的真实RCP记录为灵感。这些真实记录被用作创造相同框架下的标志性情况的灵感,包括主要病理、相关病理和病史以及提出的治疗方案。两位专业人士无偿编写了虚构的RCP记录:菲利普·罗奇纽,帕奥利·卡梅特斯研究院的肿瘤内科临床负责人,以及玛格丽特·蒂兰,帕奥利·卡梅特斯研究院的放射治疗师。他们由数据ctivist合作组织的马修·莫雷监督。记录经过一致性处理后,由HAS的皮埃尔·利奥进行CDA文档的合成。数据集的组成:数据集主要包含什么内容?这些数据的主要信息是医疗信息和治疗决策。是否有一个描述数据集变量的方案?RCP记录遵循临床文档架构(CDA)标准。此数据集包含遵循2015年11月由健康数字机构发布的健康信息互操作性系统(CI-SIS)多学科讨论会(FRCP)部分2.0.0版本的记录。功能和技术文档可在该页面上的pdf资源中找到。数据集的每个字段包含什么内容?请参阅pdf文档。TNM列的值遵循第8版TNM癌症分类。数据集的内容是否依赖于外部资源?对于某些语义和某些属性而言是,但就内容而言,CDA标准的文档是自包含的。关于这些资源的持久性有哪些保证?医疗内容不依赖于外部来源。数据的收集过程:数据是如何收集的(通过传感器、手动通过计算机工具等)?作为灵感的原始RCP记录数据已手动输入到专用工具中。虚构的RCP记录数据已手动输入到电子表格中。然后,通过脚本将这些数据重新插入XML框架中,以模拟同类型CDA文档。谁负责数据的收集过程?原始记录由新阿基坦地区的专业人士手动输入以跟踪RCP。虚构的RCP记录由专业人士在办公软件中手动输入。XML重新插入脚本由一位专业人士编写。数据收集的时间段是什么?从2022年1月到5月。数据是直接收集还是从其他数据中推断出来的?数据是直接收集的。数据是在样本上收集的吗?按照什么方法?这些数据代表了一个非常有限的样本,由专业人士通过启发式方法定义,以说明各种临床情况。已知存在哪些错误、限制、噪声或冗余来源?这些数据遵循2015年发布的多学科讨论会(FRCP)参考库版本。2021年11月发布的2021.01版本提供了更多细节和更广泛的范围来详细描述癌症类型,通过某些分类。此外,RCP记录并不包含患者病史的全部内容。它只包含对决策有用的信息。数据预处理:数据是如何清洗或准备的?用于灵感的RCP记录数据已手动进行匿名化。特别是,姓名、姓名、标识符已被删除或完全替换。出生日期被截断到年份,然后模糊到几年左右。临床信息和RCP日期被调整并截断到2022年。地点被放置在地区层面上。然后,这些真实且匿名化的记录被用作创造相同框架下的标志性情况的灵感,包括主要病理、相关病理和病史以及提出的治疗方案。因此,在RCP记录中展示的数据是虚构的,并且与真实患者无关。“原始”数据未保留,也未分发。数据预处理工具是否可用?自动部分尚待决定。以CSV格式,数据集包含以下列:DDN:出生日期DateRCP:多学科讨论会(RCP)日期DatePrelevement:提取日期NaturePrelevement:提取的源操作ResiduTumoralApresChirurgie:手术后可能的肿瘤残留T, N and M:根据TNM轴(https://www.e-cancer.fr/Dictionnaire/C/classification-TNM)对癌症范围的分类Histologie:癌症的组织学类型MotifRCP:在RCP中讨论案例的原因ATCD:除癌症外的医疗病史HDM:癌症病史Question:在RCP期间提出的问题OMS:OMS分类Decouverte:发现方式PhaseMaladie:疾病阶段DPD:二氢吡啶脱氢酶(DihydroPyrimidine Déshydrogénase)的酶活性,其缺乏可能导致某些化疗的毒性增加(https://www.has-sante.fr/jcms/c_2966449/fr/cancer-recherche-d-un-deficit-en-enzyme-dihydropyrimidine-deshydrogenase-dpd-avant-chimiotherapie)TypeTT:主要治疗建议的类型DetailTT:以自然语言提出的治疗建议DetailTT:主要治疗建议的实现阶段TypeTT2:可能的二级治疗建议类型TypeTT3:可能的另一种治疗建议类型数据集的传播:数据是否在线发布?按照什么方式(在开放数据门户、网站、API等上)?是的,在此页面上data.gouv.fr。数据是按照什么许可证发布的?开放许可证版本2.0。在访问数据时是否应用了版税或限制?没有。数据集的维护:谁负责数据集的维护?如何联系此人?负责数据集的服务是什么?此数据集未进行维护。发布由法国国家癌症研究所完成。生产、编辑和传播的角色是否区分开来?是的。RCP记录数据的匿名化由癌症区域网络和HAS的数据任务执行。虚构RCP记录的生产由专业人士无偿为HAS的数据任务执行。传播由HAS的数据任务负责。数据集将更新吗?如果会,频率是多少?不会。如果数据变得过时,将如何传达此信息?在此页面上。是否可以以某种方式贡献于数据集的改进?否。法律和伦理考量:如果数据集涉及个人,他们是否已明确表达同意?虚构的RCP记录不再涉及个人。数据集不会直接或间接地暴露个人。发布的数据对应于虚构的RCP记录,这些记录以少量自动和手动匿名化的RCP记录为灵感。这些数据符合GDPR吗?是的。数据是否可能有利于或不利社会群体?否。数据集中是否包含可能被视为不适当或冒犯性的信息?否。
提供机构:
www.data.gouv.fr



