five

Dados Originais e Pré-processados do SINAN-TB (2001–2023) para Modelagem Preditiva de Desfechos no Tratamento da Tuberculose no Brasil

收藏
NIAID Data Ecosystem2026-05-02 收录
下载链接:
https://data.mendeley.com/datasets/gsd4xvthb8
下载链接
链接失效反馈
官方服务:
资源简介:
Este repositório contém os dados do SINAN-TB (Sistema de Informação de Agravos de Notificação - Tuberculose), fornecida pelo Ministério da Saúde do Brasil, abrangendo notificações de casos de tuberculose no período de 2001 a 2023. A base contém informações clínicas, laboratoriais, sociodemográficas e territoriais dos pacientes. Foram definidos cinco cenários distintos de pré-processamento dos dados (A a E), variando conforme o período analisado, completude dos atributos, inclusão de variáveis derivadas (como DIAS_EM_TRATAMENTO, PROP_CONTATOS_EXAMINADOS, DIAS_ATE_INICIO_TRATAMENTO) e a adição do IDHM (Índice de Desenvolvimento Humano Municipal). Adicionalmente, o cenário E incorpora a técnica TabPFN (Tabular Prior-Data Few-Shot Network), com testes realizados em 100 datasets balanceados, utilizando diferentes combinações de atributos (básico, clínico e contatos). Os dados publicados incluem: * A base original anonimizável (SINANTB_01a23.csv.zip) * Arquivos em .csv correspondentes aos conjuntos de dados pré-processados (cenários A a E) * Resultados de testes alcançados pela técnica TabPFN * O índice de IDH por município Scripts de pré-processamento e geração dos datasets disponíveis em: https://github.com/maiconlino/cenariostb Os dados estão organizados para garantir a reprodutibilidade científica e permitir a replicação dos resultados apresentados no artigo.
创建时间:
2025-06-03
二维码
社区交流群
二维码
科研交流群
商业服务