Censo Nacional de Población y Vivienda - CNPV - 2018 - Colombia
收藏microdatos.dane.gov.co2023-02-23 更新2025-03-22 收录
下载链接:
https://microdatos.dane.gov.co/index.php/catalog/643
下载链接
链接失效反馈官方服务:
资源简介:
Resumen
---------------------------
El Censo de Población y Vivienda, es la operación estadística más grande y de mayor importancia que se realiza en cualquier país. Se constituye en la columna vertebral del sistema nacional de información estadística. Por su universalidad, la información que se obtiene es el soporte de la planeación y formulación de políticas públicas. De igual forma, es la herramienta que permite llevar a cabo la caracterización de la población, sus hogares y viviendas como insumo para el ordenamiento territorial y para el seguimiento, la evaluación y la formulación de nuevas metas a los compromisos del país, entre otros como los Objetivos de Desarrollo Sostenible (ODS), el Consenso de Montevideo (CDM) y los compromisos con la Organización para la Cooperación y el Desarrollo Económico - OCDE.
El propósito del Censo Nacional de Población y Vivienda, en adelante - CNPV 2018, es el de contar la población residente en el territorio nacional y obtener información sociodemográfica para la planificación, gestión y toma de decisiones de política pública a nivel nacional, territorial y local. Entre sus principales objetivos específicos están los de producir información demográfica básica para la elaboración de proyecciones de población, identificar y caracterizar las condiciones de vida de los grupos étnicos localizados en el país, suministrar información para la construcción de indicadores de Necesidades Básicas Insatisfechas (NBI) y Objetivos de Desarrollo Sostenible (ODS) entre otros, así como actualizar los marcos de muestras para la elaboración de encuestas específicas.
El Departamento Administrativo Nacional de Estadística (DANE) efectuará el CNVP 2018, siguiendo la práctica iniciada con el Censo General 2005 cuando se incorporó el componente tecnológico con el uso de los Dispositivos Móviles de Captura y cartografía digital para la recolección de información en campo, entre otros; para el CNPV 2018 se avanza en el diseño de procesos de innovación en concordancia con las recomendaciones internacionales y prácticas de otras instituciones estadísticas del mundo, entre los cuales se encuentran la incorporación de registros administrativos para fines estadísticos y el diseño de nuevas metodologías como la recolección electrónica en estas operaciones estadísticas.
Es así como en la misma dirección de este contexto mundial, el DANE definió cinco pilares en concordancia con la visión establecida para la entidad, entre los que está el de innovación que consiste en “promover mejoras significativas en el quehacer, crear y aplicar nuevos productos, servicios, procesos, métodos organizativos que revolucionen la entidad y la producción y difusión estadística, de manera que el país y sus ciudadanos cuenten con más y mejor información para la toma de decisiones.
En el marco de este pilar, la entidad se propuso generar innovaciones para la ejecución del CNVP 2018, centradas especialmente en:
· La recolección de información vía web, por primera vez en el país, de manera complementaria con la recolección presencial en hogares.
· La introducción de componentes de innovación en el entrenamiento general del CNPV 2018, con simuladores y herramientas para entrenamiento B-Learning.
· El desarrollo de metodologías y tecnologías para aseguramiento de la calidad en tiempo real, en especial, adoptando estándares de medición geoespacial que fortalecen el control del operativo censal.
El presente documento define los principales componentes de cada una de las fases del proceso estadístico, diseñadas para llevar a cabo la operación censal; estructurado por capítulos, uno de los cuales es el de diseño de la operación estadística, compuesto por los diseños: temático, estadístico, ejecución, sistemas, control de calidad, pruebas, análisis de resultados, difusión y evaluación.
En el subcapítulo de diseño temático se establecen las principales necesidades de información de los usuarios, se definen los objetivos, el alcance, los diferentes marcos de referencia (teórico, conceptual y legal), los indicadores y cuadros de salida y el contenido del cuestionario. En el diseño estadístico se establecen los principales componentes básicos del diseño. El diseño de la ejecución muestra lo relacionado con el aprendizaje, que por primera vez contempla el componente virtual además del presencial, las actividades preparatorias como la sensibilización, selección y contratación de personal, entre otros; el diseño de instrumentos y la recolección de información con sus diferentes métodos y estrategias. En el subcapítulo referido al control de calidad se plantean los indicadores definidos para monitorear el avance de la recolección en términos de calidad y cobertura. El subcapítulo de pruebas ilustra aquellas que fueron realizadas con sus correspondientes aportes en la construcción de procesos, instrumentos y actividades. Así mismo se muestran los otros componentes como el diseño de sistemas, análisis de resultados, difusión y evaluación. Finalmente el de difusión muestra las principales herramientas dispuestas para la entrega de los resultados censales.
Geographic coverage
---------------------------
COBERTURA GEOGRÁFICA
El CNPV 2018 abarcará la totalidad del territorio nacional, correspondiente a 32 departamentos, 1.101 municipios, 20 áreas no municipalizadas y el archipiélago de San Andrés, Providencia y Santa Catalina.
Analysis unit
---------------------------
UNIDAD DE OBSERVACIÓN
Corresponde a las viviendas, los hogares y los Lugares Especiales de Alojamiento.
UNIDAD DE ANÁLISIS
Corresponde a las viviendas, los hogares y las personas.
Universo de estudio
---------------------------
Está compuesto por todas las viviendas, hogares y personas residentes habituales en el territorio colombiano, que en su área continental e insular tiene una superficie de 1.141.748 kilómetros cuadrados y se encuentra conformado por 32 departamentos y el Distrito Capital. El territorio cuenta con un total de 1.101 municipios, 20 áreas no municipalizadas, el archipiélago de San Andrés, Providencia y Santa Catalina.
También se incluye la población residente habitual en embajadas y consulados donde Colombia actúa de conformidad con el Derecho Internacional o con las leyes colombianas.
Igualmente hacen parte del Universo las personas residentes habituales en los LEA.
Con respecto a la población de habitantes de la calle, en el marco de la Ley 1641 de 2013, el DANE en conjunto con las administraciones municipales tiene la responsabilidad de levantar esta información. Sin embargo teniendo en cuenta que la ley establece lineamientos específicos para la caracterización de esta población, se hace necesario una operacionalización diferente por lo cual la recolección de información de esta población se está realizando en tiempos distintos a los del CNPV 2018.
Kind of data
---------------------------
Censos (cen)
Mode of data collection
---------------------------
Entrevista personal asistida con DMC (dispositivo móvil de captura)
Research instrument
---------------------------
DISEÑO DE INSTRUMENTOS
Algunos de instrumentos diseñados para la recolección de información del CNPV 2018 y el correspondiente control, en hogares particulares, LEA y entorno y equipamiento urbano, se listan a continuación:
CUESTIONARIO ELECTRÓNICO EN DISPOSITIVO MÓVIL DE CAPTURA (DMC)
Permite realizar la captura de datos a través de computadores de mano. Llevan incorporadas validaciones básicas, la cartografía censal y un GPS (Sistema de posicionamiento global) que permite georreferenciar la ubicación de cada una de las viviendas visitadas.
CUESTIONARIO ELECTRÓNICO EN WEB
Es un cuestionario idéntico en términos de contenido, al que se llevará al operativo en campo en dispositivo móvil de captura o en papel, pero que ha pasado por un proceso de usabilidad, que permite obtener un cuestionario para recolección vía web con características de accesibilidad, fácil de diligenciar e intuitivo, entre otras características. Este instrumento se dispondrá en la web, con los respectivos canales de comunicación (chat, correo electrónico y voz) que serán habilitados con el fin de dar soporte durante el proceso de diligenciamiento de la información por parte de la población.
CUESTIONARIOS EN PAPEL
Serán utilizados como contingencia para las áreas con dificultades de orden público y para aquellas zonas donde se hará recolección por el método de rutas.
PLANTILLA PARA LEA
Corresponde a un formato en excel de referencia, utilizado en los grandes LEA, diseñado a partir del cuestionario correspondiente. Este formato fué suministrado a cada una de estas instituciones después de establecer contacto telefónico, con el proposito de que cada una de ellas consolide su informacion mediante la conformación de un archivo digital con las variables solicitadas.
APLICATIVO WEB PARA LEA
Para aquellos LEA con más de 20 residentes habituales, se diseñó un aplicativo para ser utilizado accediendo a través de internet al cuestionario dispuesto en un servidor web. Un correo es enviado a cada LEA con nombre de usuario y contraseña para el acceso al cuestionario y diligenciamiento de la información.
Cleaning operations
---------------------------
NORMAS, ESPECIFICACIONES O REGLAS DE VALIDACIÓN, CONSISTENCIA E IMPUTACIÓN
Uno de los grandes retos para el CNPV 2018 es obtener en terreno información válida, precisa y consistente, para esto es necesario agotar todos los recursos para minimizar la falta de respuesta total y/o parcial, hacer un buen entrenamiento a los recolectores de información, exigir un buen trabajo de campo y aplicar mecanismos de supervisión y monitoreo rigurosos a la información recolectada desde el inicio del operativo. No obstante, subsisten aspectos técnicos de la información declarada por las personas y que son sujeto de mejora para verificar la consistencia lógica de la información estadística censal, en éste sentido, a continuación se describen brevemente los principales lineamientos técnicos de su implementación.
Los datos censales en la mayor parte del territorio nacional se obtendrán a través de un dispositivo móvil de captura - DMC el cual tiene incorporada la evaluación de rangos de variables priorizadas (validación), flujos de las variables (universo donde se aplica cada variable) y las consistencias mínimas necesarias. El DMC muestra alertas que permiten al censista identificar que está ingresando datos errados, o universos a los que no aplica la variable. Esto también se usa para las personas que brinden la información a través de internet por el eCenso el cual le permitirá a la persona darse cuenta de que no es válida la opción que ha seleccionado.
El proceso inicia antes del operativo de campo, con la malla de validación para el DMC y el eCenso, el diseño de los documentos necesarios para evaluar el proceso, los programas informáticos que permitan la implementación de las normas de validación, y la estructura de la base bajo el diccionario de datos construido para tal fin. Hay que tener presente que la programación contempla la transformación del archivo plano de las tablas de datos en formato SAS y SQL ya que estas serán las herramientas informáticas utilizadas en el procesamiento.
Los métodos que se utilizarán para corregir datos faltantes, no válidos o inconsistentes serán los siguientes: el aprovechamiento de fuentes externas, como los registros administrativos, uso de la información contenida y de coherencia con el cuestionario mediante el método de imputación Hot Deck como el vecino más cercano, secuencial e imputación múltiple, entre otras.
Imputaciones lógicas: Este método consiste en encontrar un valor aceptable para reemplazar un valor incorrecto, en situaciones en que las respuestas inconsistentes o que faltan se pueden deducir a partir de los valores del resto de variables del cuestionario censal.
Imputaciones por Hot Deck (HD): Este método desarrollado por Madow, Nisselson y Olkin, 1983, se utilizará para corregir los problemas de estructura. Este método de imputación ha sido extensamente probado en muchos países y en Colombia con el censo general 2005. El método preserva la distribución de probabilidad de las variables y los datos faltantes se reemplazan a partir de una selección aleatoria de valores observados, lo cual no introduce sesgos en la varianza del estimador.
Dentro de este proceso se diseñan y desarrollan las especificaciones, programas, herramientas, reglas y procedimientos necesarios para la adecuación de los datos requeridos en el procesamiento y la difusión, los cuales no solamente pretenden clasificar y caracterizar los problemas sino plantear las soluciones en cada caso. Este proceso está compuesto por:
· La edición y control de estructura de las bases.
· La validación, consistencia e imputación.
PROCESAMIENTO
El procesamiento de la base de datos consta de 5 grandes fases, asociadas a la transformación de la base original de manera consecutiva que inician de la lectura de la información almacenada por la oficina de sistemas y finaliza con las tablas imputadas, a partir de las cuales se generarán los resultados finales del censo. La siguiente gráfica muestra el proceso general del procesamiento en donde se resumen las actividades del proceso general.
La primera fase comienza con la lectura de tres bases de datos independientes: una de ellas, llamada de indicadores, que corresponde a la vista que genera la Oficina de sistemas para el procesamiento general, la siguiente base de datos “base de calidad” que contiene los datos de una nueva consolidación con información guardada (Backups) que se tenían de las encuestas realizadas en campo, y la última base, llamada de “validación”, contiene los datos de una nueva retrasmisión directa de las DMC. La base de calidad y de validación son controles de cobertura que se realizan para garantizar que toda la información recolectada en campo este completa en la base de datos. Cada base contiene las tablas de viviendas, hogares, personas, personas fallecidas, personas residentes, tabla de resultados de las encuestas, personas LEA, instituciones LEA y la geo codificación de cada uno de los métodos de recolección (DMC, eCenso, papel y LEA). A esta lectura se le denota Base 0.
Una vez se carga la información en el software “SAS” se integran las tres bases mediante la variable “UID_ENCUESTA”. Asegurando la totalidad de registros en la base de datos, se unen las correspondientes tablas de viviendas, hogares, personas, personas residentes, personas fallecidas y resultados de las encuestas de cada uno de los métodos de recolección (DMC, papel y eCenso) generando una sola tabla de viviendas, personas, personas residentes, hogares, personas fallecidas y resultados. Para el caso de LEA, la tabla de instituciones se une con la tabla de viviendas y la tabla de personas LEA se une con la tabla de personas. A esta base se denomina Base 1, la cual tiene una copia en formato texto delimitado por tabuladores (.Tab) y una en formato SAS (.sas7bdat).
La tercera fase tiene dos partes que se trabajan de manera paralela, la primera de ellas está conformada por varios procesos: la calidad de los datos de las variables de identificación en la tabla de personas, el mejoramiento de información faltante con la base del Archivo Nacional de Identificación (ANI) y Registro Civil de Nacimiento (RCN) de la Registraduria Nacional del Estado Civil (RNEC), el cruce con el registro de salud (BDUA+BDEX) y el registro de la Planilla de Afiliaciones (PILA).
El proceso de calidad consiste en la creación de una variable adicional por cada variable de identificación de personas (tipo y numero de documento, nombres, apellidos y fecha de nacimiento) indicando si hay datos consistentes, faltantes o inconsistentes, de tal forma que cuando hay un campo faltante en el Censo este se sustituye por el campo que brinda la Registraduria, siempre y cuando se garantizara la misma persona.
El proceso de identificación de duplicados para personas, se realiza mediante la construcción de dos variables adicionales que informan si un registro esta duplicado con otro por tipo y número de documento o por nombres y fecha de nacimiento. En estas dos variables se pueden identificar hogares duplicados por tener todas las personas residentes duplicadas en los mismos. Los cruces con los registros administrativos generan nuevas variables a la tabla de personas que se le denomina “IMP_PERSONAS”, su tratamiento se hace a través del software SQLserver.
La segunda parte de la tercera fase, consistirá en la integración de las tablas de personas, hogares, viviendas y personas fallecidas. Recordemos que la Base 1 contiene una tabla de personas, una tabla de hogares, una tabla de viviendas, una tabla de personas fallecidas y una tabla de resultados solamente uniendo los registros según los diversos métodos de recolección (eCenso, DMC, LEA y Papel) mas no realizando la integración.
Esta integración tendrá como resultado la construcción de una variable en cada una de las tablas llamada “estados” que permitirá identificar el registro real o el duplicado en cada tabla. Iniciamos con el estado en la tabla de hogares, la cual toma en cuenta la pregunta 11 permitiendo saber si un registro de hogar fue eCenso, fue realizado por DMC o es un eCenso verificado en DMC. A partir del estado en la tabla de hogares se genera el “estado" en la tabla de viviendas, identificando vivienda con todos sus hogares por eCenso, viviendas con hogares eCenso y DMC, viviendas con solo hogares DMC, instituciones de LEA y Viviendas sin personas.
La generación del “estado” de personas, parte de la tabla de IMP_PERSONAS de la primera parte de la fase con los estados de la tabla de hogares y viviendas identificando personas duplicadas en todo un hogar, personas duplicadas dentro de un hogar, personas duplicadas entre un hogar particular y una LEA, personas duplicadas con un hogar unipersonal, personas duplicadas entre hogares con más de una persona y personas sin duplicidad. El primer y tercer estado permite identificar hogares duplicados y posibles viviendas duplicadas, lo cual genera la actualización del estado de hogares y viviendas mencionados al comienzo de esta segunda parte. La base de datos que contienen las tablas de personas, hogares y viviendas con los correspondientes estados se denomina base 2.
Con la base dos construida se deshabilitan los registros duplicados de personas, hogares, viviendas y de personas fallecidas en cada una de las tablas y se realiza la asignación de la ubicación cuando la encuesta de eCenso es verificada en DMC teniendo en cuenta la pregunta 11.1 del cuestionario. Las tablas sin duplicados se almacenan en lo que se denomina base 3.
La última fase del procesamiento es la implementación de las reglas de validación e imputación, pero antes se toma como insumo la geocodificación de las encuestas y la verificación de aquellas que se encuentran en territorios étnicos. La primera parte del proceso es similar que la validación de las variables de identificación en la cual primero se construye una variable de calidad por cada variable a imputar que indica si el valor es inconsistente, consistente o faltante. A partir de esto, e identificado el faltante o inconsistente, se implementa la norma de imputación establecida. La tabla final se almacena en lo denominado base 4 de las cuales se generan los resultados finales.
Es importante mencionar que el DANE salvaguardará las bases resultantes de todas las fases del procesamiento, incluyendo la base 0.
人口普查与住宅普查,是任何国家进行的最大规模且最具重要性的统计操作。它构成了国家统计信息系统的脊柱。由于其普遍性,所获得的信息是制定和实施公共政策规划的基础。同样,它是进行人口、家庭和住宅特征描述的工具,作为国土整理、跟踪、评估和制定国家新目标的依据,例如可持续发展目标(SDG)、蒙得维的亚共识(CDM)以及与经济合作与发展组织(OECD)的承诺。
国家人口普查与住宅普查,简称 CNPV 2018,的目的是统计全国领土内的居住人口,并获取社会人口信息,以支持国家、地区和地方层面的规划、管理和公共政策决策。其主要具体目标包括:生产基本人口信息,用于编制人口预测;识别和描述国内各民族群体的生活条件;提供信息,用于构建基本需求未满足(NBI)和可持续发展目标(SDG)等指标;以及更新特定调查的样本框架。
国家统计局(DANE)将执行 CNPV 2018,遵循自 2005 年普查总调查开始采用的实践,当时引入了技术组件,包括使用移动捕获设备和数字制图来收集现场信息,等等;对于 CNPV 2018,我们进一步推进了与国际建议和其他国家统计机构实践相符的创新过程设计。其中包括行政记录的统计用途以及这些统计操作中新的方法设计,如电子收集。
在此背景下,DANE 定义了五个支柱,与实体设定的愿景相一致,其中包括创新,即‘促进显著改进工作,创造和应用新产品、服务、流程、组织方法,从而革命性地改变实体和统计生产与传播,使国家和公民能够获得更多和更好的信息以做出决策。
在这一支柱的框架下,实体致力于为 CNPV 2018 的执行生成创新,特别集中在以下方面:
· 通过互联网收集信息,这是该国首次,作为现场家庭收集的补充。
· 在 CNPV 2018 的总体培训中引入创新元素,包括模拟和B-Learning 培训工具。
· 开发确保实时质量的方法和技术,特别是采用加强普查操作控制的地理空间测量标准。
本文件定义了统计过程每个阶段的每个主要组成部分,旨在执行普查操作;按章节结构,其中一章是统计操作设计,由以下设计组成:主题设计、统计设计、执行设计、系统设计、质量控制、测试、结果分析、传播和评估。
在主题设计子章节中,确立了用户的主要信息需求,定义了目标、范围、不同的参考框架(理论、概念和法律)、指标和输出表格以及问卷内容。在统计设计中,确立了设计的基本组成部分。执行设计展示了与学习相关的内容,这是首次考虑到虚拟成分,除了现场成分之外,还包括准备活动,如意识提升、人员选拔和招聘等;工具设计和信息收集,包括其不同的方法和策略。在质量控制子章节中,提出了用于监控收集进展的质量和覆盖范围的指标。测试子章节说明了所进行的测试及其对过程、工具和活动的贡献。同样,展示了其他组件,如系统设计、结果分析、传播和评估。最后,传播部分展示了用于交付普查结果的主要工具。
地理覆盖范围
提供机构:
microdatos.dane.gov.co



