five

Encuesta Pulso de la Migración - EPM - 2021-2022 - Colombia

收藏
microdatos.dane.gov.co2025-03-22 收录
下载链接:
https://microdatos.dane.gov.co/index.php/catalog/781
下载链接
链接失效反馈
官方服务:
资源简介:
Resumen --------------------------- El Departamento Administrativo Nacional de Estadística (DANE) en desarrollo de su objetivo misional de producir estadísticas oficiales, que cumplan con los estándares internacionales y que sirvan de base para la toma de decisiones, se propone elaborar la operación estadística Pulso de la Migración. Esta encuesta está dirigida a personas migrantes desde Venezuela y busca producir información relacionada sobre el origen y razones de la migración, acceso a empleo, integración socioeconómica, cambios en el flujo de ingresos y remesas, así como a las violencias (de género y xenofobia) a las que se exponen los migrantes, entre otros temas. En ese sentido, esta operación busca ser una herramienta fundamental para la definición e implementación de políticas públicas. Geographic coverage --------------------------- El universo de estudio en la Encuesta de Pulso Migración está conformado por la población civil no institucional que hacen parte de los hogares en Colombia, excluyendo nuevos departamentos, para el año 2021, con al menos una persona migrante desde Venezuela mayor de 15 años. La Encuesta de Pulso Migración cubre geográficamente a todo el territorio nacional excluyendo nuevos departamentos. Analysis unit --------------------------- UNIDAD DE OBSERVACIÓN Personas. UNIDAD DE ANÁLISIS En este caso están representadas por los hogares y las personas. UNIDAD DE MUESTREO La Encuesta de Pulso de la Migración es una submuestra de la Gran Encuesta Integrada de Hogares (GEIH) marco 2005; ésta última tiene varias unidades de muestreo dependiendo de la etapa del diseño muestral, las unidades primarias se relacionan con la primera etapa, las unidades secundarias con la segunda etapa y las unidades terciarias con la tercera etapa. • Unidades Primarias de Muestreo (UPM): se denominan así todos los municipios del país. • Unidades Secundarias de Muestreo (USM): Son las manzanas y secciones rurales definidas en el marco muestral de 2005. • Unidades Terciarias de Muestreo (UTM): Son conglomerados de 10 viviendas contiguas en promedio también llamadas segmentos o medidas de tamaño (MT) ubicadas tanto en la cabecera como en el resto de cada municipio, con límites naturales fácilmente identificables en los que se encuestan todos los hogares y personas. Respecto a las unidades muestrales de la encuesta de Pulso Migración se debe tener en cuenta que es un muestreo en fases donde después de recoger la encuesta de la GEIH se identifican a todas las personas mayores de 15 años pertenecientes a hogares donde al menos una de las personas que lo conforma es un migrante venezolano, definido anteriormente en la población objetivo. Por lo tanto, las unidades muestrales de la fase de la encuesta son las personas descritas. Universo de estudio --------------------------- El universo de estudio en la Encuesta de Pulso de la Migración está conformado por la población civil no institucional que hacen parte de los hogares en Colombia, excluyendo nuevos departamentos, para el año 2021, con al menos una persona migrante desde Venezuela con 15 años o más. Kind of data --------------------------- Encuesta por muestreo (ssd) Sampling procedure --------------------------- Para la Encuesta de Pulso de la Migración se pueden relacionar dos marcos muestrales, el primero es el marco de área usado para seleccionar los segmentos de la GEIH marco 2005. El segundo, el marco de lista de personas construido después de hacer la encuesta GEIH marco 2005. Respecto al primero, se invita al lector a revisar la metodología de la GEIH, donde encontrará una descripción detallada del mismo.. Respecto al marco de lista, éste contiene todas las personas encuestadas en la GEIH. Particularmente cuenta con las variables que clasifican a los individuos que pertenecen a hogares con al menos un migrante venezolano. DISEÑO MUESTRAL La investigación es una encuesta orientada a hogares y personas, por lo tanto, se establece una estrategia muestral adecuada para acceder a mediciones de estas unidades de análisis con procedimientos que aseguran estimadores insesgados de los parámetros bajo una precisión y confianza preestablecida de antemano. A continuación, se describirá en detalle el plan muestral. TIPO DE MUESTREO Teniendo en cuenta los objetivos y las características de la encuesta se opta por una muestra en fases. En primer lugar, se establece un muestreo probabilístico (Encuesta GEIH marco 2005), donde se encuestan un grupo de personas y luego sobre este grupo se define una muestra probabilística y estratificada. La estratificación se define de la siguiente manera: cabeceras de ciudades capitales y su área metropolitana y lo demás en cinco regiones subparticionadas en cabecera y resto, Un segundo nivel de estratificación se define dentro de cada segmento con la partición de los hogares. Es decir, cada hogar es un estrato y dentro de cada estrato se selecciona las personas de 15 años o más. Respecto a las cuatro rondas, se establece una estrategia de muestreo tipo panel, donde la muestra definida en la primera ronda es usada en las siguientes tres rondas, metodología mediante la cual, dado el carácter específico de migrantes que tiene la población objeto de estudio, se busca contar con información periódica de las fuentes para conocer las variaciones en los individuos que participan en la encuesta. CÁLCULO DEL TAMAÑO DE LA MUESTRA El tamaño de muestra se definió con el objetivo de garantizar prevalencias de un 10%, con un margen de error de 1 punto porcentual y 95% de confiabilidad, de acuerdo con lo anterior se optó por hacer seguimiento a una muestra de hogares con al menos un migrante venezolano, lo cual equivale a 4000 hogares por ronda. SELECCIÓN DE MUESTRA La selección de la muestra está definida en dos fases: en la primera fase (muestra GEIH) se procede con un diseño multi-etápico donde la primera etapa se seleccionan municipios, en la segunda etapa manzanas o secciones rurales y en la tercera etapa conglomerados de 10 viviendas. En la segunda fase se construye el marco de los hogares con al menos una persona migrante, posteriormente se selecciona una muestra de 4000 hogares con un procedimiento estratificado sistemático. Dentro de cada estrato la afijación del tamaño de muestra se define proporcionalmente al tamaño que tenía originalmente la GEIH en este grupo de hogares. Sampling deviation --------------------------- MANTENIMIENTO DE MUESTRA Y MANEJO DE NOVEDADES MUESTRALES Como se mencionó al inicio de esta sección, la EPM es una encuesta tipo panel, donde la muestra de la primera ronda es usada en las siguientes rondas. Sin embargo, entre la realización de una ronda y otra desaparecen unidades muestrales. Para superar los inconvenientes de atrición, se refresca la muestra adicionando hogares con las mismas estructuras poblacionales de la ronda original. En la ronda 1 la muestra se selecciona con los encuestados de la GEIH marco 2005 de enero a junio de 2021. En la ronda 2 con el propósito de mantener el tamaño de muestra (4000 hogares), se refresca la información de los individuos que se pierden de la muestra de la ronda anterior, con los encuestados de junio, julio y agosto de 2021. En la ronda 3 se refresca la muestra de la ronda 2 con los encuestados de agosto, septiembre y octubre de 2021 y en la última ronda se refresca la muestra con los encuestados de octubre, noviembre y diciembre de 2021. La siguiente tabla refleja el porcentaje de atrición respecto a la muestra de la ronda 1 que ha tenido cada una de las rondas Ronda:1 No. Encuestas:7951 No. primer semestre:6966 Porcentaje: Ronda:2 No. Encuestas:7633 No. primer semestre:5677 Porcentaje:18,5% Ronda:3 No. Encuestas:5927 No. primer semestre:4602 Porcentaje:33,9% Ronda:4 No. Encuestas:8394 No. primer semestre:3662 Porcentaje: 47,4% Mode of data collection --------------------------- Entrevista telefónica Research instrument --------------------------- El tipo de formulario utilizado en la EPM está conformado por un listado de diferentes preguntas agrupadas en diferentes módulos, varían entre rondas de recolección y publicación de resultados. La simplicidad del cuestionario busca que recolectar datos de forma rápida y oportuna, siendo un cuestionario diseñado para entrevistas telefónicas que deben durar de 25 a 30 minutos. A continuación, se presenta la estructura del formulario y los objetivos de cada módulo: Módulo de Identificación: contiene preguntas cuyo objetivo es el de captar los datos de identificación, sexo y años de la persona encuestada, el número hijos, total de miembros del hogar y si existe o no alguna participación previa en las rondas anteriores de la encuesta. Módulo de Migración: contiene preguntas con las que se busca obtener información acerca del lugar residencia previo a la situación migrante y si contaba con casa propia en este territorio y el estado actual de la misma, fuente de recursos que le permitió migrar y diferentes momentos del proceso de formalización de los procesos migratorios. Módulo de Mercado laboral: contiene preguntas con las que se busca obtener información sobre la situación de trabajo y actividades realizadas en el país de origen y su situación actual, así como la evaluación de la formalización en el sistema de seguridad social de Colombia Módulo de Ingresos y remesas: recopila información acerca de los ingresos devengados y la manera en la que obtuvo dichos ingresos para hacerle frente a la pandemia, incluye información sobre apoyo financiero tanto recibido como brindado y la inclusión financiera dentro de las instituciones financieras a nivel nacional. Módulo de Violencias: contiene preguntas que evalúa las violencias a las que se expone la población venezolana migrante, ya sean de género y/o xenofobia. Módulo de COVID-19: contiene preguntas que buscan recopilar información que incluye información que permite evaluar las variaciones de los hábitos de consumo, laborales, tareas del hogar y diferentes dificultades enfrentadas durante la pandemia, así como la situación relacionada a contagios y vacunación. Módulo de Planificación y Menstruación: muestra información sobre el uso de métodos anticonceptivos, así como los elementos usados por las mujeres para gestionar su menstruación. Módulo de Esquemas e imaginarios: reúne información sobre identidad cultural, exposición a escenarios de discriminación y la existencia de redes de apoyo, tanto de amigos como familiares, migrantes y no migrantes. Módulo de niñez y primera infancia: En la ronda 4 la encuesta incluye un set de preguntas cortos relacionados con el acceso a educación de niños y adolescentes, presentes en hogares migrantes. Además, contiene preguntas sobre el acompañamiento afectivo y educativo con el que cuentan los niños menores de 10 años presentes en el hogar. Es relevante señalar que en el diseño del formulario de la EPM se emplearon criterios para evaluar la factibilidad como su relación con los objetivos de la encuesta, su pertinencia, la claridad para el encuestado, la disponibilidad de fuentes alternativas de información, entre otros. Así mismo, se efectuaron pruebas en el aplicativo de tal forma que no se afectaran las reglas de validación y se verificó que el fraseo de las preguntas fuera adecuado para la comprensión por parte del encuestado/a, de manera que se garantice que la información recolectada tenga el alcance de lo que se pretende medir. Cleaning operations --------------------------- CREACIÓN DE LA BASE DE DATOS (ORACLE) Es necesario contar con el motor de bases de datos y en un esquema creado para la investigación que permita el cargue y almacenamiento general de los datos. La base de datos para la investigación asignada es una base de datos relacional donde la Encuesta Pulso de la Migración, tiene un único registro por persona. Se debe asignar el número de la encuesta asociado a la investigación y definir los tipos de datos, textos de las preguntas, listas de valores asociadas, subpreguntas, entre otros. De igual manera, definir los formularios. Adicionalmente, se establecen los flujos y validaciones de cada una de las preguntas. En la estructura del formulario se debe asociar a cada pregunta el código equivalente con el código de pregunta en Oracle. Así mismo, como parte del diseño se crea un ETL (Extract, Transform and Load) en Pentaho Data Integration y se carga la información a la tabla de la base de datos. CONSOLIDACIÓN DE ARCHIVOS DE DATOS CARGUE DE INFORMACIÓN El proceso de carga de información a la base de datos se realiza seleccionando los archivos planos generados con la herramienta propia de la plataforma MySurvey y con un ETL (Extract, Transform and Load) en Pentaho Data Integration creado, se cargan los datos. Al iniciar el proceso de carga se verifica la identificación única para cada encuesta, garantizando que no exista duplicidad en la información. CODIFICACIÓN La encuesta maneja un set de preguntas abiertas sobre la ocupación y actividad económica de los migrantes que se encuentran trabajando. Estas preguntas son: ¿Qué hace en este trabajo? y ¿cuál es la actividad de la empresa o persona que lo contrató? Para la codificación de estas variables se emplean nomenclaturas y clasificaciones internacionales que permiten el nivel de agregación necesario y que garantizan la comparabilidad internacional de los resultados (Para ocupación se utiliza la Clasificación Internacional Uniforme de Ocupaciones, 2008 CIUO-08; para las ramas de actividad económica se utiliza la Clasificación Industrial Internacional Uniforme de todas las actividades económicas. Revisión 4 Adaptada para Colombia CIIU Rev. 4 A.C. (2020). DICCIONARIO DE DATOS En el diccionario de datos se describen, los metadatos de todas las variables incluidas en las tablas generadas con la información de la operación estadística, entre ellos el nombre de la variable, su código, tipo, extensión, el texto de la pregunta respectiva y de las alternativas de respuesta. El diccionario se construye de acuerdo con la codificación de las preguntas con las que cuenta el formulario de la encuesta. En la medida en que el formulario se revisa y ajusta periódicamente, esta se actualiza. REVISIÓN Y VALIDACIÓN Documenta el procedimiento establecido para revisar y validar el archivo de datos que se conforma a partir de la recolección o el acopio, teniendo en cuenta la posibilidad de volver a consultar al encuestado idóneo o la fuente de datos. De manera adicional, en conjunto con los equipos de logística y sistemas, se realiza una revisión semanal de la información recolectada para detectar inconsistencias susceptibles de ser verificadas y corregidas en campo con el fin de garantizar la calidad de la información recolectada. DISEÑO DE INSTRUMENTOS DE EDICIÓN ( VALIDACIÓN Y CONSISTENCIA) E IMPUTACIÓN DE DATOS CONSISTENCIA DE INFORMACIÓN A través del desarrollo de sentencias Oracle, se identifican posibles inconsistencias por duplicidad a nivel de personas. Se generan reportes que permiten realizar constantemente el monitoreo y control a la información que se ha recolectado. Posteriormente, en el esquema diseñado en ORACLE se crean procedimientos para validar la información de la base de datos, flujos, variables sin información, rangos y estructura, con el fin de obtener una base de datos consistente. Es así que cada operación queda almacenada en su propio esquema de base de datos. Esto permite que los datos se mantengan aislados de la información de otras operaciones y los permisos de acceso a los usuarios se realicen mediante los mecanismos de roles y privilegios propios del sistema manejador de base de datos. DISEÑO PARA LA GENERACIÓN DE CUADROS DE RESULTADOS El equipo temático de la encuesta recibe el archivo en formato DTA por parte del equipo de sistemas con las especificaciones para la generación de los cuadros de salida que se van a publicar. Posteriormente se reciben los factores de expansión por parte del equipo de muestras, con los cuales el equipo de temática genera los cuadros de salida definitivos, que permiten la visualización de los resultados de la encuesta. Estos cuadros se generan en formato XLS y son aquellos que se encuentran en el Anexo publicado. Revisados los cuadros generados por parte del equipo temático, se realizan ajustes, en caso de ser necesario. Los cuadros de salida se generan para los dominios total nacional. Para el análisis y difusión de los resultados de la EPM se han definido los cuadros de salida desagregados por sexo, edad y tamaño del hogar. Response rate --------------------------- La cobertura de todas las ronas oscilo en 85-95% del total de la muestra (4000 hogares por ronda) Sampling error estimates --------------------------- El proceso de análisis de resultados está comprendido por: MÉTODOS DE ANÁLISIS DE RESULTADOS Los métodos, las técnicas y los procedimientos que permiten verificar la coherencia y calidad de la Encuesta Pulso de la Migración: ·Análisis de consistencia Pueden existir en la operación errores que no dependen de la selección de la muestra, como los que se pueden originar en el diseño del formulario, directamente de la fuente de información por mala interpretación de las instrucciones de diligenciamiento, del recolector por interpretación equivocada del instructivo de diligenciamiento o por deficiencias conceptuales, durante la captura, durante el manejo de los archivos, en la generación de resultados o en el manejo de las novedades por mala asignación. Como se mencionó anteriormente, el supervisor de campo es el encargado de la revisión y análisis de consistencia de la información recolectada en el aplicativo web. Finalizado el periodo de recolección es el equipo logístico el que consolida y depura las bases de posibles inconsistencias. Estas bases se ponen a disposición del equipo donde se genera nuevamente un listado de posibles inconsistencias para someterse a revisión. · Análisis de contexto Se hace un análisis de contexto con los resultados de las rondas anteriores. Con el análisis de contexto se busca determinar qué tan acorde están los resultados con respecto a mediciones similares o paralela a los temas tratados por la EPM. Lo anterior, permite verificar la consistencia de la información en relación con los grandes grupos de actividades, pero sin que ello pueda entenderse como una comparación entre encuestas, pues las metodologías difieren en cada caso. · Análisis de comparabilidad Las comparaciones se realizan con los resultados mensuales de la EPM de acuerdo con las prevalencias de las diferentes preguntas que recoge la encuesta. · Análisis estadístico Se realizan los siguientes análisis: • El análisis descriptivo, que ayuda a observar el comportamiento de la muestra en estudio, a través de tablas, gráficos. • Se analiza en la muestra la estructura de los indicadores a partir de la distribución de frecuencias, y se detectan posibles inconsistencias. • Se verifica que los ajustes del factor de expansión no generen sesgos en las estimaciones, y que sus errores muestrales sean aceptables de acuerdo con los parámetros establecidos por dominios de estudio. • Se verifica que, al momento de realizar desagregación de resultados, los coeficientes de variación no sean tan altos que impidan la inferencia estadística. · Análisis univariado Consiste en el análisis de cada una de las variables estudiadas por separado, es decir, el análisis está basado en una sola variable. Las técnicas más frecuentes de análisis univariado son la distribución de frecuencias, el análisis de las medidas de tendencia central y de las medidas de dispersión de la variable. La distribución de frecuencias de la variable requiere la observación de cómo están distribuidas las categorías de la variable, pudiendo presentarse como valores absolutos o en términos relativos, estas suelen presentarse acompañadas de gráficos estadísticos (como histogramas, tortas, etc.) para facilitar su comprensión y análisis. · Análisis bivariado No aplica. · Análisis multivariado No aplica. ANONIMIZACIÓN DE MICRODATOS El equipo de temática determina las variables que por confidencialidad deben ser anonimizadas en la base de datos que se va a publicar y a partir de la base de datos final, es decir, solo con las encuestas completas, se genera un archivo que remite al área de sistemas. Dicha área, luego de realizar ese proceso, reenvía el archivo al área temática para su verificación y aprobación y posterior publicación en la página web de DANE. De acuerdo con los protocolos de anonimización, no se incluyen variables relacionadas con la identificación de las viviendas como son su dirección, barrio, número telefónico, etc., y datos de identificación de las personas. Debido a que la EPM es una submuestra de la GEIH, se permite que las variables de directorio, secuencia y orden sean usadas como llaves de identificación y así usar los datos de la GEIH del mismo mes del año anterior. Con este proceso se busca garantizar la reserva estadística y a su vez facilitar el uso de la información. VERIFICACIÓN DE LA ANONIMIZACIÓN DE MICRODATOS El equipo temático revisará que las variables, que por confidencialidad deben ser anonimizadas en la base de datos, no se encuentren publicadas en la página web de DANE. COMITÉS DE EXPERTOS Dado que la Encuesta Pulso de la Migración es una estadística experimental, no existe un comité experto oficial, sin embargo, se tienen mesas de trabajo con Banco Mundial, USAID, el Banco Interamericano de Desarrollo para definir las temáticas, cuestionarios, la muestra, la metodología de recolección y se discuten los resultados de manera que se respalda la oficialidad de la encuesta.

摘要 --------------------------- 国家统计局行政部门(DANE)在其使命目标的指导下,致力于生产符合国际标准的官方统计数据,并作为决策的基础,计划开展移民脉搏统计调查。该调查针对来自委内瑞拉的移民,旨在收集有关移民的起源和原因、就业获取、社会经济融合、收入流和汇款变化,以及移民面临的各种暴力(包括性别暴力和仇外)等方面的信息。在此基础上,该调查旨在成为公共政策制定和实施的基本工具。 地理覆盖范围 --------------------------- 移民脉搏调查的研究对象包括哥伦比亚所有地区(不包括新设立的部门)中,至少有一位15岁及以上来自委内瑞拉的移民的民用非机构化家庭人口,截至2021年。 分析单位 --------------------------- 观测单位 人员。 分析单位 在本例中,由家庭和人员代表。 抽样单位 移民脉搏调查是2005年综合家庭调查(GEIH)的一个子样本;后者根据抽样设计阶段具有多个抽样单位,其中初级单位与第一阶段相关,次级单位与第二阶段相关,三级单位与第三阶段相关。 • 初级抽样单位(UPM):指全国所有市镇。 • 次级抽样单位(USM):是2005年抽样框架中定义的街区和小农村。 • 三级抽样单位(UTM):是平均10个连续住房单位的集合,也称为段或尺寸(MT),位于每个市镇的市中心和其余地区,其边界是易于识别的自然边界,其中调查所有家庭和人员。 关于移民脉搏调查的抽样单位,应注意的是,这是一个分阶段的抽样,在收集GEIH调查后,识别出所有属于至少有一位构成该家庭的委内瑞拉移民的家庭中15岁及以上的所有人员。因此,调查阶段的抽样单位是上述描述的人员。 研究对象 --------------------------- 移民脉搏调查的研究对象包括哥伦比亚所有地区(不包括新设立的部门)中,至少有一位15岁及以上来自委内瑞拉的移民的民用非机构化家庭人口,截至2021年。 数据类型 --------------------------- 抽样调查(ssd) 抽样程序 --------------------------- 对于移民脉搏调查,可以关联两个抽样框架,第一个是用于选择GEIH 2005框架中段落的区域框架。第二个是构建在GEIH 2005框架调查之后的个人名单框架。 有关第一个框架,建议读者查阅GEIH的方法,其中可以找到对它的详细描述。 有关名单框架,它包含在GEIH中接受调查的所有个人。特别是它包含将个体分类到至少有一位移民委内瑞拉人构成的家庭的变量。 抽样设计 --------------------------- 该调查是一个针对家庭和个人的调查,因此,为获取这些分析单位的测量值,并确保在预先设定的精度和置信水平下获得无偏估计,建立了一个适当的抽样策略。以下将详细描述抽样计划。 抽样类型 考虑到调查的目标和特征,选择分阶段抽样。首先,建立一个概率抽样(GEIH 2005调查),其中调查一组人员,然后在此组人员上定义一个概率和分层抽样。 分层如下:首都城市及其大都市区和其余五个区域。 在每个段内部,定义第二个分层,即家庭的划分。也就是说,每个家庭是一个层,在每个层内选择15岁或以上的人员。 关于四个轮次,建立一个面板抽样策略,其中第一轮定义的样本在接下来的三轮中使用,这种方法由于研究对象为具有特定特征的移民,因此旨在获取关于参与调查的个人的定期信息。 抽样量计算 --------------------------- 抽样量定义为保证10%的患病率,误差范围为1个百分点,置信水平为95%,根据上述内容,选择跟踪至少有一位委内瑞拉移民的家庭样本,这相当于每轮4000个家庭。 抽样选择 --------------------------- 抽样选择定义在两个阶段:在第一阶段(GEIH样本)中,进行多阶段设计,第一阶段选择市镇,第二阶段选择街区或农村地区,第三阶段选择10个住房单位的集合。 在第二阶段,构建至少有一位移民构成的家庭的框架,然后使用分层系统抽样程序选择4000个家庭样本。在每一个层内,样本量的确定与GEIH在原始家庭组中具有的比例相匹配。 抽样偏差 --------------------------- 样本维护和样本变化管理 --------------------------- 数据收集方式 --------------------------- 电话访谈 研究工具 --------------------------- 在EPM中使用的问卷类型由不同模块中的不同问题列表组成,这些模块在收集数据和发布结果的不同轮次中有所不同。问卷的简洁性旨在快速和及时地收集数据,这是一个为电话访谈设计的问卷,访谈时间应为25至30分钟。 以下将介绍问卷的结构和每个模块的目标。 模块识别:包含旨在收集调查人员识别数据、性别和年龄、子女数量、家庭总人数以及是否存在之前调查轮次中的参与情况的问题。 模块移民:包含旨在获取关于移民前居住地、在该地区是否拥有自有房屋及其当前状态、资助移民的资源以及移民程序正式化不同阶段的信息的问题。 模块劳动力市场:包含旨在获取关于在调查国和原籍国的工作和活动情况,以及目前状况,以及哥伦比亚社会保障体系中的正式化情况的信息的问题。 模块收入和汇款:收集关于赚取的收入及其获得方式的信息,以便应对疫情,包括收到的和提供的财政支持以及在全国金融机构中的金融包容性。 模块暴力:包含旨在评估委内瑞拉移民人口面临的暴力的提问,包括性别暴力和/或仇外。 模块COVID-19:包含旨在收集有关消费习惯、工作、家务劳动以及疫情期间面临的不同困难的信息,以及与感染和疫苗接种相关的状况。 模块计划生育和月经:显示有关避孕方法使用的信息,以及女性用于管理其月经的元素。 模块模式和想象:汇集有关文化身份、歧视场景的暴露以及存在由朋友、家人、移民和非移民组成的支持网络的信息。 模块儿童和学龄前儿童:在第四轮中,调查包括与移民家庭中儿童和青少年教育获取相关的一系列简短问题。此外,还包括关于在家庭中10岁以下儿童所获得的情感和教育支持的问题。 值得注意的是,在EPM问卷的设计中,采用了评估其可行性、与调查目标的相关性、对受访者的清晰度、替代信息来源的可用性等标准。 数据清理操作 --------------------------- 数据库创建(ORACLE) --------------------------- 数据文件合并 --------------------------- 信息加载 --------------------------- 编码 --------------------------- 数据字典 --------------------------- 数据验证 --------------------------- 信息一致性 通过Oracle中的语句,识别可能由人员重复引起的潜在不一致。生成报告,允许持续监控和控制收集的信息。 随后,在Oracle中设计的框架中创建程序,以验证数据库中的信息、流程、变量缺失、范围和结构,以便获得一致的数据库。 因此,每个操作都存储在其自己的数据库架构中。这允许数据与来自其他操作的信息保持隔离,并通过数据库管理系统自己的角色和权限机制实现对用户的访问权限。 结果表设计 --------------------------- 调查主题团队从系统团队接收格式为DTA的文件,并指定生成要发布的输出表的具体说明。随后,从样本团队接收因素扩展,使用这些因素,主题团队生成最终的输出表,允许查看调查结果。这些输出表以XLS格式生成,并包含在附件中。 主题团队审查生成的输出表后,如果需要,将进行调整。输出表针对全国总域生成。为了分析和传播EPM的结果,已定义按性别、年龄和家庭规模分解的输出表。 响应率 --------------------------- 所有轮次的覆盖率在样本总数(每轮4000个家庭)的85-95%之间。 抽样误差估计 --------------------------- 结果分析过程包括: 结果分析方法 --------------------------- 分析一致性 可能存在操作错误,这些错误不依赖于样本选择,例如可能由问卷设计、直接来自信息源(由于填写说明的理解错误)或收集员(由于填写说明的解释错误)或概念缺陷在捕获、处理文件、生成结果或处理新情况时产生的错误。 如前所述,现场主管负责审查和分析收集信息的准确性。收集期结束后,后勤团队负责整合和清理可能存在不一致性的基础数据。将这些基础数据提供给生成新不一致性列表的团队。 分析背景 通过对先前轮次的结果进行分析,进行背景分析。通过背景分析,可以确定结果与类似或平行于EPM讨论的主题的测量的一致性。这允许验证信息与大型活动组的一致性,但不应将其理解为不同调查之间的比较,因为每种情况的方法都不同。 可比性分析 根据EPM收集的不同问题的患病率进行比较。 统计分析 进行以下分析: • 描述性分析,有助于通过表格和图表观察研究样本的行为。 • 从频率分布分析中分析样本的指标结构,并检测可能的不一致性。 • 检查因素扩展的调整是否不会在估计中产生偏差,并且样本误差符合根据研究域设定的参数。 • 在进行结果分解时,检查变异系数是否不是那么高,以至于阻碍了统计推断。 单变量分析 由以下分析组成: 每个变量分别进行分析,即基于一个变量的分析。最常见单变量分析技术是频率分布、趋势集中度和离散度测量。变量的频率分布需要观察变量类别的分布,可以以绝对值或相对值的形式呈现,通常伴随着统计图表(如直方图、饼图等),以帮助理解和分析。 双变量分析 不适用。 多变量分析 不适用。 微观数据匿名化 --------------------------- 主题团队确定在要发布的数据库中必须匿名化的变量,并从最终数据库生成一个文件,该文件发送到系统部门。该部门随后完成该过程,将文件重新发送到主题部门进行验证和批准,然后发布在DANE的网站上。 根据匿名化协议,不包括与住房识别相关的变量,如地址、街区、电话号码等,以及与个人识别相关的数据。由于EPM是GEIH的一个子样本,因此允许使用目录、序列和顺序变量作为标识键,并使用来自前一年同一月份的GEIH数据。 通过这个过程,旨在确保统计机密性和同时便于信息的使用。 微观数据匿名化验证 --------------------------- 主题团队将审查必须匿名化的变量,确保这些变量不会在DANE的网站上发布。 专家委员会 --------------------------- 由于移民脉搏调查是一个实验性统计,因此不存在官方专家委员会,但与世界银行、USAID、美洲开发银行进行工作坊,以确定主题、问卷、样本、收集方法,并讨论结果,以支持调查的官方性。
提供机构:
microdatos.dane.gov.co
二维码
社区交流群
二维码
科研交流群
商业服务