Encuesta longitudinal de Protección Social - ELPS 2012 - Colombia
收藏microdatos.dane.gov.co2017-09-25 更新2025-03-24 收录
下载链接:
https://microdatos.dane.gov.co/index.php/catalog/194
下载链接
链接失效反馈官方服务:
资源简介:
Resumen
---------------------------
El DANE para desarrollar su objetivo misional de producir estadísticas oficiales que cumplan con los estándares internacionales y que sirvan para la toma de decisiones, en cooperación con el Departamento Nacional de Planeación (DNP), propuso realizar una encuesta longitudinal de carácter oficial para Colombia que permitiera observar la dinámica del ingreso y consumo de los hogares, sus dinámicas en el mercado laboral, factores de riesgo y vulnerabilidad frente a choques externos, la efectividad de las políticas de protección social, monitorear condiciones de calidad de vida de la población, así como las dinámicas de movilidad social.
Posteriormente, en línea con el objetivo establecido de desarrollar una encuesta panel oficial para Colombia, el Ministerio de Hacienda y Crédito Público y el DNP expresaron su interés para trabajar conjuntamente con el Banco Interamericano de Desarrollo (BID), en el diseño de una Encuesta Longitudinal de Protección Social para Colombia, en el marco de un proyecto regional. Esta cooperación incluyó el apoyo de los equipos técnicos del Centro de Microdatos de Chile, quienes realizaron visitas periódicas para asesorar el desarrollo e implementación permanente de la encuesta panel.
Como resultado de lo anterior, se implementó de manera conjunta la Encuesta Longitudinal de Protección Social para Colombia (ELPS), que mide las dinámicas y los cambios que tiene un hogar a lo largo del tiempo en relación con el sistema de protección social, y sus factores asociados como el mercado laboral, la educación, entre otros. Con los datos obtenidos se podrán diseñar, implementar y evaluar reformas orientadas a la mejoría del sistema de protección social en el país.
La ELPS es una encuesta de muestreo probabilístico, representativa a nivel nacional en cabecera y resto, y en el total nacional en cinco regiones: Bogotá, D.C., Región Atlántica, Región Oriental, Región Central y Región Pacífica. Entre octubre y diciembre de 2012 se recogió la línea base en 14.407 hogares aproximadamente. Se aplicó un cuestionario de 12 capítulos que abarcan diversas temáticas como el acceso al sistema pensional, la pertenencia al sistema de seguridad social en salud, el cuidado de menores, educación, mercado, historia y trayectoria laboral de los colombianos, entre otras. El cuestionario cuenta con cerca de 422 preguntas, y se aplica a todos los hogares seleccionados en la muestra.
El levantamiento de la línea base se realizó en 2012, en donde se seleccionaron a las personas de seguimiento de acuerdo a la siguiente regla:
1. Jefe de hogar.
2. Cónyuge del jefe de hogar.
3. Una persona de 10 años o más (controlando por sexo y edad).
4. Todos los menores de 10 años.
Para mantener el contacto con estas personas, se diseñó una estrategia de seguimiento se llevará a cabo entre 2013 y 2014. Posterior a este, la recolección preguntas que permitan discriminar los cambios en las variables de interés y temáticas nuevas. Entre rondas, se realizará un operativo de seguimiento a los individuos seleccionados para la encuesta, con el fin de actualizar sus datos de contacto.
El documento presenta la metodología de la línea base y está constituido por seis capítulos. El primero, contiene los antecedentes de la investigación; el segundo, expone la fase de diseño; el tercero, hace referencia a la producción estadística; el cuarto, trata el análisis y discusión de resultados; el quinto se refiere a la difusión de los resultados de la operación estadística, y en el sexto capítulo se detalla la documentación relacionada.
Geographic coverage
---------------------------
Para esta encuesta se constituyeron seis (6) dominios, así: Región Atlántica, Región Oriental, Región Central, Región Pacífica, Bogotá, D.C., y Orinoquia-Amazonia
Analysis unit
---------------------------
UNIDAD DE OBSERVACIÓN
La unidad de observación está constituida por los hogares y las personas.
UNIDAD DE MUESTREO
La unidad de muestreo es la medida de tamaño o segmento. El segmento corresponde a un área con promedio de 10 viviendas (variando entre 7 y 14).
Universo de estudio
---------------------------
Está conformado por la población civil no institucional residente en todo el territorio nacional.
Kind of data
---------------------------
Encuesta por muestreo (ssd)
Sampling procedure
---------------------------
MAARCO MUESTRAL
Se parte de una muestra maestra correspondiente a la información recolectada en los censos (actualizada con el Censo General de Población y Vivienda de 2005), a partir de las cuales se conformaron submuestras utilizando la estratificación y las UPM constituidas en el diseño de la Muestra Maestra.
TIPO DE MUESTREO
El marco muestral está constituido por el inventario cartográfico y el archivo agregado de viviendas y hogares a nivel de manzana, para cabeceras municipales y centros poblados, y el agregado a nivel de sección cartográfica para el resto; datos generados a partir de la información del Censo General de Población y Vivienda de 2005. Es un muestreo probabilístico, de conglomerados, estratificado y multietápico.
Se utilizó el muestreo de conglomerados porque permite minimizar los costos de la recolección, aunque el error estándar de las estimaciones se incrementa en forma moderada, lo que se reduce considerablemente estratificando por tamaño los conglomerados. Las siguientes son las categorías de conglomerados de la muestra:
- Unidades Primarias de Muestreo (UPM): se denominan así los municipios de 7.000 y más habitantes. Los municipios de menor tamaño se han combinado con algún vecino de similares características, para completar un tamaño mínimo de 7.000 habitantes, y así garantizar los requerimientos de tamaño muestral a este nivel.
- Unidades Secundarias de Muestreo (USM): son las manzanas en las cabeceras municipales y secciones en el resto del municipio.
- Unidades Terciarias de Muestreo (UTM): son los segmentos o medidas de tamaño MT (áreas de 10 viviendas en promedio) tanto en la cabecera como en el resto del municipio, con límites naturales fácilmente identificables, en los cuales se encuestan todos los hogares.
Los criterios de estratificación fueron:
El primer estrato corresponde a las veintitrés capitales y áreas metropolitanas de las cuales se seleccionó una muestra. Para la estratificación y selección de la muestra, las áreas geográficas se organizaron según la nomenclatura cartográfica establecida, en sectores, secciones y manzanas con la información del número de viviendas en el nivel de manzana y por estrato socio-económico.
El segundo estrato corresponde al resto de cabeceras, centros poblados y zona rural dispersa. Los municipios se subestratificaron de acuerdo con los siguientes criterios:
- Geográficos, a nivel de departamento.
- Socioeconómicos, a nivel de UPM, con los siguientes indicadores:
- Tamaño del municipio en términos de población.
- Nivel de urbanización, en función de la cantidad de población de las cabeceras municipales.
- Estructura urbano-rural de la población municipal (% de población en cabecera).
- Proporción de la población con necesidades básicas insatisfechas (NBI), que su vez se clasificó en 4 intervalos: A [0-29,8%); B [29,8%- 42,7%); C [42,7%-57,3%), y D [57,3%-100%].
Los municipios cuyo tamaño era similar al tamaño promedio de los estratos, se constituyeron en UPM de certeza o inclusión forzosa, con probabilidad 1. Las demás UPM se agruparon en estratos de no certeza o inclusión probabilística, aplicando las variables de estratificación en el orden de prioridad especificado anteriormente. De cada estrato de no certeza, se seleccionó una UPM con probabilidad proporcional al tamaño de su población (PPT), utilizando la Técnica de Selección Controlada (ver Goodman y Kish, 1950), para optimizar su composición interdepartamental e interregional.
La muestra maestra para el estrato de inclusión probabilística contiene 763 UPM con las cuales se conformaron 360 estratos y para la submuestra de la ELPS se agregaron en 60 estratos para la representatividad por región, de cada uno de estos estratos se seleccionó una UPM. La probabilidad de selección de las UPM se calcula dividiendo la población total de cada UPM por la población del estrato.
TAMAÑO DE LA MUESTRA
Los cálculos se hicieron con fórmulas correspondientes un diseño muestral aleatorio simple de elementos (MAS) ajustado por un efecto de diseño (DEFF). El efecto de los conglomerados en el diseño, es una relación, para cada dominio, entre la varianza real de este diseño de conglomerados y la que se obtendría con un diseño aleatorio simple de elementos (MAS). Los valores de DEFF provienen de los resultados de las diferentes encuestas que se realizan con regularidad.
Teniendo en cuenta la duración del estudio y la disponibilidad de recursos, el tamaño de muestra se decidió en investigar inicialmente 15.000 hogares.
Con estos tamaños y aplicando fórmulas correspondientes a un diseño aleatorio simple de elementos (MAS) y ajustado con un efecto de diseño (DEFF) de 1,5 y un nivel de confianza de 95% se espera estimar para el total nacional proporciones mayores del 10% con un error de muestreo del 3% y para cada región proporciones mayores del 10% con un error de muestreo del 5%.
Mode of data collection
---------------------------
Entrevista personal asistida con DMC (dispositivo móvil de captura)
Research instrument
---------------------------
La ELPS se ha diseñado con el objetivo de recopilar datos importantes de múltiples variables. Para lograr el propósito de la investigación, se planteó un formulario que consta de 12 capítulos en los cuales se obtiene información de viviendas, hogares y personas. A continuación se hace una breve descripción de cada capítulo con sus objetivos:
IDENTIFICACIÓN Y CONTROL
Tiene por objetivo identificar la ubicación de las viviendas y los hogares, así como efectuar un control de calidad en la respectiva recolección de las encuestas.
- Capítulo A: datos de la vivienda (sólo para hogar 01 de la vivienda) Tiene por objetivo captar información relacionada con las correspondientes características de las viviendas, acceso a servicios públicos y problemas en la estructura de la misma.
- Capítulo B: servicios del hogar (para todos los hogares de la vivienda) Tiene por objetivo identificar información relacionada con la cantidad de personas en el hogar hacinamiento crítico, tipo y calidad de los servicios con que cuente el hogar.
- Capítulo C: características y composición del hogar (para todas las personas del hogar) Tiene por objetivo identificar las personas que conforman el hogar y establecer el parentesco con el jefe de hogar. Además, obtener información sobre el nivel de estudios alcanzado por el padre y la madre cuando no hacen parte del mismo, y datos de migración.
- Capítulo C1: datos de contacto (para todas las personas del hogar) Tiene por objetivo registrar teléfonos fijos, celulares y correos electrónicos de las personas del hogar. Igualmente, si piensan cambiar de domicilio en los próximos dos años y el lugar al cual piensa cambiar de domicilio. Para todos los encuestados, se pregunta por una persona de contacto (que no viva en el hogar,) y sus datos, a la que se pueda contactar en caso de un cambio de domicilio.
- Capítulo D: cuidado de niños y niñas menores de cinco años Tiene por objetivo identificar la persona o institución, sobre la cual recae la responsabilidad de la atención y cuidado de los niños menores de 5 años; determinar la cobertura de los establecimientos públicos y privados destinados a la protección y aprendizaje del menor; alimentación de los menores en el lugar donde permanecen la mayoría del tiempo; actividades que realizan los padres con los niños; y asistencia a control de crecimiento y desarrollo de los
menores.
- Capítulo E: educación (para todas las personas de 5 años o más) Tiene por objetivo identificar las principales características educativas de la población de 5 años y más (alfabetismo, asistencia escolar, niveles alcanzados y años de estudio). Asimismo: las razones de inasistencia de la población en edad escolar; determinar la cobertura de subsidios y créditos educativos; determinar los programas, carreras o cursos de formación para el trabajo que ha realizado la persona, la institución en que se desarrolló y la forma de financiación. Adicionalmente, tiene un módulo de historial de educación superior.
- Capítulo F: salud (para todas las personas del hogar) Tiene por objetivo obtener información sobre la cobertura del SGSSS. Este capítulo indaga acerca de la afiliación de la población por regímenes, población con presencia de enfermedades crónicas y limitaciones permanentes.
Asimismo, examina sobre las acciones tomadas por alguna enfermedad o problema médico en los últimos doce meses, la realización de exámenes de prevención y hábitos de vida saludables.
- Capítulo G: pensiones (para todas las personas de 15 años y más) Tiene por objetivo determinar la cobertura del régimen pensional en la población. Se busca indagar las razones por las cuáles las personas no cotizan actualmente, y los incentivos para aumentar el monto de cotización.
- Capítulo H: fuerza de trabajo (para todas las personas de 10 años o más) Tiene por objetivo investigar cuáles personas dentro del hogar devengan ingresos y quienes están en capacidad de hacerlo, como resultado de la vinculación al mercado laboral o por otras actividades o transferencias. Indaga también sobre aspectos relevantes para las personas que reciben ingresos laborales como: la categoría ocupacional, las horas trabajadas, el sitio de trabajo, el acceso a la seguridad social, entre otros. Igualmente busca identificar la existencia de un segundo trabajo, el tipo de contrato y el nivel de
formalidad de los mismos.
- Capítulo I: historia laboral (para todas las personas de 10 años o más) Tiene por objetivo determinar la historia laboral de los últimos tres años de las personas de 10 años y más del hogar que están en edad de trabajar. Al conformar esta historia, se puede determinar la rotación laboral y las características de las diferentes actividades laborales que han desarrollado las personas del hogar durante los últimos 3 años.
- Capítulo J: trayectoria laboral (para todas las personas de 10 años o más) Tiene por objetivo caracterizar el primer trabajo de los encuestados como actividad principal, su cotización a un fondo de pensiones por este y el tiempo total que llevan trabajando desde esta primera actividad hasta el momento de la encuesta.
- Capítulo K: activos y riesgos (para el jefe del hogar o su cónyuge) Tiene por objetivos: establecer la condición de ocupación de la vivienda por parte del hogar; determinar las fuentes de financiación para la compra de vivienda que ocupa el hogar; obtener información con respecto a los subsidios para vivienda otorgados por el gobierno, y sobre el monto de los gastos en que incurre el hogar por la vivienda que ocupa. Asimismo, busca identificar algunos choques o eventos importantes (muertes, separación, pérdida de empleos, pérdidas económicas, afectaciones derrumbe de tierras, conflicto, entre otros)
por que ha sufrido el hogar en los últimos 12 meses y sus principales medidas de acción para contrarrestarlos. Por último, el capítulo indaga por la población beneficiaria de programas o subsidios estatales.
- Capítulo L: gastos de los hogares Tiene por objetivos: captar el nivel de gasto de los hogares de acuerdo con grupos y subgrupos de artículos, bienes y servicios, así como los patrones y la
estructura del mismo; establecer gastos en bienes y servicios a los que pueden acceder los hogares con el fin de realizar análisis de bienestar, y clasificar el gasto de los hogares según la periodicidad con que se adquieran los bienes y servicios.
Cleaning operations
---------------------------
TRANSMISIÓN DE DATOS A DANE CENTRAL
Este proceso comenzó con la consolidación y la preparación de los datos en las diferentes sedes y subsedes del DANE. Una vez culminada esta primera fase, se ejecutó el software Swing con el que se organizan y comprimen los datos en un archivo .Zip para su transmisión al DANE Central vía FTP (File Transfer Protocol), garantizando de esta manera la integridad desde su origen. Para esto, se asignó un usuario y contraseña al asistente informático de cada una de las 23 ciudades del país con el fin que utilizaran este medio de transmisión. En el buzón FTP se creó una estructura de directorios definida para las áreas de cartografía, logística y sistemas, donde se depositaron los datos y demás informes requeridos durante el operativo. Este medio fue monitoreado diariamente con el fin de mantener un procesamiento continuo de toda la información recibida.
La transmisión de datos se realizó durante todo el operativo, y el cargue de información se realizaba los días martes de cada semana.
CONSOLIDACIÓN DE ARCHIVOS
Una vez recibidos los datos, se almacenaron en el servidor del DANE Central en una estructura que permite identificar la procedencia y fecha de envío. A continuación se descomprimían los envíos y se ejecutaba el proceso de detección y eliminación de archivos duplicados a través de la herramienta CLONESPY. Durante este paso, se generaba un log (archivo de texto) con la información recibida y los archivos detectados como duplicados.
Luego de la eliminación de duplicados, se realizaba un proceso mediante un aplicativo desarrollado en lenguaje JAVA, que clasificaba los datos y los organizaba en una subdivisión de carpetas así: encuestas completas, encuestas incompletas y archivos de geo-referenciación. Hasta este punto, los datos permanecían encriptados con el fin de garantizar la seguridad de los mismos hasta el momento que la información era cargada a la base de datos.
Después de clasificar los datos, se realizaba la desencriptación a través de un aplicativo generado con comandos .bat, herramienta Visual Fox y el crgz. Posteriormente se hacía una verificación de estructuras con el fin de garantizar que los datos recibidos corresponden a la investigación asignada y al periodo de referencia. Este proceso también se realizaba utilizando un aplicativo desarrollado en Visual Fox.
Cuando los procesos anteriormente mencionados eran ejecutados, los archivos dbf estaban listos para ser cargados en la base de datos Oracle, mediante un aplicativo escrito en lenguaje Java, que generaba un log con la información del proceso de carga. A partir de este momento, el procesamiento de datos se realizaba en la base de datos.
PROCESO DE CARGA DE LA INFORMACIÓN
Inicialmente, los datos cargados en la base quedaban dispuestos en dos estructuras de almacenamiento, que correspondían a encuestas completas y encuestas incompletas. Este procedimiento de almacenamiento es idéntico en cada una de las encuestas donde la información sea recolectada mediante SysSurvey vía DMC. Una vez que los datos se encontraban bajo este medio de almacenamiento vertical, se efectuaba un proceso de transporte de los datos a tablas que corresponden a los capítulos temáticos de la encuesta. Es así que esta investigación quedaba almacenada en su propio esquema de base de datos. Esto permitió que los datos se mantuvieran aislados de la información de otras investigaciones y los permisos de acceso a los usuarios se realizaran mediante los mecanismos de roles y privilegios propios del sistema manejador de base de datos.
Response rate
---------------------------
PROCEDIMIENTO DE ESTIMACIÓN
Los resultados de la muestra son representativos de la población objetivo total; por tanto, éstos se deben expandir a partir de cada segmento seleccionado con el fin de producir estimaciones válidas de dicha población.
Los componentes del factor de expansión se explican a continuación:
FACTOR BÁSICO DE EXPANSIÓN (F).
Aplicado a los datos muestrales proporciona a cada elemento de la muestra el peso o representación que le corresponde en el universo investigado. En consecuencia, mediante su aplicación, se estiman numéricamente, en forma aproximada, las características de dicho universo.
PESO DE SUB-MUESTREO (Ph)
Está dado por segmento y teóricamente es igual a 1 para todos los segmentos en razón que representa una medida de tamaño. Sin embargo, en algunos casos por el desarrollo dinámico del marco de muestreo puede hacer que este peso sea mayor o menor que 1, de acuerdo con la densidad de viviendas del segmento en el momento de hacer la encuesta; por tal motivo, modifica el factor básico de expansión en el segmento.
AJUSTE DE COBERTURA POR NO-RESPUSTA (Rh)
Es importante, cuando las tasas de no-respuesta varían en los subgrupos de la población de diferentes características (ejemplo, en los estratos socioeconómicos). En este caso, la nocorrección, daría lugar a estimaciones sesgadas para el conjunto de la población estudiada. El ajuste habitual es asignar a los hogares y personas no encuestadas, el promedio de las características de los encuestados en el mismo segmento. Esto se logra, corrigiendo el factor básico de expansión por un nuevo factor resultante de la razón entre número de hogares seleccionados en un segmento y el número de hogares encuestados en el mismo segmento.
Sampling error estimates
---------------------------
DISEÑO DE LA EVALUACIÓN
Una vez terminada la encuesta, se produce un documento que recoge los resultados de las evaluaciones de calidad que se realizaron durante todo el proceso. Los principales insumos para esta evaluación son:
1. Monitoreos: durante el desarrollo de la encuesta se realizaron múltiples acompañamientos en campo para verificar la calidad de la información recolectada. Así mismo, estos monitoreos permitieron visibilizar problemas en la redacción de las preguntas, flujos, conceptos, etc., que hayan causado problemas a los encuestados y/o encuestadores.
2. Revisión de frecuencias: una vez consolidada la información, la revisión de frecuencias permitió aclarar en cada una de las preguntas, si las opciones contempladas estaban completas, o si se omitieron opciones de respuestas que se codificaron en la opción otro. Lo anterior permite crear una alerta para las próximas encuestas en la formulación del cuestionario.
3. Revisión de los datos en comités internos o externos: Los resultados de la encuesta se presentaron ante los comités internos y externos, generando alertas de inconsistencias o problemas de recolección que pueden solucionarse en tomas posteriores.
摘要
---------------------------
国家人口普查局(DANE)为达成其使命目标,即生产符合国际标准并为决策提供依据的官方统计数据,与国家发展规划部(DNP)合作,提议对哥伦比亚进行一项官方性的纵向调查,以观察家庭收入和消费的动态变化,家庭在劳动力市场的动态变化,以及对外部冲击的风险和脆弱性因素,评估社会保护政策的有效性,监测人口生活质量,以及社会流动性动态。
随后,根据制定的目标,即开发一项针对哥伦比亚的官方性面板调查,财政部和DNP表示愿意与美洲开发银行(BID)合作,设计一项针对哥伦比亚的社会保护纵向调查,作为一项区域项目的一部分。该合作包括智利微观数据中心的技术团队的支持,他们定期访问以指导调查面板的持续开发和实施。
作为上述合作的结果,共同实施了哥伦比亚社会保护纵向调查(ELPS),该调查衡量家庭在时间上与社会保障系统及其相关因素(如劳动力市场、教育等)的动态变化和变化。通过获得的数据,可以设计、实施和评估旨在改善国家社会保障系统的改革。
ELPS是一项抽样调查,在全国范围内具有代表性,包括首都和其他地区,并在五个地区进行全国调查:波哥大,大西洋地区,东方地区,中央地区和太平洋地区。2012年10月至12月,大约在14,407个家庭中收集了基线数据。应用了包含12个章节的问卷,涵盖各种主题,如养老金体系的可及性、加入社会健康保险系统、照顾儿童、教育、市场、哥伦比亚人的历史和职业轨迹等。问卷包含约422个问题,针对样本中选定的所有家庭进行应用。
基线调查于2012年进行,根据以下规则选择了追踪对象:
1. 家庭负责人。
2. 家庭负责人的配偶。
3. 10岁或以上的人员(控制性别和年龄)。
4. 所有10岁以下的儿童。
为了与这些人员保持联系,设计了一种2013年至2014年的追踪策略。此后,将收集问题,以区分对感兴趣变量的变化和新主题的讨论。在轮次之间,将对调查中选定的个体进行追踪操作,以更新他们的联系信息。
本文件介绍了基线调查的方法,由六个章节组成。第一个章节包含研究的背景;第二个章节阐述了设计阶段;第三个章节涉及统计生产;第四个章节处理结果的分析和讨论;第五个章节介绍了统计操作结果的推广;第六个章节详细说明了相关文件。
地理覆盖范围
---------------------------
对于这项调查,共构成了六个(6)区域,具体如下:大西洋地区、东方地区、中央地区、太平洋地区、波哥大,D.C.和奥里诺科-亚马孙地区。
分析单位
---------------------------
观察单位
由家庭和个人组成。
抽样单位
抽样单位是大小或段落的度量。段落对应一个平均有10个住宅的区域(介于7和14个之间)。
研究范围
---------------------------
由全国所有非机构化居民组成。
数据类型
---------------------------
抽样调查(ssd)
抽样程序
---------------------------
MAARCO MUESTRAL
从在人口普查中收集的信息中开始,这些信息是根据2005年人口普查和住宅普查更新的,然后使用Muestra Maestra的设计中的UPM进行了子样本的构建。
抽样类型
样本框架由地图和住宅及家庭档案组成,这些档案在街区、市镇中心和聚居区层面进行汇总,并在其他地区进行街区层面的汇总;这些数据是从2005年人口普查和住宅普查中获得的信息生成的。这是一个概率性的、聚类的、分层和多阶段的抽样。
使用聚类抽样是因为它有助于降低收集成本,尽管估计的标准误差会适度增加,但这可以通过对聚类进行分层来大幅度减少。以下是从样本中选择的聚类类别:
- 抽样单元(UPM):被称为有7,000人以上的市镇。较小规模的市镇已与具有相似特征的某个邻近市镇相结合,以完成至少7,000人的最小规模,从而确保在此层面的样本大小要求。
- 抽样二级单元(USM):是市镇中心的街区和其他地区的市镇中的街区。
- 抽样三级单元(UTM):是街区或度量标准MT(平均10个住宅的区域)既在市镇中心也在其他地区,在这些街区中调查所有家庭。
分层标准如下:
- 第一个分层对应于二十三个首都和大都市地区,从中选择了一个样本。为了分层和样本选择,根据地图学命名法,地理区域被组织成部门、区和街区,并使用街区层面的住宅数量和分层社会经济标准的信息。
- 第二个分层对应于其余的市镇中心、聚居区和分散的农村地区。市镇根据以下标准进行次分层:
- 地理的,在部门层面。
- 社会经济的,在UPM层面,以下指标包括:
- 市镇人口规模。
- 城市化水平,根据市镇中心的总人口数量。
- 市镇人口的城市-农村结构(在市镇中心的人口百分比)。
- 拥有未满足基本需求的人口的比例(NBI),该比例被划分为4个区间:A [0-29,8%);B [29,8%- 42,7%);C [42,7%-57,3%),和D [57,3%-100%]。
与平均分层规模相似的市镇构成了确定性或强制包含的UPM,其概率为1。其他UPM被组合在不确定性或概率包含的分层中,应用分层变量按照先前指定的优先顺序。从每个不确定性分层中,选择一个UPM,其概率与该UPM的人口规模成比例(PPT),使用控制选择技术(参见Goodman和Kish,1950年),以优化其跨部门和跨地区的组成。每个不确定性分层的样本包含763个UPM,其中形成了360个分层,并为ELPS的子样本增加了60个分层,以实现按地区的代表性,从每个这些分层中,选择了一个UPM。UPM选择的概率通过将每个UPM的总人口除以分层的总人口来计算。
样本大小
计算使用与元素简单随机抽样(MAS)设计相对应的公式,并调整了设计效应(DEFF)。聚类设计在设计中,对于每个领域,是该聚类设计的实际方差与简单随机元素设计(MAS)所获得的方差之间的比率。DEFF的值来自定期进行的不同调查的结果。考虑到研究的持续时间和资源的可用性,决定最初调查15,000个家庭。
考虑到这些大小,并应用与元素简单随机抽样(MAS)和调整设计效应(DEFF)为1.5以及95%置信水平的相应公式,预计可以估计全国比例大于10%的估计误差为3%,以及每个地区比例大于10%的估计误差为5%。
数据收集方式
---------------------------
辅助设备(DMC)的个人访谈
研究工具
---------------------------
ELPS旨在收集多个变量的重要数据。为了实现研究目标,提出了一份包含12个章节的表格,其中收集有关住宅、家庭和个人的信息。以下是每个章节的简要描述及其目标:
识别和控制
旨在识别住宅和家庭的位置,以及执行有关调查收集的质量控制。
- 章节A:住宅数据(仅针对住宅的第一个家庭)旨在收集有关住宅相应特征的信息,公共服务的可及性以及住宅结构的任何问题。
- 章节B:家庭服务(针对住宅中的所有家庭)旨在识别与家庭中人数、拥挤程度、家庭所拥有的类型和质量的服务相关的信息。
- 章节C:家庭特征和组成(针对家庭中的所有人员)旨在识别构成家庭的人员,并确定与家庭负责人之间的亲属关系。此外,获取有关父亲和母亲的教育水平信息,如果他们不是家庭的一部分,以及移民数据。
- 章节C1:联系数据(针对家庭中的所有人员)旨在记录家庭人员的固定电话、移动电话和电子邮件地址。同样,如果他们计划在接下来的两年内更换住所,以及他们计划更换的住所。对于所有受访者,都询问一个联系人(不居住在家庭中),以及其数据,以便在更换住所时可以联系到该联系人。
- 章节D:照顾五岁以下儿童的人或机构
旨在确定负责照顾和照顾五岁以下儿童的人员或机构;确定公共和私人机构对儿童的保护和学习的覆盖率;在儿童大部分时间停留的地方提供儿童的饮食;父母与儿童一起进行的活动;以及儿童的成长和发展的监测。
- 章节E:教育(针对5岁或以上的人员)旨在识别5岁及以上人口的主要教育特征(识字、入学、达到的水平和学习年数)。此外:确定学龄人口缺课的原因;确定教育补贴和信贷的覆盖率;确定个人完成的教育、培训机构及其融资方式。此外,还包含一个高等教育历史模块。
- 章节F:健康(针对家庭中的所有人员)旨在获取有关社会保障体系覆盖范围的信息。本章节调查了人口根据不同制度进行参保的情况,以及存在慢性疾病和永久性限制的人口。此外,调查了过去十二个月中任何疾病或医疗问题所采取的行动,预防性检查的实施以及健康生活方式的习惯。
- 章节G:养老金(针对15岁或以上的人员)旨在确定养老金制度的覆盖率。旨在调查为什么人们目前没有缴纳保险,以及增加缴纳金额的激励措施。
- 章节H:劳动力(针对10岁或以上的人员)旨在调查家庭中哪些人获得收入,以及哪些人有能力通过参与劳动力市场或其他活动或转移获得收入。调查也涉及有关获得劳动收入的人员的相关方面,如职业类别、工作时间、工作地点、社会保障的可及性等。此外,还寻找是否存在第二份工作,合同类型以及其正式程度。
- 章节I:历史劳动(针对10岁或以上的人员)旨在确定家庭中10岁及以上且在工作年龄的人员在过去三年中的劳动历史。在构建这个历史时,可以确定劳动力的流动性和家庭在过去三年中从事的不同活动的特征。
- 章节J:职业轨迹(针对10岁或以上的人员)旨在描述受访者的第一份工作作为主要活动,以及为此工作缴纳养老金基金的时间和从该第一份工作到调查时的总工作时间。
- 章节K:资产和风险(针对家庭负责人或其配偶)旨在确定家庭占用住宅的条件;确定购买家庭占用住宅的资金的来源;获取有关政府提供的住宅补贴的信息,以及家庭为占用住宅所承担的支出。此外,寻找家庭在过去12个月中遭受的某些冲击或重要事件(死亡、分居、失业、经济损失、土地崩塌、冲突等),以及其主要的应对措施。最后,本章节调查了受益于政府计划或补贴的人口。
- 章节L:家庭支出
旨在根据商品、商品和服务分组和子分组捕获家庭的支出水平;确定家庭可以获取的商品和服务的支出,以便进行福利分析,并根据获取商品和服务的周期对家庭支出进行分类。
数据清理操作
---------------------------
数据传输到DANE中央
此过程从在DANE的不同分支机构和分机构中巩固和准备数据开始。一旦完成第一阶段,就执行Swing软件,将数据组织并压缩成一个.Zip文件,通过FTP(文件传输协议)将其传输到DANE中央,从而保证从源头开始的数据完整性。为此,为每个国家的23个城市分配了一个用户名和密码,以便使用这种传输方式。在FTP文件夹中创建了一个定义明确的目录结构,用于地图、物流和系统领域,其中放置了数据和其他在操作期间所需的报告。每天对该手段进行监控,以保持对整个接收到的信息的持续处理。
数据传输在整个操作期间进行,信息上传在每周的周二进行。
档案合并
接收数据后,将它们存储在DANE中央的服务器上,其结构允许识别数据的来源和发送日期。接下来,解压缩发送,并使用CLONESPY工具执行检测和删除重复文件的过程。在此步骤中,生成一个包含接收到的信息和检测到的重复文件的日志(文本文件)。
删除重复文件后,通过一个用JAVA语言开发的程序执行了一个过程,该程序将数据分类并组织到一个子文件夹中,如:完整调查、不完整调查和地理参考文件。在此阶段,数据保持加密状态,以确保在信息加载到数据库之前的安全性。在分类数据后,通过一个用.bat命令、Visual Fox工具和crgz生成的应用程序进行解密。随后,进行结构验证,以确保接收到的数据与分配的研究和参考期相符。此过程也使用Visual Fox应用程序进行。
当执行上述过程时,dbf文件已准备好通过一个用JAVA语言编写的应用程序加载到Oracle数据库中,该应用程序生成一个包含加载过程信息的日志。从此时起,数据在数据库中进行处理。
信息加载过程
最初,加载到数据库中的数据被安排在两个存储结构中,分别对应完整调查和不完整调查。在每个通过SysSurvey和DMC收集信息的调查中,该存储过程都是相同的。一旦数据位于这种垂直存储方式中,就执行了一个将数据传输到与调查主题章节相对应的表的过程。因此,这项研究存储在其自己的数据库模式中。这允许数据与其他研究的信息保持隔离,并且通过数据库管理系统本身的角色和权限机制执行用户访问权限。
应答率
---------------------------
估计程序
样本的结果是对目标总体总体的代表性;因此,必须从每个选定的段扩展这些结果,以产生该总体的有效估计。
以下是对扩展因子组成部分的解释:
- 基础扩展因子(F)。
应用于样本数据,为样本中的每个元素提供其在调查总体中的权重或代表性。因此,通过其应用,可以近似地以数值形式估计该总体的特征。
- 子样本权重(Ph)。
由段给出,理论上对所有段都是1,因为它是大小的度量。然而,在某些情况下,由于抽样框架的动态发展,可能会导致这个权重大于或小于1,这取决于在调查时该段住宅的密度;因此,修改了该段的基线扩展因子。
- 应答率调整(Rh)。
当不同特征的子群体中的应答率不同时(例如,在社会经济分层中)。在这种情况下,不进行纠正会导致对研究总体的估计有偏差。通常的做法是将未调查的家庭和人员分配给与同一段中调查者相同的平均特征。这通过纠正基线扩展因子来实现,通过一个新因子实现,该因子是同一段中选定的家庭数量与调查的家庭数量之间的比率。
抽样误差估计
---------------------------
评估设计
一旦完成调查,就会产生一个文件,其中收集了在整个过程中进行的质量评估的结果。该评估的主要投入包括:
1. 监控:在调查过程中进行了多次现场陪同,以验证收集到的信息的质量。同样,这些监控允许揭示在问题编写、流程、概念等方面存在的问题,这些问题可能给受访者或调查员带来了麻烦。
2. 频率审查:一旦信息得到整合,频率审查有助于澄清每个问题,看看是否包含了所有选项,或者是否省略了编码在“其他”选项中的响应选项。这允许为下一次调查创建警报,以在问卷制定中进行。
3. 内部或外部委员会的数据审查:将调查结果提交给内部和外部委员会,生成有关不一致或可解决收集问题的警报,这些问题可以在后续调查中解决。
提供机构:
microdatos.dane.gov.co



