five

Gran Encuesta Integrada de Hogares - GEIH - 2012 - Colombia

收藏
microdatos.dane.gov.co2020-04-15 更新2025-03-22 收录
下载链接:
https://microdatos.dane.gov.co/index.php/catalog/77
下载链接
链接失效反馈
官方服务:
资源简介:
Resumen --------------------------- El Departamento Administrativo Nacional de Estadística - DANE ha desarrollado encuestas de hogares desde finales de la década del 60 cuando adelantó encuestas de fuerza de trabajo e ingresos y gastos de manera transversal. La recolección de la Gran Encuesta Integrada de Hogares empezó el 7 de agosto de 2006 en su módulo central de mercado laboral e ingresos y, a partir del 11 de septiembre, con su módulo de gastos de los hogares. A partir del 10 de julio de 2006 se amplió la cobertura de la ECH a 11 ciudades adicionales a las trece principales ciudades y áreas metropolitanas, al resto de cabeceras y al resto rural; cobertura que en la actualidad mantiene la GEIH. ç En este documento podrá encontrar la evolución histórica de la medición del mercado laboral en Colombia y las principales características técnicas de la Gran Encuesta Integrada de Hogares. La explicación del marco conceptual y diseño temático de la encuesta respaldada por recomendaciones de organismos internacionales que regulan y estandarizan los conceptos con el fin de asegurar la comparabilidad entre los países en materia de mercado laboral. La descripción del diseño estadístico permite tener claridad sobre el marco muestral y los procedimientos de definición de la muestra y el alcance de la misma en términos de estimación y análisis de resultados. Así mismo el documento expone cada proceso de la producción estadística desde las actividades preparatorias al operativo de campo, pasando por la recolección, la transmisión y procesamiento de datos y los métodos de control de calidad, para finalizar con los procesos de análisis y difusión de los datos. A este documento lo acompañan como anexos el formulario de la encuesta, el listado de cuadros disponibles al público por medio del banco de datos y el listado de clasificaciones internacionales adoptadas por la Gran Encuesta Integrada de Hogares. Geographic coverage --------------------------- Tiene cobertura nacional que permite obtener resultados para cabeceras y resto, ciudades y áreas metropolitanas, grandes regiones y total por departamento. Para mercado laboral, se excluyen los nuevos departamentos. Analysis unit --------------------------- La unidad de muestreo es la Medida de Tamaño, MT, o segmento. La medida de tamaño o segmento está conformada por un promedio de diez viviendas las cuales se indagan todas, se incluyen todos los hogares de cada vivienda y cada persona de cada hogar. La unidad de observación son aquellos conjuntos de elementos que componen el universo con una característica específica. En este caso la unidad básica de observación es el hogar. Universo de estudio --------------------------- UNIVERSO El universo para la Gran Encuesta Integrada de Hogares está conformado por la población civil no institucional, residente en todo el territorio nacional. POBLACIÓN OBJETIVO Corresponde a la población civil no institucional residente en todo el territorio nacional; se excluyen los nuevos departamentos, denominados Territorios Nacionales antes de la Constitución de 1991, en los cuales reside aproximadamente el 4% de la población total. Esta población se encuentra dispersa en casi la mitad de la superficie del país. Kind of data --------------------------- Encuesta por muestreo (ssd) Sampling procedure --------------------------- MARCO MUESTRAL Está constituido por el inventario cartográfico y el listado de viviendas obtenidas de la Muestra Maestra de Hogares, con actualizaciones permanentes y nuevos recuentos de edificaciones y viviendas a través de la misma. TIPO DE MUESTREO Teniendo en cuenta los objetivos y las características del marco, se optó por una muestra probabilística, estratificada, de conglomerados, multietápica, los cuales se presentan a continuación: Probabilística. Cada unidad de la población objetivo tiene una probabilidad de selección conocida y superior a cero. Este tipo de muestra permite establecer anticipadamente la precisión deseada en los resultados principales, y calcular la precisión observada en todos los resultados obtenidos. Estratificada. Este método asegura una mejor precisión de la muestra, al disminuir la varianza de las estimaciones, los criterios de estratificación son: · El primer estrato corresponde a las 24 capitales y áreas metropolitanas con dominios de estudio independientes. Cada ciudad o área metropolitana es autorrepresentada. Para la estratificación y selección de la muestra, las áreas geográficas se organizaron, según los principios cartográficos establecidos, en sectores, secciones y manzanas con la información del número de viviendas a nivel de manzana y el estrato socioeconómico. · El segundo estrato corresponde al resto urbano y al resto de cabeceras, centros poblados y rural disperso. Los municipios se estratificaron de acuerdo con los siguientes criterios: - Geográficos, a nivel de regiones constituidas por varios departamentos. - Socioeconómicos, a nivel municipal, con los siguientes indicadores: - Nivel de urbanización, en términos de la cantidad de población de las cabeceras municipales. - Estructura urbano-rural de la población municipal (% de población en cabecera).Proporción de la población con necesidades básicas insatisfechas (NBI), la cual, a su vez, se clasificó en 4 intervalos: A [0-29,8%); B [29,8%-42,7%); C [42,7%-57,3%); y D [57,3%-100%]. - Tamaño poblacional del estrato. Cada municipio con 7.000 o más habitantes en su población total, se constituyó en Unidad Primaria de Muestreo, UPM. Los de menor población se agruparon con uno vecino para constituirse en UPM. Las UPM cuyo tamaño era similar al tamaño promedio de los estratos, se constituyeron en estratos de “certeza”; para efectos probabilísticos tuvieron probabilidad 1. Las demás UPM se agruparon en estratos de no certeza , aplicando las variables de estratificación en el orden de prioridad especificado antes. De conglomerados Corresponde a la unidad final de muestreo, que es la medida de tamaño o segmento; es el área que contiene un promedio de diez viviendas, en la cual se investigan todas las viviendas, todos los hogares y todas las personas. La concentración de la muestra en conglomerados presenta grandes beneficios en el nivel operativo; lo cual reduce, en forma considerable, los tiempos y los costos, y facilita la supervisión. Multietápica Unidades Primarias de Muestreo (UPM). Hay UPM de inclusión forzosa y de inclusión probabilística: - Son de inclusión forzosa las áreas metropolitanas y el resto de capitales departamentales que son autorrepresentadas, pues su tamaño muestral permite estimaciones trimestrales separadas para cada una de ellas, y aquellos municipios de tamaño intermedio cuya población es similar o mayor que el tamaño promedio de los estratos de su departamento. - Son de inclusión probabilística las UPM seleccionadas con PPT de los estratos conformados por dos o más UPM (estratos de no certeza). La técnica de selección controlada utilizada permitió mediante un procedimiento probabilístico incrementar las probabilidades de selección de las combinaciones preferidas de UPM que podían ser seleccionadas en un departamento, adicionalmente a lo obtenible con un muestreo estratificado corriente. En el caso de la Muestra Maestra la selección controlada proporcionó un mejor balance interregional en las características de las UPM seleccionado. El resultado final de este ejercicio fue lograr la máxima reducción posible en el error estándar de estimación de los resultados. Unidades Secundarias de Muestreo (USM). En las cabeceras municipales y centros poblados, las USM son grupos de manzanas contiguas del mismo municipio, que contienen un mínimo de 12 medidas de tamaño (MT) con un promedio de 10 viviendas, y en la zona rural dispersa, la USM es una sección o sector censal. El tamaño de la USM permite un control adecuado de la distribución y rotación de la muestra con cada encuesta. Para la selección de las USM se aplica el siguiente procedimiento (PPT): · Conformación, delimitación y listado de las USM por estrato socioeconómico (solo cabeceras municipales) de cada municipio seleccionado, siguiendo el orden de la nomenclatura de la cartografía censal: sector, sección y manzana. · Cálculo del número de medidas de tamaño (MT), dividiendo por 10 (el número de viviendas) y aproximando a un valor entero. · Cálculo de intervalo de muestreo (IM), dividiendo el total de MT existentes en una zona por el número de USM requeridas en la muestra de la zona. · Selección de un número de arranque entre 1 y el valor del intervalo, el cual indica la primera USM de la muestra de la zona; y selección del resto de USM de la zona, sumando sucesivamente el IM al número de arranque. Unidades Terciarias de Muestreo (UTM). El tercer paso es la selección dentro de cada USM de una o más UTM, dependiendo de las requeridas, del tamaño y cantidad de USM preseleccionadas en cada municipio. Cada UTM es un segmento con un promedio de 10 viviendas contiguas (5 a 14 viviendas), es decir, una medida de tamaño (MT). En un paso intermedio, se seleccionan manzanas en las cabeceras municipales, centros poblados y segmentos de sección rural claramente delimitados, con límites naturales (quebradas, ríos, etc.) o sociales (carreteras, caminos, etc.). Los segmentos de los sectores rurales se conforman previamente con base en fotografías aéreas y en lo posible, se procura que tengan un promedio de 10 viviendas; sin embargo, por insuficiente detalle cartográfico, los segmentos pueden tener dos o más MT. La selección se hace con probabilidad proporcional al número de MT (PPT), así una manzana o segmento rural puede contener una o más MT, y las que tienen menos de 5 viviendas se juntan con una manzana vecina del mismo estrato socioeconómico. Las áreas urbanas no urbanizadas se anexan al área o manzana vecina muy cercana con una o más viviendas con el objeto de que tengan probabilidad de selección y para que puedan captar cualquier proceso futuro de urbanización. Si solo se requiere una MT y la manzana o porción solo tiene una MT, la muestra queda constituida por todas las viviendas y hogares existentes. Si la manzana o segmento rural tienen dos o más MT se procede al recorrido y delimitación de segmentos de una MT, en el terreno. Finalmente, se hace la asignación aleatoria del orden en que entrarán los segmentos al proceso de rotación. De unidades Cuartas de Muestreo (UCM). Cada UCM es un segmento de 10 viviendas contiguas (5 a 14 viviendas), es decir una medida de tamaño MT y su selección es aleatoria. Finalmente se hace una asignación aleatoria del orden en que entrarán los segmentos al proceso de rotación. En este proceso de selección por etapas, solo se requiere una actualización cartográfica detallada de las áreas seleccionadas. Para el estrato de resto urbano y rural se seleccionó: - En una primera etapa, la UPM, utilizando la técnica de selección controlada dentro de cada estrato. - Para la segunda etapa se seleccionó en la zona urbana la manzana, y en la al resto de cabeceras, centros poblados y rural disperso la sección, o sea la USM. - En la tercera etapa se seleccionó el segmento o UTM. En este proceso de selección por etapas sólo se requiere una actualización cartográfica detallada de las áreas seleccionadas. DEFINICIÓN TAMAÑO DE LA MUESTRA Inicialmente el tamaño de la muestra mensual correspondía aproximadamente a 23 000 hogares. En el año 2000 con la implementación de la ECH la muestra maestra fue ampliada de 165 a más de 240; con 30 000 hogares en 13 áreas y 7 500 en el resto de cabeceras, centros poblados y rural disperso. Durante 2004 se amplió la muestra maestra, con un total de 44 400 hogares, con 30 000 hogares en 13 áreas y 14 400 en el resto de cabeceras, centros poblados y rural disperso. Para el año 2006 con la implementación de la GEIH, se amplió la muestra a 11 ciudades más; con 17 600 hogares adicionales, para un total de 62 000 hogares. Con el nuevo marco generado por el censo 2005, la nueva muestra implementada desde 2009 está conformada por 437 municipios y anualmente se visitan aproximadamente 248.028 hogares, concentrados en 22.548 segmentos. La muestra mensual es de 20.669 hogares, 18.790 viviendas y 1.879 segmentos. Los tamaños de muestra se calculan con una precisión deseada de la variable tasa de desempleo no superior a un error estándar relativo del 5% y una tasa de desempleo del 10%. Los cálculos se realizan con las fórmulas correspondientes al tipo de diseño muestral. Se ajustan con base en el efecto de los conglomerados en el diseño (deff), que es una relación, para cada dominio, entre la varianza real de este diseño de conglomerados y la que se obtendría con un diseño aleatorio simple de elementos. Mode of data collection --------------------------- Autodiligenciamiento asistido con DMC Research instrument --------------------------- BASE CONCEPTUAL Los marcos conceptuales aplicados sobre indicadores de mercado laboral tienen como origen las recomendaciones emanadas por la Organización Internacional del Trabajo. En materia de estadísticas laborales, Colombia en particular y en general América Latina dispone de encuestas a hogares que se levantan con regularidad desde hace más de cuatro décadas, tiempo en el cual se han tenido desarrollos teóricos y metodológicos basados en el enfoque de armonización de los principales conceptos y de las metodologías de medición del empleo. La Conferencia Internacional de Estadísticos del Trabajo -CIET- se viene reuniendo desde 1919 y ha adoptado diferentes resoluciones y recomendaciones en materia de medición de las estadísticas laborales, la decimotercera CIET, de 1983, estableció y normatizó (y aún está vigente) el marco teórico y conceptual en el cual se deben enmarcar las diferentes variables de la fuerza de trabajo (empleo, desempleo e inactividad) a saber: concepto y definición de cada una de las variables, períodos de referencia, actividad principal, reglas de prioridad de las variables, etc. Igualmente, introdujo la diferenciación de la "Población Actualmente Activa" de la "Habitualmente Activa". En el caso colombiano, las mediciones se refieren a la primera. Los indicadores de mercado laboral y específicamente la tasa de desempleo (TD) ha sido utilizada como indicador crítico para analizar el estado del comportamiento de la economía, entendiendo la tasa de desempleo como un indicador del grado de utilización de los recursos humanos de la economía, los demás indicadores de mercado laboral se deben analizar de manera simultánea. Bajo este esquema, se busca suministrar esta información para poder entender las señales que ofrece el mercado laboral sobre las condiciones de la economía, de ahí la función del DANE de proveer esta información básica y relevante sobre el estado y las tendencias de los principales indicadores del mercado laboral. El DANE mantenía la investigación según los esquemas de la CIET, pero las resoluciones adoptadas después de 1983 se reflejan completamente y con precisión óptima en los instrumentos de recolección de información vigentes hasta 1999. Por esta razón, se inició un proceso de revisión y actualización de los marcos metodológicos, muéstrales, operativos y de procesamiento de información. El proceso culminó con la adopción del “Sistema de Recolección Continuo” y la actualización de la metodología de la encuesta, tomando como base las resoluciones aprobadas por la Oficina de la Organización Internacional del Trabajo desde 1983, el nuevo Sistema de Cuentas Nacionales de 1993 (SCN-93), experiencias y prácticas internacionales y, especialmente, las particularidades del mercado laboral colombiano. El sistema, con las modificaciones señaladas, entró a regir a partir de enero del año 2000 y se le denominó Encuesta Continua de Hogares (ECH). La Gran Encuesta Integrada de Hogares, GEIH, inicia su diseño en diciembre de 2005 con un proyecto del grupo temático de la ECH sobre la aplicación de una encuesta integrada cuyo objetivo es obtener la mayor cantidad de información posible sobre un mismo hogar, de tal forma que pueda ser utilizada para la realización de investigaciones desde diferentes perspectivas, facilitando un análisis más completo de las características económicas y sociales de la población colombiana. Lo más importante del ejercicio al conformar el formulario de la GEIH, radicó en la preservación de las series principales de la ECH para no perder continuidad y capacidad de comparación; por otra parte, las preguntas nuevas se diseñaron teniendo en cuenta la necesidad de trabajar la recolección de la información con informante directo en los casos que aplique. Para la revisión del cuestionario se tuvieron en cuenta los siguientes parámetros: - Asesoría de expertos externos nacionales e internacionales y del Comité Técnico de Empleo del DANE. - Experiencias y prácticas internacionales. - Particularidades del mercado laboral colombiano. La OIT está colaborando con Colombia a través de acciones de capacitación, estudios metodológicos y programas de asistencia técnica. Un ejemplo con respecto a las últimas labores estadísticas de la OIT está relacionado con el tema del trabajo decente el cual ofrece un marco conceptual para la elaboración e integración de indicadores del mercado de trabajo. En efecto, el concepto de trabajo decente de la OIT está conformado por cuatro pilares: normas, principios y derechos fundamentales en el trabajo; empleo; protección social y diálogo social, temas que sirven de clasificadores para los indicadores de trabajo decente. En América Latina, la OIT ha establecido un conjunto de 18 indicadores de trabajo decente que permiten medir el progreso logrado en la reducción del déficit de trabajo decente registrado en los países de la región. Cleaning operations --------------------------- TRANSMISIÓN DE DATOS A DANE CENTRAL La transmisión de datos de las ciudades de la encuesta se realiza a través del FTP (sigla en inglés de File Transfer Protocol - Protocolo de Transferencia de Archivos) que es un protocolo de red para la transferencia de archivos entre sistemas conectados a una red TCP, basado en la arquitectura cliente-servidor. Desde un equipo cliente se puede conectar a un servidor para descargar archivos desde él o para enviarle archivos, independientemente del sistema operativo utilizado en cada equipo. FTP que es un medio, para el proceso de la encuesta a cada ciudad se le crea un buzón en el servidor de FTP del DANE Central, allí se coloca la información de las encuestas completas que se recolectaron diariamente. CONSOLIDACIÓN DE ARCHIVOS Los datos provenientes del área geográfica en donde se aplica la investigación se consolidan diariamente, con el objeto de ser monitoreados tanto por los coordinadores, supervisores, temáticos o por un Sistema centralizado de Monitoreo y Control Estadístico. Para enviar la información al DANE Central, se debe comprimir en el punto en el cual se tenga la información del día. Al archivo resultante se le coloca un nombre, de tal forma que indique la investigación, ciudad y fecha a que corresponde la información contenida; luego se copia al servidor destinado para el proceso de transmisión utilizando el protocolo FTP en la carpeta asignada para ello y confirmar inmediatamente que la información está de dicho servidor, se envía mediante correo electrónico. De igual forma, en el DANE Central se realizan las copias de respaldo necesarias y se aplican los planes de contingencia que garanticen el normal funcionamiento del operativo VERIFICACIÓN DE LA CONSISTENCIA INTERNA DE LOS DATOS Y AJUSTES El proceso para controlar e identificar los datos faltantes, inválidos o inconsistentes se lleva a cabo mediante el análisis de la variable “Incompleta” que toma valor 0 cuando la encuesta se encuentra completa y se puede utilizar directamente de la base de datos, y toma valor 1 cuando la encuesta debe ser revisada por datos faltantes inválidos o inconsistentes. IMPUTACIÓN Y/O AJUSTES DE COBERTURA El procesamiento es centralizado (DANE Central), e inicia desde el momento en que las Direcciones Territoriales envían la información, los datos son transmitidos por FTP (File Transfer Protocol) y cargados en la base de datos Oracle. En esta operación estadística no se realiza el proceso de imputación, la no respuesta es ajustada con los factores de expansión, lo que se explica en el numeral 2.2.4 Diseño muestral - procedimiento de estimación. NORMAS DE VALIDACIÓN Y CONSISTENCIA Validación de rangos de acuerdo con la estructura de las preguntas. Cuándo la pregunta tiene predefinidos las opciones de respuesta, es necesario controlar las opciones a mostrar dadas las restricciones que existen sobre unicidad o valor máximo posible de ocurrencia. Validación de los universos. Este proceso lo definen tres aspectos: Uno cuando la pregunta define un flujo o salto dependiendo de la opción; el otro caso en el que los datos de la vivienda se toman una sola vez, así exista más de un hogar; el tercero se define en el módulo de personas residentes en el hogar el cual esta definido por la edad de la persona. Para algunas variables relacionadas con la aplicación de conceptos básicos de la Gran Encuesta Integrada de Hogares que son determinantes en la calidad de la estructura de la información, el DMC permite que el entrevistador confirme la respuesta que da el entrevistado. Estas variables son: Número de hogares en la vivienda; nombres y apellidos; sexo; edad; parentesco; y todas las variables relacionadas con valores de los diferentes formularios. En el diseño del programa se garantiza que en la misma pantalla se muestren el capítulo que está relacionada con las variables como las diferentes preguntas que por su alta correlación debe controlarse su consistencia. Los anteriores aspectos hacen parte del documento “Especificaciones de normas técnicas de validación y consistencia” que tienen de forma detallada cada una de las preguntas de los formularios. Response rate --------------------------- Se diseñó una muestra para obtener una precisión esperada medida en términos del error de muestreo menor o igual a 5% con un nivel de confiabilidad del 95%, para los principales indicadores de fuerza laboral nacionales. Data appraisal --------------------------- ANÁLISIS ESTADÍSTICO Los principales indicadores que se utilizan en el análisis estadístico de los resultados son: Cobertura de viviendas: se obtiene de cruzar la información de viviendas iniciales seleccionadas, contra viviendas finales encontradas. Cobertura de hogares: se obtiene de cruzar la información del total de encuestas completas contra el total de hogares encontrados. Calidad de la recolección: se obtiene de identificar el número de errores cometidos durante la recolección. Errores e inconsistencias: se obtiene de la realización de diversas pruebas que ayudan a constatar que los cálculos estén bien hechos y que los datos sean coherentes. Alarmas: se obtienen al hacer una búsqueda de datos que se salgan de los estándares, como: alto número de viviendas vacantes, alto número de rechazos, bajo promedio de personas, entre otros. Informe de cobertura campo vs Sistemas: se obtiene de cruzar la información que las sedes y subsedes envían al DANE Central en los resúmenes de cobertura sobre viviendas, hogares y personas encontradas, contra la información que es transmitida al área de sistemas. Indicador de puntualidad: busca garantizar que la información enviada por las sedes y subsedes sea oportuna. Tasa de respuesta: se obtiene al medir en número de encuestas efectivas respecto a las esperadas. El objetivo de este indicador es identificar el grado de eficacia en el que se encuentra la investigación con respecto al proceso operativo de recolección. Para garantizar la calidad de la información es necesario tener en cuenta las siguientes normas: · El personal de campo y oficina, a saber: recolectores y supervisores, ha de ser evaluado periódicamente. · Por lo menos dos veces a la semana, el líder de la GEIH en cada ciudad debe hacer una reunión con el personal de campo para solucionar casos especiales, analizar el desarrollo del proyecto en cuanto a cobertura, no respuesta, cartografía, manejo de la muestra, etc. · Los recolectores deben ser rotados de supervisor y de zonas de la ciudad. · Mensualmente, el líder de la GEIH de cada ciudad debe enviar al DANE Central un informe de la justificación de la variación de las tasas de mercado laboral según formato establecido. · Las cargas de trabajo deben ser evacuadas en su totalidad en la semana respectiva, y por ningún motivo dejar trabajo de recolección para la semana siguiente. · El personal de campo debe tomar obligatoriamente un día de descanso a la semana, según convenga, para el desarrollo óptimo del operativo. · En cada ciudad se debe conformar un “Comité Técnico de la Gran Encuesta Integrada de Hogares”. Este comité tendrá como funciones principales hacer seguimiento, evaluar los aspectos metodológicos y operativos de la encuesta y producir las recomendaciones que considere pertinentes, las cuales deben ser enviadas al DANE Central junto con el informe mensual. ANÁLISIS DE CONTEXTO Este procedimiento está orientado al análisis tanto de la consistencia interna de los datos como del comportamiento del mercado laboral y su relación con otras variables macroeconómicas que sirvan de base para la formulación, el seguimiento y la evaluación de políticas. Para realizar el análisis de contexto se llevan a cabo diferentes tipos de análisis como son: El análisis descriptivo ayuda a observar el comportamiento de la muestra en estudio, a través de tablas, gráficos, intervalos de confianza y estadísticas de tendencia y dispersión. Se analiza en la muestra la estructura de los indicadores por dominios de estudio a partir de la distribución de frecuencias, y se detectan posibles inconsistencias y valores atípicos. Se verifica la cobertura a nivel de segmento, viviendas, hogares y persona, y se observa la distribución de la pérdida de muestra para realizar los respectivos ajustes de la no respuesta. El análisis inferencial tiene como objetivo realizar la estimación de la muestra a la población objetivo. En este proceso se aplican los factores de expansión y se revisa la inferencia a la población objetivo establecida para los correspondientes dominios de estudio. Se verifica que los ajustes del factor de expansión no generen sesgos en las estimaciones, y que sus errores muestrales sean aceptables de acuerdo con los parámetros establecidos por dominios de estudio. El secretario técnico de la GEIH, el coordinador de Temática Social, el director de Metodología y Producción Estadística, el subdirector y el director del DANE revisan la consistencia de la información sobre los principales indicadores de mercado laboral IML y posteriormente se elaboran y organizan otros productos como son el boletín de prensa y la presentación de resultados. En este proceso se realiza análisis comparativos y se analiza la consistencia interna de la información frente a otras variables económicas. Temática Social analiza el dato por divulgar frente al mismo periodo del año inmediatamente anterior y respecto a otros periodos, y los de las demás variables según conceptos de fuerza de trabajo. INDICADORES PARA EL CONTROL DE CALIDAD DE LOS PROCESOS DE LA INVESTIGACIÓN Para asegurar la calidad de los procesos se utilizan principalmente los Indicadores de Confiabilidad (cobertura de viviendas y hogares) y de Calidad (tasa de respuesta) asegurando la calidad de la recolección y los estimadores de precisión de resultados (error de muestreo menor o igual a 5% con un nivel de confiabilidad del 95%), para los principales indicadores de fuerza laboral nacionales.

摘要 --------------------------- 国家统计局(DANE)自20世纪60年代末以来便开展了家庭调查,当时进行了劳动力调查以及收入和支出调查。 大规模家庭综合调查的收集工作始于2006年8月7日,其核心模块为劳动力市场和收入,从9月11日起增加了家庭支出模块。 从2006年7月10日起,大规模家庭综合调查的覆盖范围扩大至13个主要城市和都市区之外的11个额外城市,以及所有首府和农村地区;目前的覆盖范围保持不变。 在本文件中,您可以找到哥伦比亚劳动力市场测量的历史演变以及大规模家庭综合调查的主要技术特征。 对调查的概念框架和主题设计的解释,以及国际组织推荐的标准化概念,旨在确保各国在劳动力市场方面的可比性。 统计设计的描述使人们对样本框架、样本定义的确定程序以及估计和分析结果的覆盖范围有了清晰的认识。 此外,文件还详细介绍了从准备工作到现场操作的每个统计生产过程,包括数据收集、传输和处理,以及质量控制方法,最后是数据分析和数据的传播过程。 本文件的附件包括调查表格、通过数据库公开的表格清单以及大规模家庭综合调查采用的国际分类清单。 地理覆盖范围 --------------------------- 具有全国覆盖范围,允许获取首府和剩余地区、城市和都市区、大区域以及按部门划分的总数。对于劳动力市场,排除新的部门。 分析单位 --------------------------- 抽样单位是规模测量(MT)或细分。规模测量或细分由平均十户家庭组成,所有这些家庭都被调查,包括每个家庭的每个家庭和每个人。 观测单位是构成总体的那些具有特定特征的元素集合。在这种情况下,基本观测单位是家庭。 研究范围 --------------------------- 总体 大规模家庭综合调查的总体由居住在全国各地的非机构化平民人口组成。 目标人口 对应于居住在全国各地的非机构化平民人口;排除新的部门,即1991年宪法之前被称为国家领土的地区,其中居住着约占总人口4%的人口。这个人口遍布全国近一半的面积。 数据类型 --------------------------- 抽样调查(ssd) 抽样程序 样本框架 --------------------------- 由地形图和从家庭主样本中获得的住房清单组成,通过永久更新和新建筑和住房的计数进行更新。 抽样类型 考虑到目标和框架的特征,选择了概率性、分层、聚类、多阶段样本,如下所示: 概率性。 每个目标人口的单元都有已知的、大于零的选中概率。这种类型的样本允许预先确定主要结果所需的精度,并计算所有获得的结果的观察精度。 分层。 这种方法通过减少估计的方差来确保样本的更高精度,分层标准如下: · 第一层对应于24个首都和都市区,每个城市或都市区都有独立的研究领域。每个城市或都市区都是自我代表的。在分层和样本选择过程中,根据地形学原则组织地理区域,分为部门、部分和街区,包括街区层面的住房数量和经济社会等级。 · 第二层对应于剩余的城镇和首府、人口聚居点和散居的农村。根据以下标准对市政府进行分层: - 地理,按由多个省份组成的地区水平。 - 社会经济,按市政府水平,以下指标: - 城市化水平,按首府市政人口数量。 - 市镇人口结构(%的市政人口在首府)。基本需求不满足(NBI)的比例,它进一步分为4个区间:A [0-29,8%]; B [29,8%-42,7%]; C [42,7%-57,3%]; 和 D [57,3%-100%]。 - 人口的规模。 每个总人口为7,000人或更多的市政府构成一个抽样单元(UPM)。人口较少的市政府与相邻的市政府合并,以构成UPM。 与平均规模相似的UPM构成“确定性”层;在概率方面,它们具有概率1。其余UPM组成“不确定性”层,应用分层变量,按照之前指定的优先顺序。 聚类。 对应于最终的抽样单元,即规模测量或细分;是包含平均十户家庭的区域,在该区域内调查所有住房、所有家庭和所有人员。 样本在聚类中的集中提供了在操作层面的巨大好处;这大大减少了时间和成本,并便于监督。 多阶段。 抽样单元(UPM)。存在强制性和概率性UPM: - 强制性UPM是都市区和剩余的首府,因为它们的样本量允许为每个城市或都市区分别进行季度估计,以及那些人口规模与部门平均规模相似或更大的中等规模市政府。 - 概率性UPM是从由两个或更多UPM组成的层(不确定性层)中选出的。选择控制技术允许通过概率性程序增加在部门中可以选出的UPM组合的选择概率,这可以补充常规分层抽样的效果。 在主样本的情况下,选择控制提供了在UPM选择方面的区域间平衡,从而实现了尽可能减少估计结果的标准误差。 二级抽样单元(USM)。在市政府首府和人口聚居点,USM是同一市政府相邻的街区群,包含至少12个规模测量(MT),平均10户家庭,在农村散居地区,USM是一个街区或普查区。 USM的大小允许在每次调查中对样本的分布和旋转进行适当的控制。在选择USM时应用以下程序(PPT): · 按社会经济等级(仅限市政府首府)为每个选定的市政府组成、界定和列出USM,遵循普查地形学的命名法:部门、部分和街区。 · 计算规模测量(MT)的数量,通过除以10(住房数量)并四舍五入到整数。 · 计算抽样间隔(IM),通过将一个区域中存在的MT总数除以该区域所需的USM数量。 · 选择一个介于1和间隔值之间的起始数,该起始数指示该区域样本中的第一个USM;然后选择该区域的其余USM,通过将IM加到起始数来逐次相加。 三级抽样单元(UTM)。第三步是在每个USM内部选择一个或多个UTM,具体取决于每个市政府中预选USM的大小和数量。 每个UTM是一个包含平均10个连续住房(5至14个住房)的区域,即规模测量(MT)。在中间步骤中,选择在市政府首府、人口聚居点和农村散居地区的清晰界定和划定的街区、部分和农村散居地区的段。 ... 定义样本大小 --------------------------- 最初,月样本量约为23,000户家庭。2000年,随着大规模家庭综合调查的实施,主样本量从165扩大到240多个;在13个地区有30,000户家庭,在剩余的首府、人口聚居点和散居的农村地区有7,500户家庭。在2004年,主样本量扩大到44,400户家庭,在13个地区有30,000户家庭,在剩余的首府、人口聚居点和散居的农村地区有14,400户家庭。在2006年,随着大规模家庭综合调查的实施,样本量扩大到11个城市;增加了17,600户家庭,总数达到62,000户家庭。由于2005年人口普查产生的新框架,从2009年开始实施的新样本由437个市政府组成,每年访问大约248,028户家庭,集中在22,548个细分中。月样本量为20,669户家庭、18,790户住房和1,879个细分。 ... 数据收集方式 --------------------------- 辅助自动填写的DMC 研究工具 --------------------------- 基本概念 应用于劳动力市场指标的概念框架源于国际劳工组织的建议。在劳动力统计方面,哥伦比亚特别是整个拉丁美洲拥有超过四个十年定期进行的家庭调查,在此期间,基于协调主要概念和测量就业的方法论,进行了理论和方法的开发。 国际劳工统计学家大会(CIET)自1919年以来一直在召开会议,并就劳动力统计的测量问题通过了不同的决议和建议。第13届CIET,1983年,建立了和规范了(并且至今仍然有效)必须将劳动力(就业、失业和不活跃)的不同变量置于其中的理论框架和概念框架,即:每个变量的概念和定义、参考期、主要活动、变量的优先规则等。同样,它引入了“目前活跃人口”与“通常活跃人口”的区别。在哥伦比亚的情况下,测量涉及前者。 劳动力市场和具体来说失业率(TD)已被用作分析经济行为状态的临界指标,将失业率理解为反映经济人力资源利用程度的指标,其他劳动力市场指标应同时进行分析。 在这个框架下,旨在提供这种信息,以便能够理解劳动力市场对经济条件的信号,因此国家统计局(DANE)提供有关劳动力市场主要指标状态和趋势的基本和相关信息。 DANE根据CIET的方案进行调查研究,但自1983年以来的决议完全和精确地反映在直到1999年有效的信息收集工具中。因此,开始了一个审查和更新方法论、样本、操作和数据处理框架的过程。 这个过程以采用“连续收集系统”和更新调查方法为结果,该系统以1983年国际劳工局办公室批准的决议为基础,以1993年新的国民账户系统(SCN-93)、国际经验和实践以及特别是哥伦比亚劳动力市场的特殊性为基础。 经过上述修改的系统从2000年1月开始生效,被称为持续家庭调查(ECH)。 大规模家庭综合调查(GEIH)的设计始于2005年12月,由ECH主题小组的项目,其目标是获取尽可能多的关于同一家庭的信息,以便可以从不同角度进行研究,从而便于对哥伦比亚人口的经济和社会特征进行更全面的分析。 在组成GEIH表格的过程中,最重要的是保持ECH的主要系列,以保持连续性和可比性;另一方面,新的问题是在考虑需要直接在适用情况下使用直接受访者收集信息的情况下设计的。 在审查问卷时,考虑了以下参数: - 国内外专家和DANE就业技术委员会的咨询。 - 国际经验和实践。 - 哥伦比亚劳动力市场的特殊性。 国际劳工组织(ILO)正在通过培训、方法论研究和技术援助计划与哥伦比亚合作。与ILO的最新统计工作相关的一个例子是关于体面劳动的主题,该主题提供了一个概念框架,用于编制和整合劳动力市场指标。实际上,ILO的体面劳动概念由四个支柱组成:工作、原则和基本权利;就业;社会保障和社交对话,这些主题是体面劳动指标的分类器。在拉丁美洲,ILO已建立一套18个体面劳动指标,允许衡量该地区各国在减少体面劳动赤字方面取得的进展。 ... 数据清洗操作 --------------------------- 向国家统计局中央的数据传输 ... 响应率 --------------------------- 设计了一个样本,以获得一个预期精度,以抽样误差小于或等于5%的术语来衡量,置信水平为95%,用于国家劳动力主要指标。 数据评估 --------------------------- 统计分析 ... 分析背景 ... ... 指标,用于控制调查过程的质量 --------------------------- 为了确保过程的质量,主要使用可靠性指标(住房和家庭覆盖率)和质量指标(响应率),确保数据收集的质量和结果估计的精确度指标(抽样误差小于或等于5%,置信水平为95%),用于国家劳动力主要指标。
提供机构:
microdatos.dane.gov.co
二维码
社区交流群
二维码
科研交流群
商业服务