Gran Encuesta Integrada de Hogares 2013 - Colombia

Name: Gran Encuesta Integrada de Hogares 2013 - Colombia
Creator: catalog.ihsn.org
Published: 2017-06-26 00:00:00
License: 暂无描述

catalog.ihsn.org2017-06-26 更新2025-01-21 收录

下载链接：

http://catalog.ihsn.org/catalog/6998

下载链接

链接失效反馈

官方服务：

资源简介：

Abstract --------------------------- La Gran Encuesta Integrada de Hogares (GEIH) tiene como objetivo principal proporcionar información básica sobre el tamaño y estructura de la fuerza de trabajo (empleo, desempleo e inactividad) de la población del país, así como de las características sociodemográficas de la población colombiana, permitiendo caracterizar a la población según sexo, edad, parentesco con el jefe del hogar, nivel educativo, la afiliación al sistema de seguridad social en salud, entre otros. Igualmente, a través de la encuesta se clasifica a las personas según su fuerza de trabajo en ocupadas, desocupadas o inactivas. De esta forma, es posible estimar los principales indicadores del mercado laboral colombiano, como son la Tasa Global de Participación (TGP), la Tasa de Ocupación (TO) y la Tasa de Desempleo (TD). Geographic coverage --------------------------- Cobertura nacional que permite obtener resultados para cabeceras y resto, ciudades y áreas metropolitanas, grandes regiones y total por departamento. Analysis unit --------------------------- La encuesta tiene las siguientes unidades de análisis: Hogares e Individuos. Universe --------------------------- El universo para la Gran Encuesta Integrada de Hogares está conformado por la población civil no institucional, residente en todo el territorio nacional. Kind of data --------------------------- Sample survey data [ssd] Sampling procedure --------------------------- MARCO MUESTRAL Está constituido por el inventario cartográfico y el listado de viviendas obtenidas de la Muestra Maestra de Hogares, con actualizaciones permanentes y nuevos recuentos de edificaciones y viviendas a través de la misma. TIPO DE MUESTREO Teniendo en cuenta los objetivos y las características del marco, se optó por una muestra probabilística, estratificada, de conglomerados, multietápica, los cuales se presentan a continuación: A). Probabilística: Cada unidad de la población objetivo tiene una probabilidad de selección conocida y superior a cero. Este tipo de muestra permite establecer anticipadamente la precisión deseada en los resultados principales, y calcular la precisión observada en todos los resultados obtenidos. B). Estratificada: Este método asegura una mejor precisión de la muestra, al disminuir la varianza de las estimaciones, los criterios de estratificación son: · El primer estrato corresponde a las 24 capitales y áreas metropolitanas con dominios de estudio independientes. Cada ciudad o área metropolitana es autorrepresentada. Para la estratificación y selección de la muestra, las áreas geográficas se organizaron, según los principios cartográficos establecidos, en sectores, secciones y manzanas con la información del número de viviendas a nivel de manzana y el estrato socioeconómico. · El segundo estrato corresponde al resto urbano y al resto de cabeceras, centros poblados y rural disperso. Los municipios se estratificaron de acuerdo con los siguientes criterios: - Geográficos, a nivel de regiones constituidas por varios departamentos. - Socioeconómicos, a nivel municipal, con los siguientes indicadores: · Nivel de urbanización, en términos de la cantidad de población de las cabeceras municipales. · Estructura urbano-rural de la población municipal (% de población en cabecera). Proporción de la población con necesidades básicas insatisfechas (NBI), la cual, a su vez, se clasificó en 4 intervalos: A [0-29,8%); B [29,8%-42,7%); C [42,7%-57,3%); y D [57,3%-100%]. · Tamaño poblacional del estrato. Cada municipio con 7.000 o más habitantes en su población total, se constituyó en Unidad Primaria de Muestreo, UPM. Los de menor población se agruparon con uno vecino para constituirse en UPM. Las UPM cuyo tamaño era similar al tamaño promedio de los estratos, se constituyeron en estratos de “certeza”; para efectos probabilísticos tuvieron probabilidad 1. Las demás UPM se agruparon en estratos de no certeza, aplicando las variables de estratificación en el orden de prioridad especificado antes. C). De Conglomerados: Corresponde a la unidad final de muestreo, que es la medida de tamaño o segmento; es el área que contiene un promedio de diez viviendas, en la cual se investigan todas las viviendas, todos los hogares y todas las personas. La concentración de la muestra en conglomerados presenta grandes beneficios en el nivel operativo; lo cual reduce, en forma considerable, los tiempos y los costos, y facilita la supervisión. D). Multietápica: Unidades Primarias de Muestreo (UPM) Hay UPM de inclusión forzosa y de inclusión probabilística: - Son de inclusión forzosa las áreas metropolitanas y el resto de capitales departamentales que son autorrepresentadas, pues su tamaño muestral permite estimaciones trimestrales separadas para cada una de ellas, y aquellos municipios de tamaño intermedio cuya población es similar o mayor que el tamaño promedio de los estratos de su departamento. - Son de inclusión probabilística las UPM seleccionadas con PPT de los estratos conformados por dos o más UPM (estratos de no certeza). La técnica de selección controlada utilizada permitió mediante un procedimiento probabilístico incrementar las probabilidades de selección de las combinaciones preferidas de UPM que podían ser seleccionadas en un departamento, adicionalmente a lo obtenible con un muestreo estratificado corriente. En el caso de la Muestra Maestra la selección controlada proporcionó un mejor balance interregional en las características de las UPM seleccionado. El resultado final de este ejercicio fue lograr la máxima reducción posible en el error estándar de estimación de los resultados. Unidades Secundarias de Muestreo (USM) En las cabeceras municipales y centros poblados, las USM son grupos de manzanas contiguas del mismo municipio, que contienen un mínimo de 12 medidas de tamaño (MT) con un promedio de 10 viviendas, y en la zona rural dispersa, la USM es una sección o sector censal. El tamaño de la USM permite un control adecuado de la distribución y rotación de la muestra con cada encuesta. Para la selección de las USM se aplica el siguiente procedimiento (PPT): · Conformación, delimitación y listado de las USM por estrato socioeconómico (solo cabeceras municipales) de cada municipio seleccionado, siguiendo el orden de la nomenclatura de la cartografía censal: sector, sección y manzana. · Cálculo del número de medidas de tamaño (MT), dividiendo por 10 (el número de viviendas) y aproximando a un valor entero. · Cálculo de intervalo de muestreo (IM), dividiendo el total de MT existentes en una zona por el número de USM requeridas en la muestra de la zona. · Selección de un número de arranque entre 1 y el valor del intervalo, el cual indica la primera USM de la muestra de la zona; y selección del resto de USM de la zona, sumando sucesivamente el IM al número de arranque. Unidades Terciarias de Muestreo (UTM) El tercer paso es la selección dentro de cada USM de una o más UTM, dependiendo de las requeridas, del tamaño y cantidad de USM preseleccionadas en cada municipio. Cada UTM es un segmento con un promedio de 10 viviendas contiguas (5 a 14 viviendas), es decir, una medida de tamaño (MT). En un paso intermedio, se seleccionan manzanas en las cabeceras municipales, centros poblados y segmentos de sección rural claramente delimitados, con límites naturales (quebradas, ríos, etc.) o sociales (carreteras, caminos, etc.). Los segmentos de los sectores rurales se conforman previamente con base en fotografías aéreas y en lo posible, se procura que tengan un promedio de 10 viviendas; sin embargo, por insuficiente detalle cartográfico, los segmentos pueden tener dos o más MT. La selección se hace con probabilidad proporcional al número de MT (PPT), así una manzana o segmento rural puede contener una o más MT, y las que tienen menos de 5 viviendas se juntan con una manzana vecina del mismo estrato socioeconómico. Las áreas urbanas no urbanizadas se anexan al área o manzana vecina muy cercana con una o más viviendas con el objeto de que tengan probabilidad de selección y para que puedan captar cualquier proceso futuro de urbanización. Si solo se requiere una MT y la manzana o porción solo tiene una MT, la muestra queda constituida por todas las viviendas y hogares existentes. Si la manzana o segmento rural tienen dos o más MT se procede al recorrido y delimitación de segmentos de una MT, en el terreno. Finalmente, se hace la asignación aleatoria del orden en que entrarán los segmentos al proceso de rotación. Unidades Cuartas de Muestreo (UCM) Cada UCM es un segmento de 10 viviendas contiguas (5 a 14 viviendas), es decir una medida de tamaño MT y su selección es aleatoria. Finalmente, se hace una asignación aleatoria del orden en que entrarán los segmentos al proceso de rotación. En este proceso de selección por etapas, solo se requiere una actualización cartográfica detallada de las áreas seleccionadas. Para el estrato de resto de cabeceras, centros poblados y rural disperso se seleccionó: - En una primera etapa, la UPM, utilizando la técnica de selección controlada dentro de cada estrato. - Para la segunda etapa se seleccionó en la zona urbana la manzana, y en la al resto de cabeceras, centros poblados y rural disperso la sección, o sea la USM. - En la tercera etapa se seleccionó el segmento o UTM. En este proceso de selección por etapas sólo se requiere una actualización cartográfica detallada de las áreas seleccionadas. DEFINICIÓN TAMAÑO DE LA MUESTRA Inicialmente, el tamaño de la muestra mensual correspondía aproximadamente a 23.000 hogares. En el año 2000 con la implementación de la ECH la muestra maestra fue ampliada de 165 a más de 240; con 30.000 hogares en 13 áreas y 7500 en el resto de cabeceras, centros poblados y rural disperso. Durante 2004 se amplió la muestra maestra, con un total de 44.400 hogares, con 30.000 hogares en 13 áreas y 14.400 en el resto de cabeceras, centros poblados y rural disperso. Para el año 2006 con la implementación de la GEIH, se amplió la muestra a 11 ciudades más; con 17.600 hogares adicionales, para un total de 62.000 hogares. Con el nuevo marco generado por el censo 2005, la nueva muestra implementada desde 2009 está conformada por 437 municipios y anualmente se visitan aproximadamente 248.028 hogares, concentrados en 22.548 segmentos. La muestra mensual es de 20.669 hogares, 18.790 viviendas y 1.879 segmentos. Los tamaños de muestra se calculan con una precisión deseada de la variable tasa de desempleo no superior a un error estándar relativo del 5% y una tasa de desempleo del 10%. Los cálculos se realizan con las fórmulas correspondientes al tipo de diseño muestral. Se ajustan con base en el efecto de los conglomerados en el diseño (deff), que es una relación, para cada dominio, entre la varianza real de este diseño de conglomerados y la que se obtendría con un diseño aleatorio simple de elementos. Mode of data collection --------------------------- Autodiligenciamiento asistido con DMC Research instrument --------------------------- El instrumento desarrollado para la recolección de información de la GEIH, cuenta con una serie de preguntas e incorpora los siguientes capítulos y módulos A. Identificación: 19 preguntas. B. Vivienda: 5 preguntas. C. Datos del hogar: 14 preguntas. D. Registro de personas: 4 preguntas. E. Características generales: 6 preguntas. F. Seguridad social en salud: 7 preguntas. G. Educación: 5 preguntas. H. Fuerza de trabajo: 14 preguntas. I. Ocupados: 65 preguntas J. Desocupados: 14 preguntas. K. Inactivos: 10 preguntas. L. Otras actividades: 1 pregunta. M. Ingresos no laborales: 4 preguntas. El equipo de Temática Social elabora un Manual de diligenciamiento y conceptos básicos, que acompaña al formulario, él cual es guía para los recolectores en campo. Cleaning operations --------------------------- CONSOLIDACIÓN DE ARCHIVOS Los datos provenientes del área geográfica en donde se aplica la investigación se consolidan diariamente, y pueden ser monitoreados por el área temática y sistemas Para enviar la información al DANE Central, se utiliza la herramienta Swin que genera un archivo comprimido asignándole un nombre, que indique la investigación, ciudad y fecha a que corresponde la información contenida; luego se copia al servidor destinado para el proceso de transmisión, utilizando el protocolo FTP en la carpeta asignada para ello y confirmar inmediatamente que la información está en dicho servidor, se envía mediante correo electrónico. De igual forma, en el DANE Central se realizan las copias de respaldo necesarias y se aplican los planes de contingencia que garanticen el normal funcionamiento del operativo. NORMAS DE VALIDACIÓN Y CONSISTENCIA Validación de rangos de acuerdo con la estructura de las preguntas. Cuándo la pregunta tiene predefinidos las opciones de respuesta, es necesario controlar las opciones a mostrar dadas las restricciones que existen sobre unicidad o valor máximo posible de ocurrencia. Validación de los universos. A este proceso lo definen tres aspectos: el primero, cuando la pregunta define un flujo o salto dependiendo de la opción; el segundo cuando los datos de la vivienda se toman una sola vez, así exista más de un hogar; el tercero, cuando se define en el universo según la edad de la persona residente en el hogar. Para algunas variables relacionadas con la aplicación de conceptos básicos de la Gran Encuesta Integrada de Hogares que son determinantes en la calidad de la estructura de la información, el DMC permite que el entrevistador confirme la respuesta que da el entrevistado. Estas variables son: Número de hogares en la vivienda; nombres y apellidos; sexo; edad; parentesco; y todas las variables relacionadas con valores de los diferentes formularios. En el diseño del programa se garantiza que en la misma pantalla se muestren el capítulo que está relacionada con las variables como las diferentes preguntas que por su alta correlación debe controlarse su consistencia. Los anteriores aspectos hacen parte del documento "Especificaciones de normas técnicas de validación y consistencia" que tienen de forma detallada cada una de las preguntas de los formularios. VERIFICACIÓN DE LA CONSISTENCIA INTERNA DE LOS DATOS Y AJUSTES El proceso para controlar e identificar los datos faltantes, inválidos o inconsistentes se lleva a cabo mediante el análisis de la variable "Incompleta" que toma valor 0 cuando la encuesta se encuentra completa y se puede utilizar directamente de la base de datos, y toma valor 1 cuando la encuesta debe ser revisada por datos faltantes inválidos o inconsistentes. IMPUTACIÓN Y/O AJUSTES DE COBERTURA El procesamiento es centralizado por DANE Central, e inicia desde el momento en que las Direcciones Territoriales envían la información; los datos son transmitidos por FTP (File Transfer Protocol) y posteriormente cargados en la base de datos Oracle. En esta operación estadística no se realiza el proceso de imputación, cuando los miembros de los hogares se niegan a responder la encuesta, esta no respuesta es ajustada con los factores de expansión. Data appraisal --------------------------- ANÁLISIS ESTADÍSTICO Los principales indicadores que se utilizan en el análisis estadístico de los resultados son: - Cobertura de viviendas: se obtiene de cruzar la información de viviendas iniciales seleccionadas, contra viviendas finales encontradas. - Cobertura de hogares: se obtiene de cruzar la información del total de encuestas completas contra el total de hogares encontrados. - Calidad de la recolección: se obtiene de identificar el número de errores cometidos durante la recolección. - Errores e inconsistencias: se obtiene de la realización de diversas pruebas que ayudan a constatar que los cálculos estén bien hechos y que los datos sean coherentes. - Alarmas: se obtienen al hacer una búsqueda de datos que se salgan de los estándares, como: alto número de viviendas vacantes, alto número de rechazos, bajo promedio de personas, entre otros. - Informe de cobertura campo vs Sistemas: se obtiene de cruzar la información que las sedes y subsedes envían al DANE Central en los resúmenes de cobertura sobre viviendas, hogares y personas encontradas, contra la información que es transmitida al área de sistemas. - Indicador de puntualidad: busca garantizar que la información enviada por las sedes y subsedes sea oportuna. - Tasa de respuesta: se obtiene al medir en número de encuestas efectivas respecto a las esperadas. El objetivo de este indicador es identificar el grado de eficacia en el que se encuentra la investigación con respecto al proceso operativo de recolección. Para garantizar la calidad de la información es necesario tener en cuenta las siguientes normas: - El personal de campo y oficina, a saber: recolectores y supervisores, ha de ser evaluado periódicamente. - Por lo menos dos veces a la semana, el líder de la GEIH en cada ciudad debe hacer una reunión con el personal de campo para solucionar casos especiales, analizar el desarrollo del proyecto en cuanto a cobertura, no respuesta, cartografía, manejo de la muestra, etc. - Los recolectores deben ser rotados de supervisor y de zonas de la ciudad. - Mensualmente, el líder de la GEIH de cada ciudad debe enviar al DANE Central un informe de la justificación de la variación de las tasas de mercado laboral según formato establecido. - Las cargas de trabajo deben ser evacuadas en su totalidad en la semana respectiva, y por ningún motivo dejar trabajo de recolección para la semana siguiente. - El personal de campo debe tomar obligatoriamente un día de descanso a la semana, según convenga, para el desarrollo óptimo del operativo. - En cada ciudad se debe conformar un “Comité Técnico de la Gran Encuesta Integrada de Hogares”. Este comité tendrá como funciones principales hacer seguimiento, evaluar los aspectos metodológicos y operativos de la encuesta y producir las recomendaciones que considere pertinentes, las cuales deben ser enviadas al DANE Central junto con el informe mensual. ANÁLISIS DE CONTEXTO Este procedimiento está orientado al análisis tanto de la consistencia interna de los datos como del comportamiento del mercado laboral y su relación con otras variables macroeconómicas que sirvan de base para la formulación, el seguimiento y la evaluación de políticas. Para realizar el análisis de contexto se llevan a cabo diferentes tipos de análisis como son: - El análisis descriptivo ayuda a observar el comportamiento de la muestra en estudio, a través de tablas, gráficos, intervalos de confianza y estadísticas de tendencia y dispersión. - Se analiza en la muestra la estructura de los indicadores por dominios de estudio a partir de la distribución de frecuencias, y se detectan posibles inconsistencias y valores atípicos. Se verifica la cobertura a nivel de segmento, viviendas, hogares y persona, y se observa la distribución de la pérdida de muestra para realizar los respectivos ajustes de la no respuesta. - El análisis inferencial tiene como objetivo realizar la estimación de la muestra a la población objetivo. En este proceso se aplican los factores de expansión y se revisa la inferencia a la población objetivo establecido para los correspondientes dominios de estudio. - Se verifica que los ajustes del factor de expansión no generen sesgos en las estimaciones, y que sus errores muéstrales sean aceptables de acuerdo con los parámetros establecidos por dominios de estudio. - El secretario técnico de la GEIH, el coordinador de Temática Social, el director de Metodología y Producción Estadística, el subdirector y el director del DANE revisan la consistencia de la información sobre los principales indicadores de mercado laboral IML y posteriormente se elaboran y organizan otros productos como son el boletín de prensa y la presentación de resultados. En este proceso se realiza análisis comparativos y se analiza la consistencia interna de la información frente a otras variables económicas. - Temática Social analiza el dato por divulgar frente al mismo periodo del año inmediatamente anterior y respecto a otros periodos, y los de las demás variables según conceptos de fuerza de trabajo.

摘要 ---------------------------- 《哥伦比亚综合家庭调查》（GEIH）的主要目标是提供关于该国劳动力（就业、失业和未就业）规模和结构的基本信息，以及哥伦比亚人口的社会人口学特征，允许根据性别、年龄、与户主的关系、教育水平、社会保障医疗系统参保情况等因素来描述人口。同样，通过调查，将个人根据其劳动力状态分为就业、失业或未就业。这样，可以估计哥伦比亚劳动市场的关键指标，如总参与率（TGP）、就业率（TO）和失业率（TD）。地理覆盖范围 ---------------------------- 全国覆盖范围，允许获得省、市、大都市区、大区域和按部门划分的总体结果。分析单元 ---------------------------- 调查具有以下分析单元：家庭和个人。总体 ---------------------------- 《哥伦比亚综合家庭调查》的总体由全国范围内的非机构化民事人口组成。数据类型 ---------------------------- 样本调查数据 [ssd] 抽样程序 ---------------------------- 抽样框架 ... （以下内容省略，因为回答长度限制，只展示部分翻译内容）数据收集方式 ---------------------------- 辅助自动填写的 DMC 研究工具 ---------------------------- 为收集《哥伦比亚综合家庭调查》信息而开发的工具包含一系列问题，并包含以下章节和模块 ... 数据清理操作 ---------------------------- ... 数据评估 ---------------------------- 统计分析 ... 分析背景 ...

提供机构：

catalog.ihsn.org

5,000+

优质数据集

54 个

任务类型

进入经典数据集