Encuesta de Microestablecimientos - MICRO - 2008 - 2009 - 2010 - 2011 - Colombia
收藏microdatos.dane.gov.co2014-07-14 更新2025-03-22 收录
下载链接:
https://microdatos.dane.gov.co/index.php/catalog/39
下载链接
链接失效反馈官方服务:
资源简介:
Resumen
---------------------------
Desde el año 2000, el Departamento Administrativo Nacional de Estadística viene implementando la Encuesta de Microestablecimientos de Comercio, Servicios e Industria,
midiendo la coyuntura o evolución y la estructura de las unidades que tienen hasta nueve personas ocupadas. Colombia es uno de los dos países de Latinoamérica que realiza esta medición, al igual que México, que está midiendo la actividad de los micronegocios. Desde 2009, las unidades objeto de la investigación son aquellas hasta nueve (9) personas ocupadas.
La metodología adoptada para su medición se realiza mediante marcos de áreas, debido a la gran dinámica existente. Según datos de la misma encuesta, la tasa anual de
nacimientos de microestablecimientos es de aproximadamente el 35%. Por tanto, la elaboración de un directorio de estas unidades se desactualiza rápidamente; asimismo, estas unidades no se registran ante las cámaras de comercio o ante las entidades públicas.
Esta metodología se utiliza en las encuestas a hogares, por ejemplo, calidad de vida, ingresos y gastos. Los costos de recolección son altos debido a la selección de áreas
geográficas (segmentos de muestreo) y su representatividad a nivel de los sectores económicos, la cobertura nacional y a las variables principales de los
microestablecimientos.
Geographic coverage
---------------------------
Nacional que incluye todos los municipios del país. Conjunto de las 24 ciudades principales con sus áreas metropolitanas. Por actividad economica de comercio, servicio e industria.
Analysis unit
---------------------------
UNIDAD DE OBSERVACIÓN
Las unidades finales de las cuales se obtendrá información son los establecimientos industriales, comerciales y de servicios con 9 o menos personas ocupadas.
UNIDAD DE ANÁLISIS
La unidad de análisis de esta investigación son los microestablecimientos económicos.
UNIDAD DE MUESTREO
En la primera etapa de la investigación la unidad de muestreo es el municipio; para el caso de las grandes ciudades, no se habla de municipio seleccionado sino de área metropolitana completa; por ejemplo, en el caso de Medellín, al ser seleccionada el área incluirá además los municipios de Bello, Envigado, Itagüí, Copacabana, La Estrella, Caldas, Girardota, Barbosa y Sabaneta.
En la segunda etapa, la unidad de muestreo es la manzana cartográfica o la sección, definida como conjunto de manzanas que pertenezcan a una misma sección cartográfica DANE, que tengan menos de 10 comercios y menos de 5 industrias y que adicionalmente no pertenezcan a los demás subestratos; esta unidad dependerá del subestrato en el cual se esté haciendo la selección.
Finalmente, en la tercera etapa la unidad de muestreo es el establecimiento industrial, comercial o de servicios.
Universo de estudio
---------------------------
UNIVERSO DE ESTUDIO
Todos los establecimientos de industria, comercio y servicios que tienen 9 o menos personas ocupadas, ubicados en las cabeceras municipales de todos los municipios del país. Se excluyen los puestos móviles
POBLACIÓN OBJETIVO
Todos los establecimientos de industria, comercio y servicios que tienen 9 o menos personas ocupadas, ubicados en las cabeceras municipales de todos los municipios del país. Se excluyen los puestos móviles.
Kind of data
---------------------------
Encuesta por muestreo (ssd)
Sampling procedure
---------------------------
DISEÑO MUESTRAL
MARCO MUESTRAL
El marco de la investigación es de áreas económico, conformado por la base cartográfica, a nivel manzana, de las cabeceras de los 1116 municipios del país.
Fecha de construcción: el marco se encuentra en proceso de actualización a nivel muestra de Unidades Primarias de Muestreo -UPM- y Unidades Secundarias de Muestreo -USM. En el estrato 1 (24 principales municipios) se realizó la respectiva homologación cartográfica de 2001 a 2004, quedando pendiente la actualización de Bogotá y área metropolitana de Medellín, que mantienen cartografía 1996 y 2001, respectivamente. En los demás estratos, el proceso se está realizando con la información económica del Censo General 2005 y con las bases de homologaciones que contienen la verificación de código DANE versus código censo y área geográfica (AG), proporcionadas por la Dirección de Geoestadística -DIG- del DANE.
Fuente: el marco muestral en principio se construyó a partir del marco económico de áreas correspondiente a 184 municipios del país, referenciado en las investigaciones "Construcción de marcos de áreas para las investigaciones económicas" y el "Censo económico de Cundinamarca", realizadas por el DANE en 1996 y 1999, respectivamente.
Método de actualización: en general, los procesos de mantenimiento requeridos se efectúan a nivel de unidades y de información auxiliar. En el caso particular del Marco de áreas para las investigaciones económicas, por tratarse de manzanas cartográficas que representan áreas geográficas, el mantenimiento a nivel de unidad se refiere a la homologación de códigos de una a otra cartografía para las manzanas existentes, la incorporación de nuevos desarrollos y la eliminación de las zonas demolidas o que ya no pertenecen al área urbana de los municipios; también contempla la eliminación de aquellas zonas que aparezcan repetidas en el marco, por problemas de codificación. A nivel de información auxiliar, el proceso de mantenimiento considera la actualización de la información correspondiente a cantidad de establecimientos, la adecuación de dicha información para responder a las necesidades de los distintos usuarios y, eventualmente,
la inclusión de nuevas variables que enriquezcan el marco.
El marco de áreas para las investigaciones económicas tiene como unidad la manzana cartográfica DANE. La identificación de ésta se hace a través de un código de 22 dígitos.
Este código es asignado especialmente para el DANE por la DIG y, por lo general, no coincide con los códigos asignados por otras entidades como Catastro Distrital; esto hace que el DANE tenga su propia cartografía y libertad para modificarla y actualizarla conforme a sus posibilidades. En la medida en que se producen cambios geográficos y físicos en las ciudades, la DIG se encarga de actualizar su cartografía, con el fin de garantizar la idoneidad del material que permite a los grupos operativos de la entidad movilizarse en campo. Una conjunción importante de cambios hace que se genere una nueva cartografía para determinado municipio.
En este caso, para efectuar el proceso de migración de una a otra cartografía, la DIG se encarga de elaborar una tabla de homologación, esto es, un archivo magnético que contiene el código asignado a cada una de las manzanas del municipio en la antigua cartografía y el código o los códigos nuevos asignados. En el caso de los nuevos desarrollos geográficos, esta tabla los incorpora mediante la adición de registros y la habilitación de nuevos códigos.
Para llevar a cabo el mantenimiento en este aspecto, es necesario identificar la base cartográfica aprobada por el DIG más reciente en cada uno de los municipios pertenecientes al Marco de Áreas. A la fecha, Bogotá tiene cartografía 96 como la más reciente, el área metropolitana de Medellín mantiene cartografía 2001 y el resto de municipios, cuentan con cartografía 2004. Lo ideal es que la base cartográfica del marco sea siempre la más reciente posible.
Una vez hecha esta identificación, debe solicitarse a la DIG las tablas de homologación correspondientes. Es importante efectuar una revisión de integridad a las tablas de homologación, previniendo la presencia de celdas vacías y verificando la integridad del código que identifica cada manzana.
Para efectuar la homologación se recomienda tener en cuenta los siguientes puntos:
1. Crear una copia del marco y haga las modificaciones sobre ésta, no sobre el marco original. Debe respetarse la integridad del marco antiguo como referente histórico.
2. Tratar simultáneamente las manzanas que presentan una misma novedad cartográfica y trate por separado las distintas novedades. Esto permite que los procedimientos efectuados para la homologación sean adecuaciones de un estándar para responder a situaciones particulares.
3. Crear un archivo nuevo al que adicionar las manzanas, paulatinamente, conforme se resuelva cada una de las novedades.
4. Guardar una variable que indique qué tipo de novedad presentó la manzana en el momento de la homologación. En ocasiones, las tablas de homologación presentan errores que son detectados fácilmente en campo y guardar la novedad facilita el proceso de corrección de estos errores en el marco y su reporte a la DIG.
5. Además de la homologación cartográfica, es necesario incluir en el marco la información existente que corresponde a cantidad de establecimientos. En el marco con que se cuenta, dicha información tiene un identificador que permite saber su procedencia y con ello, la fecha de su actualización; es importante que esta variable se conserve.
6. La información que se incluya en cantidad de establecimientos depende de la novedad cartográfica que la manzana presente, por esto es tan importante que la homologación se haga en forma simultánea para manzanas con la mismanovedad, y paulatinamente para las distintas novedades. Para el tratamiento de cada una de ellas, se recomienda:
- Manzanas sin novedad: trasladar la información de establecimientos y el identificador de procedencia de un marco al otro sin alteraciones.
- Manzanas reenumeradas: trasladar la información de establecimientos y el identificador de procedencia de un marco a su lugar correspondiente en el otro sin alteraciones.
- Fusión de manzanas: sumar la información correspondiente a las manzanas que participan en la fusión y actualice como dato el total. Coloque como identificador de procedencia de la información, el que corresponda según el marco original.
- División de manzanas: tomar la cantidad de establecimientos de la manzana en cuestión y divídala en partes iguales para asignarla a cada una de las manzanas que resultan de la división. Coloque como identificador de procedencia de la información el correspondiente.
- Creación de manzanas: colocar como información de cantidad de establecimientos, valores 0. Como identificador de procedencia colocar la letra N, señalando que la manzana es nueva y el 0 no es un dato necesariamente cierto.
- Eliminación de manzanas: simplemente no se incluyen en el nuevo marco.
7. Finalmente, se recomienda homologar las manzanas agrupándolas en el siguiente orden: Manzanas sin novedad, Manzanas Renumeradas, Fusiones, Divisiones, Manzanas Nuevas, Otras Novedades.
8. Si existen manzanas en el marco que han dejado de pertenecer a la zona urbana del municipio, deben ser eliminadas.
Una vez concluido el proceso de homologación cartográfica y de inclusión de la información auxiliar existente a nivel de manzana, es conveniente adicionar la información disponible a nivel de municipio - entre ella, una variable que indique a qué cartografía corresponde cada uno luego de la homologación - y estratificar el marco tanto a nivel de municipio como de manzana, conforme a los criterios metodológicos de la Encuesta Nacional de Microestablecimientos de Comercio, Servicios e Industria.
De igual manera, para mantener la memoria histórica del proceso y garantizar su verificabilidad, debe guardarse en un CD el marco antiguo, el marco nuevo, las tablas de homologación utilizadas y el programa o los programas SAS utilizados para efectuar la homologación, debidamente documentados.
Como revisión de calidad al nuevo marco, es útil llevar a cabo un análisis estadístico sobre la presencia de novedades cartográficas por municipio, y comparar tanto la estructura de estratificación de ambos marcos, como la distribución por municipio y general, de la información auxiliar contenida en él. Siempre y cuando las modificaciones cartográficas no sean muy drásticas, la distribución de las variables que corresponden a información auxiliar a nivel de manzana no debe variar sustancialmente.
DISEÑO DE LA MUESTRA
El método de muestreo para este estudio es probabilístico multietápico estratificado de conglomerados para algunos estratos y de elementos para otros.
Probabilístico: las unidades de muestreo en cada una de las etapas (municipios/áreas metropolitanas, manzanas, secciones y establecimientos) tienen una probabilidad de selección conocida y superior a cero de ser seleccionadas.
Multietápico: dado que no existe un marco actualizado de todos los microestablecimientos económicos del país, es necesario llegar a ellos a través de unidades muestrales que los contengan, como municipios o manzanas cartográficas. Debido a los altos costos que implicaría la selección directa de manzanas, el diseño cubre las siguientes etapas:
- Primera etapa: selección de municipios o áreas metropolitanas (UPM).
- Segunda etapa: selección de manzanas o secciones (USM), al interior de las UPM seleccionadas en la etapa anterior.
- Tercera etapa: selección de establecimientos económicos (UFM) dentro de las USM.
Estratificado: se consideran particiones poblacionales, definidas como conjuntos de elementos cuya unión conforma el universo, que no se traslapan y donde todos son diferentes de vacío, esto tratando de lograr homogeneidad dentro de ellas y heterogeneidad entre ellas.
En general, se estratifica por las siguientes razones:
- Necesidad del usuario de contar con estimadores individuales para cada estrato.
- Diferencia de disponibilidad de información auxiliar que permite aplicar, en algunos estratos diseños proporcionales al tamaño o estimadores más sofisticados.
- Diferencia de características operativas, vale decir de costos, tasas y velocidad de respuesta, distancias, aspecto de seguridad, etc., que hacen que el diseño que es eficiente en un estrato, no lo sea en otro.
- Concentración y distribución de la característica en estudio, que permite reducir considerablemente la varianza del estimador, al ampliar la muestra en aquellos estratos en los que se obtiene mayor ganancia en eficiencia y reducirla en los que la pérdida no es muy grande.
TAMAÑO DE LA MUESTRA
Para el cálculo del tamaño de muestra, tanto de comercio como de industria, se determinó un nivel de precisión global deseado (error estándar relativo o coeficiente de variación (CV)),
entre el 5 y el 10% para las variables de interés: ventas, personal ocupado y total de establecimientos; este CV permite presentar la información a nivel estrato.
Al igual que los demás procedimientos realizados en esta metodología el tamaño de muestra se calcula por etapas: primero municipios, luego manzanas o secciones y finalmente
establecimientos, dependiendo del estrato y el subestrato en los cuales se esté trabajando.
En general, la determinación del tamaño de muestra se realiza por simulación siguiendo la metodología de Särndal (1992), en la cual se fija un CV y a partir de éste se halla el tamaño
de muestra despejando n de la fórmula de la varianza del estimador, según el diseño utilizado en cada caso.
Como el diseño es estratificado, al fijar el tamaño de muestra dentro de cada estrato se busca que éste permita alcanzar el CV fijado para el estudio. La estructura de estratificación cumple los principios de independencia e invarianza, por lo cual en la fórmula para el CV de este estudio, la varianza estimada del estimador resulta de sumar las obtenidas en cada estrato y con un procedimiento análogo se llega al estimador del total.
· Fuentes de información: Comercio, servicio e industria.
Para el cálculo del tamaño de muestra de comercio, servicio e industria se hizo uso de la información de ventas obtenida de la Encuesta de microestablecimientos por áreas, realizada en los cuatro trimestres del año 2002.
CÁLCULO DEL TAMAÑO DE MUESTRA :
ESTRATO 1:
Para el cálculo del tamaño de muestra se determinó un intervalo de oscilación del CV entre el 5 y el 10, para las variables de interés. En la primera etapa de la investigación se incluyeron las 24 áreas metropolitanas y dentro de cada una los subestratos ya mencionados. En cada uno de estos subestratos se ajustaron el total y su varianza, estratificando la información disponible de la Encuesta de microestablecimientos
En el caso de la varianza, el ajuste se hizo teniendo en cuenta el tamaño, en términos de USM del subestrato en cada área metropolitana; para el total se manejó la misma idea de ajuste por lo cual fue necesario estimar el promedio de las variables de interés en cada subestrato según la USM, luego se ponderó por el número de USM en el subestrato. El único criterio de ajuste para el total de las variables de interés en el área es que no exceda el del área inmediatamente anterior en importancia.
Se decidió hacer el siguiente ejercicio para poder determinar el tamaño de muestra:
· Bajo el supuesto de estratificar y aplicar al interior de cada estrato MAS (muestreo aleatorio simple), como alternativa para observar el tamaño de muestra óptimo, se utilizó la asignación de Neyman con miras a distribuir en los subestratos el tamaño de muestra determinado inicialmente. Las variables auxiliares fueron la densidad de comercio más servicio y la densidad de industria por manzana, que es más precisa para las 24 áreas metropolitanas, ya que la genera el marco de áreas.
ESTRATO 2:
El trabajo realizado con los 236 municipios que pertenecen a este estrato, para el cálculo de las varianzas y totales estimados, se basó en la información disponible del Censo 2005 para
234 de ellos y de los cuales se determinó el total de establecimientos. Posteriormente, la subestratificación se realizó mediante el método de Hidroglou.
Teniendo estos valores, se procedió al cálculo del tamaño de muestra para las UPM a partir de un diseño MAS.
El diseño a aplicar en este estrato será PPT (proporcional al tamaño), pero el tamaño de muestra se calculó asumiendo MAS, buscando corregir una posible sobreestimación originada en la construcción misma del estrato y la poca disponibilidad de información.
Se determinó tomar doce municipios que permiten tener un CV: 12.5% para el total de establecimientos.
Luego se procedió a calcular los tamaños de muestra para las USM en el subestrato de inclusión probabilística. Se determinó que el mayor peso a la varianza total se encuentra en
las UPM con un aporte del 94%; por lo tanto, el tamaño de muestra de las USM no influirá en el CV. Se seleccionarán como mínimo 3 secciones para los municipios con menos de 10
secciones y un máximo de 10 secciones para los municipios con más de 100 secciones.
ESTRATO 3 :
En este estrato sólo se hace cálculo de tamaño para UPM debido a que dentro de éstas se realiza censo de establecimientos. Para determinar los totales y las varianzas se utilizó al igual que en el estrato anterior la información económica del Censo General 2005 filtrando los municipios que pertenecen a este estrato para hacer las estimaciones. El tamaño de muestra final fue 15 municipios, con base en criterios operativos; no se presentan CV debido a que son mayores al 15%.
Debido a que no se puede determinar el aporte de cada estrato al CV global, puesto que la variable utilizada para determinar los tamaños de muestra en el estrato 1 fue el total de ventas y para los estratos 2 y 3, el total de establecimientos, se presentan los CV solamente por estrato.
Mode of data collection
---------------------------
Entrevista con encuestadores (Cara a cara [f2f])
Research instrument
---------------------------
BASE CONCEPTUAL
El marco conceptual determinado para la Encuesta de microestablecimientos se basa en los conceptos que se manejan en los sectores de comercio, servicios e industria, las definiciones de las variables que se investigan, las recomendaciones internacionales, las adaptaciones que de éstas ha realizado el DANE para los censos económicos, la experiencia de su aplicación en la ejecución de las encuestas a este sector de la economía nacional y la clasificación de la actividad contenida en la Clasificación Industrial Internacional Uniforme de todas las actividades económicas, revisión 3, adaptada para Colombia -CIIU REV.3 A.C.
En este contexto, y con el fin de darle claridad a los conceptos antes mencionados, se afirma que el comercio es la reventa (compra y venta sin transformación) de mercancías o productos, ya sea que ésta se realice al por menor o al por mayor. Incluye las actividades de los corredores, agentes, subastadores y comisionistas, dedicados a la compra y venta de mercancías a nombre y por cuenta de terceros. Los servicios son las ventas de bienes intangibles sobre los cuales no recae ninguna propiedad. La industria es toda actividad de transformación en productos nuevos.
Por su parte, la empresa se conoce como toda unidad económica, o combinación de unidades económicas, propietaria o administradora que, actuando bajo una denominación jurídica única, abarca y controla directa o indirectamente todas las funciones y actividades necesarias para el desarrollo y realización del objeto social para el que fue creada.
Asimismo, se le reconoce como establecimiento a aquella unidad más pequeña (una empresa o parte de una empresa) que se dedica de manera independiente, de forma exclusiva o predominantemente a un solo tipo de actividad en un emplazamiento o zona geográfica. Presenta la mayor homogeneidad posible, tanto en términos de actividad como de ubicación geográfica, pero al mismo tiempo los niveles más bajos de autonomía. Los establecimientos son identificados desde el marco de áreas.
Para concluir, y como referente importante, se encuentra la Actividad CIIU Rev.3 A.C, la cual se define como la Clasificación Internacional Industrial Uniforme, revisión 3, adaptada para Colombia que se utiliza para establecer una estructura dentro de la cual deben presentarse las estadísticas de las actividades económicas de los diferentes sectores productivos del país. El término actividad utilizado en este contexto se refiere a un proceso productivo, es decir, a la combinación de acciones que conduce a la obtención de un conjunto dado de bienes y/o servicios.
Se define a los microestablecimientos como unidades económicas con no más de 9 trabajadores y que no tengan más de tres sucursales, incluida la principal. Estas últimas son medidas por las encuestas anuales de comercio, servicios e industria, y por tal razón
no se incluyen dentro de esta investigación.
DISEÑO DE INSTRUMENTOS
INSTRUMENTOS DE RECOLECCIÓN
ENLISTAMIENTO
Es el proceso mediante el cual se identifican y registran las unidades como establecimientos industriales, comerciales y de servicios que van a ser objeto de entrevista, en una manzana seleccionada según los parámetros de la investigación. Para realizar el enlistamiento de las diferentes unidades económicas, se diseñó un formato de enlistamiento.
Este formato contiene la siguiente estructura:
- CABEZOTE
Relaciona la entidad responsable (DANE), el título del formato y la confidencialidad de la información.
- IDENTIFICACIÓN CARTOGRÁFICA
Contiene la información que identifica la ubicación cartográfica. Para el DANE son variables importantes: UM (Unidad de muestreo), Departamento, Municipio, Sector,
Sección y Manzana.
- IDENTIFICACIÓN DEL ESTABLECIMIENTO ECONÓMICO
Contiene la información del establecimiento con las variables que determinan su clasificación.
- CUADRO RESUMEN
Contiene un resumen de la información consolidada, con el objetivo de actualizar el marco de áreas.
- OBSERVACIONES
Espacio disponible para anotar cualquier observación realizada por el personal responsable de su diligenciamiento; asimismo, identifica la información de los responsables de la recolección (supervisor, encuestador) y fecha de diligenciamiento.
ENTREVISTA
Para facilitar el proceso de recolección de información en los diferentes establecimientos económicos identificados en el enlistamiento, se utiliza un formulario único
que cuenta con la siguiente estructura:
- CABEZOTE
Relaciona la entidad responsable (DANE), el título de la investigación y la confidencialidad de la información.
- IDENTIFICACIÓN DEL CUESTIONARIO
Relaciona la información para el manejo interno de cada cuestionario, sus variables son: mes, trimestre y el número del cuestionario.
- IDENTIFICACIÓN CARTOGRÁFICA
Contiene la información que identifica la ubicación cartográfica. Para el DANE, las variables son: USM (Unidad secundaria de muestreo), departamento, municipio, sector, sección, manzana.
- CODIGOS - VISITAS
Contiene información sobre código de supervisor y encuestador, así como la fecha y hora de las visitas realizadas al establecimiento
- OBSERVACIONES
En esta parte del formulario va un espacio para colocar las observaciones a que haya lugar en cada una de las visitas al establecimiento.
- IDENTIFICACIÓN DEL ESTABLECIMIENTO ECONÓMICO
Información del establecimiento con las variables que determinan su identificación: Nombre comercial, dirección, teléfono, razón social, CC o NIT; además de información sobre características del establecimiento, registro mercantil, renovación del mismo, tipo de emplazamiento, tipo de establecimiento (único, principal, sucursal, unidad auxiliar), organización jurídica, tiempo de funcionamiento del negocio, contabilidad y la información sobre la gerencia general.
- CARACTERÍSTICAS GENERALES DE LA ACTIVIDAD ECONÓMICA
Aspectos generales sobre la identificación de la actividad económica del establecimiento (comercio, servicios e industria).
- EVOLUCIÓN TRIMESTRAL
Caracteriza al personal que labora en el establecimiento, según tipo de contratación y género; la producción, ventas o ingresos: Información sobre el valor de la producción, ventas o ingresos del establecimiento.
- ESTRUCTURA ANUAL
Recoge información sobre el personal ocupado; costos, gastos, ventas, ingresos o producción; activos fijos durante el año y área del establecimiento.
- FUENTE , CARGO, TELÉFONO, NOMBRE Y RESULTADO DE LA ENTREVISTA
Identifica el estado final de la entrevista, así como un espacio para la fuente, cargo, teléfono y nombre.
OBSERVACIONES
Es el espacio en donde se anotan las observaciones a que haya lugar.
Cleaning operations
---------------------------
CONSOLIDACIÓN DE ARCHIVOS
Los archivos se consolidan en las tablas del sistema GEA según el código de la encuesta, las tablas se visualizan en Oracle con todas las variables de los formularios.
Cuando se termina el operativo de campo, se ejecutan los programas de validación y consistencia; este arroja tablas de errores para corregir. En el momento que se efectúan dichas correcciones, se ejecuta nuevamente este procedimiento para verificar la corrección y se procede a la imputación en caliente.
IMPUTACIÓN
En la encuesta de microestablecimientos se aplican dos métodos de imputación:
Imputación en frío: consiste en usar valores o reglas predeterminadas en los casos de ser necesario imputar el valor de una variable. El valor se obtiene de una encuesta anterior, de un experto en la temática, de un dato histórico y se trata simplemente de encontrar el mejor valor aproximado. Este método se puede aplicar cuando los datos a imputar son muy pocos y otros procedimientos de imputación no arrojan resultados satisfactorios.
Imputación en caliente: consiste en una serie de métodos que comparte el mismo principio básico, el cual señala que un dato por imputar se reemplaza por un dato
obtenido de los registros de la misma encuesta. Para este tipo de imputación, la base de datos de la encuesta se divide en dos partes: la primera contiene los registros con al menos un dato faltante, inválido o inconsistente y que se llamará conjunto de datos errados o de receptores. La segunda parte contiene todos los registros con datos absolutamente limpios y se denomina el conjunto de donantes.
La idea en esta imputación es que para cada registro del conjunto de los receptores se encuentre un donante muy similar en el otro conjunto a fin de que el dato faltante pueda ser reemplazado por el mismo valor que tiene el donante para esa variable.
En este proceso se debe tener en cuenta la similitud entre los donantes y los receptores. Para determinar la similitud se escogen variables que se correlacionan directamente con la variable que se va a imputar y los donantes deben tener las mismas características.
Este proceso se hizo en tres formas: estableciendo con el valor del período anterior, verificando que la actividad sea la misma y que el número de empleados no varíe en más del 10%; o buscando un donante que cumpliera con las mismas condiciones anteriores; o finalmente en frío, determinando el valor más adecuado que pudiera asumir el campo. Por ejemplo, para el campo que corresponde al género del personal ocupado según la tabla de consistencia, se debe marcar para imputar. Las especificaciones de imputación indican que se debe buscar un conjunto de donantes que tengan el mismo número de personas ocupadas y la misma actividad. Dentro de este subconjunto se escoge un establecimiento al azar y se asume el valor del campo. Para cada uno de los campos a imputar, en una tabla se señalan las especificaciones correspondientes.
Response rate
---------------------------
ERRORES DE MUESTREO
Cuando la magnitud de la variabilidad es muy grande, los parámetros estimados pierden utilidad, pues el valor verdadero del parámetro en el universo, puede estar en un intervalo muy amplio, lo cual no proporciona información útil. Para tal objetivo, es necesario definir el coeficiente de variación estimado.
COEFICIENTE DE VARIACIÓN ESTIMADO
La varianza del estimador está dada en unidades generalmente de difícil manejo y por ello, se utiliza una medida relativa con base en valores porcentuales, denominada coeficiente de variación estimado (cve).
Criterios para utilizar el coeficiente de variación estimado.
Una estimación se considera de buena calidad si su CVE es menor del 5%; práctica, entre el 5 % y el 10%; aceptablemente practico, si es mayor del 10 % y menor del 15%, y de uso restringido, si es mayor del 15%.
Sampling error estimates
---------------------------
Es importante aclarar que una modificación en los factores de expansión usualmente genera sesgo en los estimadores que se emplean para la generación de cifras. Los procedimientos de ajuste parten de suponer que el comportamiento de las unidades para las que no se tiene información es igual al de las unidades para las cuales sí se tiene, supuesto no verificable. En la medida en que el comportamiento real de las unidades sin información difiera del que se ha observado en las otras, las estimaciones producidas se alejarán del verdadero valor del parámetro; adicionalmente, los estimadores que se utilizan en la encuesta son insesgados o aproximadamente insesgados, al modificar los factores de expansión es posible que estas propiedades se pierdan.
Hay unos pocos casos particulares en que es posible utilizar una herramienta alternativa para subsanar el problema de pérdida de información que se presenta en la encuesta.
Cuando se recolecta información de Estructura (anual) y de Evolución (mensual) y un establecimiento que puede rendir para ambas contesta la de Evolución y rechaza la de Estructura, es posible utilizar su información de Evolución para imputar la correspondiente a Estructura. De igual manera, cuando se produce un rechazo en bloque de los comerciantes de alguna manzana de alta densidad que es visitada todos los trimestres, es posible utilizar su información anterior para hacer una imputación de la nueva, en lugar de efectuar un ajuste de factores.
Supervisión y control del operativo de recolección Consisten en:
- Verificar la realización del enlistamiento de los establecimientos económicos en las manzanas seleccionadas.
- Verificar diariamente el buen desempeño de las actividades de cada encuestador dentro de los límites de su manzana, aclarando las dudas sobre ubicación de los establecimientos económicos y utilización del DMC.
- Verificar la cobertura de establecimientos económicos de cada encuestador; para esta labor debe tenerse en cuenta:
- Confrontar que la ubicación de los establecimientos económicos visitados por sus encuestadores corresponda con las referenciadas en el formato listado de establecimientos.
- Revisar el DMC con la información de formatos y cuestionarios entregados a diario, para observar su correcto diligenciamiento y tomar las medidas tendientes a mejorar su calidad.
- Realizar visitas de supervisión de información a los establecimientos seleccionados.
- Revisar detalladamente los formatos de enlistamiento y cuestionarios diligenciados por los encuestadores antes de cerrar las respectivas USM en el DMC.
En el caso de centros comerciales, sanandresitos, edificios, bloques de apartamentos y similares, el supervisor previamente habrá hecho una visita a la respectiva administración para informar respecto del trabajo que se va a realizar y pedir su autorización, si es necesario.
En cuanto a cobertura, el DANE central se encarga de enviarla diariamente a cada una de las sedes y subsedes de las direcciones territoriales, con el avance de la transmisión y se generan cuadros en los que se reporta el rendimiento por encuestador y por resultado de encuesta para efectuar el control de calidad del operativo y hacer seguimiento al trabajo
desarrollado en campo.
Data appraisal
---------------------------
ANÁLISIS ESTADÍSTICO
ANÁLISIS DESCRIPTIVO
El análisis descriptivo ayuda a observar el comportamiento de la muestra en estudio, a través de tablas, gráficos, intervalos de confianza y estadísticas de tendencia y dispersión.
Se analiza en la muestra la estructura de los indicadores por dominios de estudio a partir de la distribución de frecuencias y se detectan posibles inconsistencias y valores atípicos.
Se verifica la cobertura a nivel de segmento, viviendas, hogares y personas y se observa la distribución de la pérdida de muestra para realizar los respectivos ajustes de la no respuesta.
ANÁLISIS INFERENCIAL
El análisis inferencial tiene como objetivo realizar la estimación de la muestra a la población objetivo. En este proceso se aplican los factores de expansión y se revisa la
inferencia a la población objetivo establecido para los correspondientes dominios de estudio.
Se verifica que los ajustes del factor de expansión finales no generen sesgos en las estimaciones y que sus errores muestrales sean aceptables de acuerdo con los
parámetros establecidos por dominios de estudio.
ANÁLISIS DE COHERENCIA
La coherencia de los resultados se realiza mediante el análisis de la serie histórica por ciudad para cada etapa de la encuesta, Estructura (serie anual) y Evolución (serie
trimestral). El equipo de Temática y Muestras revisa los rangos para los coeficientes de variación, las variaciones entre las variables principales, la participación de la variables, indicadores de participación, la consistencia con resultados históricos cuando se presentan comportamientos atípicos y determinar su ajuste o justificación. Finalizada la revisión, se procede a la realización del boletín de prensa.
ANÁLISIS DE ESTADÍSTICAS PRODUCIDAS
El análisis de las estadísticas producidas se evalúa con el coeficiente de variación (CV) o error relativo estándar, que tanto para comercio, servicio e industria se determina un nivel de precisión global deseado entre el 5 y el 10 por ciento para las variables de interés.
ANÁLISIS DE CALIDAD DE RESULTADOS
La necesidad de un ajuste en los factores de expansión surge, básicamente, de la no respuesta que puede presentarse en cada una de las etapas del diseño muestral. Existen otras formas de solucionar el problema de pérdida de muestra, destacándose entre ellas la imputación como una muy importante alternativa. Sin embargo, si no se cuenta con información para llevar a cabo una buena imputación y los porcentajes de pérdida de muestra se mantienen bajos –por ejemplo, por debajo del 5%– un ajuste puede subsanar el inconveniente sin mayores repercusiones.
Es importante aclarar que una modificación en los factores de expansión usualmente genera sesgo en los estimadores que se emplean para la generación de cifras. Los
procedimientos de ajuste parten de suponer que el comportamiento de las unidades para las que no se tiene información es igual al de las unidades para las cuales sí se tiene, supuesto no verificable. En la medida en que el comportamiento real de las unidades sin información difiera del que se ha observado en las otras, las estimaciones producidas se alejarán del verdadero valor del parámetro; adicionalmente, los estimadores que se utilizan en la encuesta son insesgados o aproximadamente insesgados, al modificar los factores de expansión es posible que estas propiedades se pierdan.
Hay unos pocos casos particulares en que es posible utilizar una herramienta alternativa para subsanar el problema de pérdida de información que se presenta en la encuesta. Cuando se recolecta información de Estructura (anual) y de Evolución (mensual) y un establecimiento que puede rendir para ambas contesta la de Evolución y rechaza la de Estructura, es posible utilizar su información de Evolución para imputar la correspondiente a Estructura. De igual manera, cuando se produce un rechazo en bloque de los comerciantes de alguna manzana de alta densidad que es visitada todos los trimestres, es posible utilizar su información anterior para hacer una imputación de la nueva, en lugar de efectuar un ajuste de factores.
¿En qué casos se presenta la necesidad de un ajuste? En la primera etapa, en la selección de municipios, puede requerirse si por problemas de orden público es imposible acceder a un municipio, hecho que sucede con mayor frecuencia en los municipios de estratos 3 y 4. En la segunda etapa, en la selección de manzanas o secciones*, puede ser necesario un ajuste si ha sido imposible obtener información para algunas de ellas, bien sea por problemas de seguridad, imposibilidad de ubicarlas en cartografía o rechazo en bloque de los comerciantes de alguna manzana de alta densidad.
En cuanto a la última etapa, la de selección de establecimientos, se han detectado dos situaciones en las que se produce pérdida de muestra: en primer lugar, por motivos de organización y presupuesto, en algunas ocasiones es imposible completar el proceso de entrevista en las fuentes que han sido seleccionadas, existe un cierto número de establecimientos que pese a pertenecer a la muestra, no tienen formulario grabado en el archivo de Formularios. En segundo lugar, se produce pérdida de muestra cuando, a pesar de la insistencia del equipo de campo, el establecimiento seleccionado rechaza la entrevista, o se encuentra cerrado en todas las revisitas, o el emplazamiento aparece desocupado aunque en el enlistamiento no lo estaba. En estos casos, aparece grabado un formulario en el mencionado archivo, con resultado de encuesta rechazo –R-, cerrado –C- o desocupado (D), según corresponda.
Con respecto a los establecimientos Fuera de Universo en el momento de la entrevista y los considerados como Nuevos, no son evaluados como pérdida de muestra; ninguno de ellos tiene información que rendir para el período de referencia que es de interés en la encuesta.
Por tanto, se puede definir en qué consiste el ajuste. El procedimiento de ajuste aplicado en la encuesta de Microestablecimientos de Comercio, Servicios e Industria consiste, fundamentalmente, en una distribución de los factores de expansión de los elementos que son considerados pérdida de muestra, entre aquellos que no lo son. La elección de cuáles son los elementos que se consideran pérdida de muestra se ha detallado en los párrafos anteriores y la de quiénes son aquellos que han de recibir parte de ese factor, depende de la etapa de diseño en que se produzca el ajuste. En todo caso, se procura que la distribución del factor de una unidad se haga entre las unidades que participaron con ella en el proceso de selección.
Dicho de otra manera, el ajuste de factores de un establecimiento enlistado como comercio, con resultado de encuesta Rechazo, se efectúa entre los demás
establecimientos enlistados como comercio dentro de esa manzana. El ajuste de factores de una manzana que no fue encontrada en cartografía se lleva a cabo distribuyendo su factor de expansión entre las demás manzanas de su subestrato de diseño y ciudad (en el caso de subestratos 1, 2 y 4 y entre las demás de su sección* en el caso del subestrato 3). El factor de expansión de un municipio de estrato 4, perdido por problemas de orden público, se distribuye entre los demás municipios seleccionados como muestra en el estrato 4.
El ajuste de factores de expansión se lleva a cabo de atrás hacia adelante, es decir, de la última etapa a la primera, obteniéndose un factor para cada etapa. Dicho factor puede variar de estrato en estrato para la primera etapa de selección, dentro de cada ciudad y subestrato, por sector económico para la segunda etapa y, dentro de cada manzana, por sector económico para la tercera etapa.
La razón por la cual el factor de ajuste para la segunda etapa puede variar para cada subestrato y ciudad, por sector económico es que, si por ejemplo, en una manzana todos los establecimientos de comercio entrevistados tienen resultado de encuesta cerrado, rechazo o desocupado, no existe un establecimiento para distribuir este factor. En este caso, la manzana puede figurar como sin respuesta para el sector comercio, pero no así para servicio o para industria, por eso es posible que requiera ser ajustada solamente para esta actividad. Por esta misma razón es necesario efectuar el ajuste desde la última etapa hasta la primera, para verificar los casos en que no hay una unidad que pueda actuar como receptora de los factores de las unidades sin información.
Como una de las causas del ajuste de manzanas es que todos los formularios de cierta actividad tienen como resultado de encuesta cerrado, rechazo o desocupado, el factor de ajuste de manzanas puede cambiar no solo para distintas combinaciones de subestrato y ciudad sino que, además, dentro de un mismo subestrato y ciudad puede tomar tres valores diferentes: uno para cada actividad de enlistamiento.
En el estrato uno de municipios –Áreas metropolitanas– el ajuste se hace no dentro de cada ciudad – subestrato sino dentro de cada combinación Área Metropolitana –
subestrato. En los subestratos tres de los estratos uno y dos, como la unidad de selección es la sección* en lugar de la manzana, se ajustan las manzanas al interior de su sección*. Si llegase a perderse una sección* completa debería ser ajustada por las demás secciones* del municipio o Área metropolitana según corresponda. Esto no es frecuente.
Solamente pueden ajustarse municipios de estratos tres y cuatro, y en ningún caso puede ajustarse más del 10% del tamaño de muestra seleccionado. Previsiones similares deben tenerse en el ajuste de cada una de las etapas.
Una vez construidos los factores de ajuste para cada una de las etapas, se recomienda efectuar las multiplicaciones correspondientes con los factores de expansión básicos, para trabajar con ellos en la etapa de procesamiento. Vale la pena resaltar que, utilizando esta metodología, los tamaños de muestra y de universo n y N que ingresan a la estimación de varianza son los originales, independientemente del ajuste efectuado.
Ahora, es necesario un paso adicional previo al proceso de estimación de varianza. Como se han ajustado los factores, se supone que la estimación que se efectúa es una estimación por dominios, sobre el dominio de los respondientes; por esta razón, es necesario que en el archivo de formularios que entra al procesamiento, estén todos los registros previstos conforme al esquema de muestreo utilizado, es decir, no pueden eliminarse los establecimientos con resultado de encuesta Cerrado, Rechazo o Desocupado, aunque hayan sido ajustados; deben ingresar como pertenecientes al dominio de No Respondientes, con valores 0 en las variables de procesamiento.
De igual manera, los formularios que no se encuentran en el archivo pero debieran estar, deben ser creados en las manzanas correspondientes y con la actividad de enlistamiento respectiva. También debe adicionarse un registro por cada manzana ajustada, para que ingrese a la estimación de varianza de la segunda etapa y en caso de haber ajustado municipios, un registro también por cada uno de ellos.
Es importante anotar que el ingreso de estos denominados Registros Cero, tiene un impacto menor en la estimación de varianza, pero no debe tener ningún efecto en el
proceso de estimación de parámetros. Como se efectúa una estimación de dominios, los valores cero de estos registros no suman en los totales de las variables, pero tampoco entran en los conteos; es decir, si por ejemplo se está procesando el valor promedio de ventas por establecimiento, un cero de uno de estos registros no sumará en el total de ventas pero, por no pertenecer al dominio de los respondientes, tampoco contará en el número de establecimientos sobre el que se dividirá este total.
自2000年起,国家统计局开始实施商业、服务业和工业微型企业调查,以衡量至多九人就业的单位的经济状况或发展演变及其结构。哥伦比亚是拉丁美洲仅有的两个进行此类测量的国家之一,另一个是墨西哥,它正在衡量微型企业的活动。自2009年起,研究对象为至多九人(9人)就业的单位。采用的测量方法是通过区域框架,因为存在巨大的动态性。根据同一调查的数据,微型企业的年出生率约为35%。因此,这些单位的目录很快就会过时;此外,这些单位未在商会或公共机构注册。
该方法用于家庭调查,例如生活质量、收入和支出。收集成本很高,因为地理区域(抽样段)的选择及其在各个经济部门、全国覆盖范围以及微型企业主要变量中的代表性。
提供机构:
microdatos.dane.gov.co



