Encuesta Anual de Servicios - EAS - 2006 - Colombia
收藏microdatos.dane.gov.co2018-09-25 更新2025-03-24 收录
下载链接:
https://microdatos.dane.gov.co/index.php/catalog/488
下载链接
链接失效反馈官方服务:
资源简介:
Resumen
---------------------------
“Los servicios son productos heterogéneos generados cada vez que son solicitados, sobre los cuales no recaen derecho de propiedad por parte del usuario y no pueden ser negociados separados de su producción, ni pueden ser transportados ni almacenados. Lo que se vende es el derecho al uso de un servicio cada vez que sea requerido”.
La importancia del sector servicios en la economía colombiana medida en términos de su participación en la producción nacional (52,6% del PIB Nacional) y el empleo (61,7% población ocupada por ramas de actividad) planteó la necesidad de contar con información estadística para realizar seguimiento y análisis de su comportamiento.
El DANE, en el marco de su misión institucional y en su esfuerzo permanente por presentar al país cifras oportunas y confiables, desarrolla procesos de medición encaminados a cubrir actividades desprovistas de información estadística. En este sentido, en 1995 se dio inicio a la Encuesta Anual de Servicios para las actividades de servicios de hoteles, restaurantes y agencias de viajes. De acuerdo con el diseño de la investigación, año tras año se agregaron otros servicios dependiendo de los requerimientos de información. De esta manera, en 1997 se incluyó la actividad de publicidad; en el 2000 los servicios de obtención y suministro de personal, seguridad privada, y las actividades de informática y correo; y en el 2003, los servicios de telecomunicaciones.
Posteriormente, como parte del Plan de Mejoramiento de las estadísticas de servicios y como resultado del diagnóstico de las necesidades de información del sector derivado del trabajo interinstitucional (DANE, Departamento Nacional de Planeación, Banco de la República y Ministerio de Comercio, Industria y Turismo), se estableció el ajuste de la encuesta anual de servicios a partir del año 2006, con la unificación de los instrumentos de recolección en un formulario único y la ampliación de la cobertura de la investigación a otras actividades de servicios.
De esta manera, el alcance de la encuesta actual lo constituyen los subsectores de hoteles y restaurantes, actividades complementarias y auxiliares al transporte, agencias de viajes, correo y telecomunicaciones, actividades inmobiliarias, empresariales y de alquiler, educación superior, actividades relacionadas con la salud humana, actividades de cinematografía, radio y televisión y otras actividades de entretenimiento y de servicios.
Los resultados permitirán suministrar a los diferentes usuarios información estadística para el análisis de la producción y el empleo del sector, para la caracterización de los diferentes subsectores, como insumo para la planeación y políticas sectoriales y como instrumento de negociación en los acuerdos internacionales.
Este documento tiene como propósito dar a conocer al usuario y al público en general, la metodología de la Encuesta Anual de Servicios, además contribuirá a fomentar la transparencia y la confianza en la calidad técnica de las estadísticas de esta investigación, buscando así un mejor uso de la información producida.
Analysis unit
---------------------------
UNIDAD DE OBSERVACIÓN
La unidad de observación es la empresa con NIT que de manera exclusiva o predominante se dedica a las actividades de servicios investigadas dentro del territorio nacional.
UNIDAD DE ANÁLISIS
Es la empresa con NIT, que de manera exclusiva o predominante se dedica a las actividades de servicios investigadas dentro del territorio nacional.
UNIDAD DE MUESTREO
Es la empresa con NIT, que de manera exclusiva o predominante se dedica a las actividades de servicios investigadas dentro del territorio nacional.
Universo de estudio
---------------------------
Son las unidades económicas formalmente establecidas (con NIT y registro mercantil) ubicadas en el territorio nacional y dedicadas a prestar los servicios de hoteles y restaurantes (sección H), actividades inmobiliarias, empresariales y de alquiler (sección K), actividades complementarias y auxiliares de transporte, actividades de agencias de viajes (división 63); correo y telecomunicaciones (división 64); servicios de educación superior (8050); actividades relacionadas con la salud humana (851), actividades de cinematografía, radio, televisión y otras actividades de entretenimiento (921) y otras actividades de servicios (división 930).
Kind of data
---------------------------
Censos (cen)
Sampling procedure
---------------------------
DISEÑO MUESTRAL
MARCO MUESTRAL
El marco de muestreo para las empresas de servicios es de lista, su cobertura es nacional y para su construcción se partió en 1995 del Directorio de Servicios obtenido en el Censo Económico del año 1990. Este se actualizó con información de la Superintendencia de Sociedades, Superintendencia de Vigilancia y Seguridad Privada, Cooperativas, Confecámaras, Gremios, Viceministerio de Turismo, Páginas Amarillas, Encuestas Anuales, mensuales y trimestrales del DANE.
La última actualización al directorio se realizó en 2008 con información de diferentes fuentes; datos de la encuesta de microestablecimientos del DANE, el operativo de verificación de actividad económica (CIIU) para unidades económicas con personal ocupado mayor a 10 realizado en 2008, la encuesta anual de servicios del 2007, operativos de contac center, e-mails y fax. Teniendo en cuenta la cobertura temática, el tamaño del marco de producción de servicios es de 65.989 empresas y cuenta con información auxiliar en las variables de actividad económica, ingresos y personal ocupado de cada empresa.
El diseño de registro está conformado por las variables: nombre del campo, la descripción, el tipo de dato (autonumérico, numérico, fecha, texto), la longitud y el valor que debe tomar. La estructura del directorio está conformada por 61 variables.
DISEÑO DE LA MUESTRA
El tipo de muestreo aplicado es probabilístico estratificado de elementos.
La razón para estratificar se debe a la disponibilidad de información auxiliar que permite detectar diferencias y dividir la población en estratos, en este caso la información auxiliar corresponde por un lado a la Sección Económica CIIU, la cual genera estratos temáticos y, por otra parte, las variables de diseño generan estratos según el tamaño de la empresa, lo cual reduce la varianza y permite contar con estimadores individuales para cada estrato.
De acuerdo con los objetivos, se conformaron seis estratos por actividad de servicios. Los límites establecidos para cada uno de los estratos.
El universo se organizó en estratos caracterizados por ser homogéneos de acuerdo a los siguientes criterios: En primer lugar, de acuerdo a la principal actividad económica de la empresa, según el código de la Clasificación Industrial Internacional Uniforme Revisión 3 adaptada para Colombia.
En segundo lugar, por ingresos anuales y cantidad de personal ocupado. Se conformaron subestratos dentro de cada estrato según los ingresos y el personal ocupado, se estableció así, dado que en cada estrato de estudio la población tiene una distribución asimétrica, con unas pocas unidades grandes y muchas unidades pequeñas. Es necesario considerar un grupo autorrepresentativo de unidades grandes o de inclusión forzosa (IF) y otro de inclusión probabilística (IP) con las unidades restantes. Para la determinación de estos dos grupos se usó el método de Hidiroglou.
MÉTODO DE HIDIROGLOU
Para un nivel de precisión dado proporciona un algoritmo para dividir la población en un estrato de inclusión forzosa y otro de inclusión probabilística con el fin de minimizar la varianza del estimador de un diseño de muestreo aleatorio simple estratificado, asumiendo muestreo aleatorio simple sin reemplazamiento en el estrato de inclusión probabilística.
Bajo el principio de que la población tiene una distribución asimétrica, para un diseño de Muestreo Aleatorio Simple Estratificado la varianza del estimador tiene un comportamiento parabólico con un mínimo que se puede encontrar por un método interactivo, este punto establece el límite a partir del cual se considera una empresa grande, para ello se aplica la ecuación.
El algoritmo del método es de manera general el siguiente:
- Se ordena de mayor a menor la variable de diseño.
- Se toma la empresa más grande como forzosa y se calcula la varianza de las restantes.
- Se toman las dos empresas más grandes como forzosas y se calcula la varianza de las restantes.
- Este proceso se repite aumentando en cada paso el número de empresas forzosas hasta que la varianza sea mínima. El valor de la variable de diseño en este punto se considera el límite del subestrato de las empresas que se consideran grandes, en general se considera de inclusión forzosa.
Para el subestrato probabilístico se utilizó el método Muestreo Aleatorio Simple para la selección de las unidades. Para esto se usó el método coordinado negativo que consiste en realizar N (tamaño del estrato probabilístico) ensayos con una distribución de probabilidad uniforme (0,1), asignar estos números a cada uno de los elementos del universo, ordenar los elementos respecto a los valores aleatorios y considerar como muestra los elementos correspondientes a los n (tamaño de muestra) valores aleatorios más pequeños.
Por limitaciones de presupuesto no se pudo seleccionar muestra probabilística para cada subestrato. Se planteó realizar la recolección de información sólo en el subestrato de inclusión forzosa, es decir, el estrato de las empresas más grandes, la cual se llamó censo de grandes empresas de servicios.
Mode of data collection
---------------------------
Autodiligenciamiento de formulario electrónico vía página web (por selección; por ejemplo en encuestas por muestreo o censos)
Research instrument
---------------------------
El formulario cuenta con un módulo adicional correspondiente a Tecnologías de Información y Comunicaciones TIC cuyo objetivo es identificar el uso de tecnologías implementadas en las empresas investigadas, cuyos resultados se publican en un boletín específico para este tema.
El diligenciamiento del formulario se hace a través de la página Web, lo que permite además del ahorro de papel, que los procesos de captura y consistencia de la información sean más eficientes. En ese sistema la empresa puede imprimir o visualizar en pantalla el manual de diligenciamiento donde se presentan las instrucciones básicas para cada uno de los capítulos.
La estructura del formulario está organizada de la siguiente manera:
- Capítulo I. Identificación y datos generales.
- Capítulo II. Ingresos netos operacionales y no operacionales.
Numeral 1. Distribución de los ingresos según origen.
Numeral 2. Ingresos por servicios prestados (código CPC 1.1).
- Capítulo III. Costos y gastos operacionales y no operacionales.
Numeral 1. Gastos operacionales (gastos causados por el personal ocupado).
Numeral 2. Otros costos y gastos operacionales causados.
Numeral 3. Distribución de los costos y gastos según destino.
- Capítulo IV. Personal ocupado promedio del año.
- Capítulo V. Movimiento de activos fijos tangibles.
- Capítulo VI. Depreciación de los activos fijos tangibles.
Numeral 1. Movimiento de la depreciación acumulada.
Numeral 2. Método de depreciación utilizado.
- Capítulo VII. Activos fijos intangibles.
- Capítulo VIII. Distribución a nivel de departamento.
- Módulo de telecomunicaciones, desde el punto de vista de la oferta.
- Módulo de tecnologías de la información y la comunicación, desde la demanda.
Cleaning operations
---------------------------
CONSOLIDACIÓN DE ARCHIVOS
En el momento de captura de la información, el sistema (en línea) automáticamente comienza a consolidar la base de datos, adicionalmente las Direcciones Territoriales monitorean la calidad de la información recolectada y la cobertura por Territorial y Subsede.
NORMAS DE VALIDACIÓN Y CONSISTENCIA
Para la validación y consistencia de la información se elaboran especificaciones para cada una de las variables del formulario, las cuales son incluidas en el aplicativo de captura. En estas se relaciona el nombre nemotécnico, el tipo y longitud del campo, el valor que debería tener la variable, la condición para que sea consistente, el mensaje que debe presentarse si no es consistente y el tipo de error.
De esta manera, si la empresa diligencia la encuesta a través de la página web, el sistema le indicará los datos faltantes o inconsistentes
y le dará la opción de registrar la información, o de corregir o de relacionar la observación correspondiente. De igual forma, si el formulario es diligenciado en papel y el crítico realiza el proceso de captura en el sistema, este le mostrará las inconsistencias que se presenten (sumatorias entre filas y columnas, cruces intercapítulos) y deberá verificar con la fuente y corregir o registrar la observación si fuera el caso. Algunos errores denominados forzados pueden ser validados bajo la absoluta responsabilidad y conocimiento del coordinador de la encuesta.
En el aplicativo de captura son incorporados rangos de aceptación para las participaciones y variaciones de las principales variables, lo que le permite al crítico obtener un reporte con los datos del año de referencia, del año anterior y la correspondiente variación. Si esta variación es alta en relación con los rangos establecidos.
PROCESAMIENTO DE DATOS
VERIFICACIÓN DE LA CONSISTENCIA INTERNA DE LOS DATOS Y AJUSTES
La etapa de crítica y codificación de los formularios se realiza después de la recepción de la información, con el fin de verificar su consistencia. El objetivo primordial de esta etapa es que la información tenga consistencia de acuerdo con los parámetros establecidos en el manual de diligenciamiento y crítica. Así mismo, el aplicativo contiene las especificaciones de consistencia, cuyo objetivo es detectar los datos incorrectos en cada formulario, en el momento de la captura de los datos.
Cuando esto ocurre, el programa envía un mensaje solicitando corrección u observación aclaratoria. Estos chequeos se hacen a nivel de empresa, individualmente.
En general, los procedimientos que se siguen son:
- Detectar datos faltantes, inválidos o incompatibles.
- Localización de datos atípicos, comparar datos de encuestas o censos anteriores o datos de otras fuentes.
- Se verifica que la información prediligenciada sea correcta.
- Se completa la información omitida con ayuda de la fuente.
- Se revisa que se hayan verificado los cruces indicados en el formulario; esto evita inconvenientes posteriores en el proceso de grabación de la información en el caso de los formularios diligenciados en papel.
- Siempre que se encuentra una diferencia o inconsistencia en cualquier casilla del formulario, se solicita la explicación y aclaración al informante, se registran sus observaciones, y se hacen las modificaciones o correcciones a que haya lugar. Así se mejora en forma permanente la calidad y eficiencia de la investigación.
La detección de otro tipo de posibles inconsistencias, como el caso de valores extremos, datos atípicos, no acordes con las especificaciones de validación, se realiza con programas en SAS, elaborados según solicitudes específicas.
El aplicativo diseñado para la investigación también tiene incluida una serie de reportes que permiten tener control de las fuentes que no han rendido información, es decir, que están en deuda. Adicionalmente, es posible identificar otras fuentes faltantes a causa de alguna novedad diferente de la deuda, como es el caso de las empresas que no se encuentran en la dirección suministrada en el directorio o que no están activas económicamente o que ya se han liquidado, entre otras.
IMPUTACIÓN Y/O AJUSTES DE COBERTURA
El método de imputación está basado en la variación anual, en dicha metodología se utilizan datos que pueden suplantar los datos faltantes, de tal manera que los datos imputados se aproximen a los valores reales. La metodología supone que los datos poseen autocorrelación temporal y homogeneidad en las diferentes etapas de agregación; esto significa que la imputación debe estar de acuerdo con el comportamiento de la serie histórica y de los niveles que contienen el dato faltante.
Para la imputación de registros en estado de deuda se utiliza la razón de crecimiento de los datos en la serie, o variación de los datos.
Bajo estas consideraciones, se estimará primero la variación que tendrá el dato faltante con respecto al dato del período anterior, teniendo en cuenta el comportamiento histórico de la serie de variaciones en cada empresa y el comportamiento histórico de las variaciones dentro de cada actividad, a partir de esta estimación se generará el dato faltante.
La variación del dato que se va a imputar se obtiene en términos de la variación histórica promedio en la empresa y en la actividad.
Como se expone en Lozano “el propósito es estimar los parámetros desconocidos utilizando un método iterativo con el modelo de mínimos cuadrados y restringiéndolos a que la suma sea igual a uno para que haya convergencia en la imputación”.
El modelo describe la imputación de la variación del dato faltante, como un promedio ponderado de las variaciones de los datos en la empresa y en la actividad, donde los ßi son los coeficientes de ponderación de las variaciones.
Sampling error estimates
---------------------------
ANÁLISIS ESTADÍSTICO
El Equipo de Logística en Dane Central, una vez ha realizado análisis de consistencia a la base de datos consolidada después del último cierre, la envía a Temática Económica donde se analizan las participaciones y variaciones de todas las variables, comparando con información de otras fuentes.
Adicionalmente, a través de un programa diseñado en SAS, se calculan y verifican las variables de producción bruta, consumo intermedio, valor agregado, personal ocupado e inversión neta (descritas en el aparte "Contenido temático") y los indicadores; coeficiente técnico, productividad laboral, productividad total y remuneración promedio (referidos en el aparte: "diseño de indicadores"). Si se detectan errores o inconsistencias, temática envía las observaciones respectivas a logística para que sean revisadas y corregidas, en algunos casos con la ayuda de la fuente.
Posteriormente, estas variables se presentan en los cuadros de salida desagregados por cada una de las actividades investigadas y la organización jurídica. A partir de estos cuadros, en el boletín de prensa, para cada una de las actividades, se realiza análisis descriptivo de cada una de las variables e indicadores, en el período de referencia y en comparación con los datos del año anterior.
ANÁLISIS DE CONTEXTO
Para fortalecer el análisis de consistencia de la información se elaboran documentos de contexto por actividad, en los cuales se describen los aspectos más importantes
del comportamiento económico del país en el período correspondiente.Adicionalmente, de acuerdo con la disponibilidad de los datos, para cada una de las actividades investigadas, se comparan los resultados de la encuesta con otras fuentes de información. Estas fuentes pueden ser internas, fundamentalmente la Dirección de Cuentas Nacionales y Externas, tales como gremios, ministerios, superintendencias, institutos de investigación, etc.
Los resultados y boletín de prensa antes de ser publicados se presentan ante el comité interinstitucional de servicios conformado por un delegado del Banco de la República, del Ministerio de Comercio, del Departamento Nacional de Planeación y el DANE.
INDICADORES PARA EL CONTROL DE CALIDAD DE LOS PROCESOS DE INVESTIGACIÓN
El indicador de calidad tiene como objetivo obtener de manera aproximada una medida de la calidad de los procesos de crítica y captura de la encuesta, que permita hacer un seguimiento y evaluación permanente.
Para la obtención del indicador se realiza la revisión a todos los formularios asignados por el sistema para cada operador y hacer el análisis correspondiente para cada una de las variables en la ficha, con ayuda de los diagnósticos y los chequeos entre capítulos que genera el aplicativo para cada una de las fuentes. El asistente técnico, como responsable, deberá diligenciar los datos necesarios y obtener el indicador para cada uno de los formularios seleccionados; además, verificar que las correcciones pertinentes se realicen por cada uno de los críticos u operadores en el formulario y en el sistema de captura.
En primera instancia se debe calcular un indicador de calidad (IC) por cada responsable de proceso (RP), el cual es obtenido como el promedio aritmético de los puntajes para cada uno de los formularios que fueron revisados por el asistente técnico del proyecto.
Así el indicador de calidad (IC) por proceso para la Dirección Territorial es calculado como el promedio de los indicadores de cada responsable de proceso (RP) en la EAS.
El indicador de calidad total por Dirección Territorial corresponderá al promedio simple de los indicadores obtenidos de los procesos
Por otra parte, se elabora el indicador de oportunidad, cuyo objetivo es "realizar seguimiento y control de las actividades principales que hacen parte de los procesos de producción, análisis y difusión de los resultados, permitiendo la identificación de las causas que ocasionaron el retraso en la programación, acompañado de los planes de acción, que garanticen el cumplimiento en la entrega del producto a satisfacción del cliente"
Para obtener el indicador se registra la actividad, el responsable de calificar, la fecha programada, la fecha ejecutada, la calificación correspondiente (1 si cumple y 0 si no cumple), la causa del incumplimiento, la acción tomada frente al incumplimiento y las evidencias respectivas.
ERRORES MUESTRALES
El objetivo de seleccionar una muestra es estimar, a través de ella, características que se desconocen de uno o varios aspectos de la población, como son: frecuencias de presentación de algún suceso, promedios, totales, proporciones, etc. En teoría de muestreo, estos valores se denominan parámetros.
Cuando la magnitud de la variabilidad es muy grande, los parámetros estimados pierden utilidad, pues el valor verdadero del parámetro en el universo, puede estar en un intervalo muy amplio, lo cual no proporciona información útil.
Una muestra probabilística es una parte de un universo, la cual se obtiene mediante selección aleatoria utilizando un diseño muestral, el cual asegura que todos y cada uno de los elementos del universo tiene probabilidad conocida y mayor de cero de ser incluidos en la muestra.
De una población se pueden obtener diferentes muestras y de cada una se obtiene una estimación del parámetro de interés, la forma como se distribuyen las estimaciones para las diferentes muestras se denomina distribución muestral, y la magnitud de la variabilidad de esta distribución debida al azar, es la varianza del estimador; entre menor sea la magnitud de esta variabilidad, se dice que mejor será la precisión de la estimación del parámetro de interés.
Con base en la estimación de dicha variabilidad, se construye el intervalo de confianza para la estimación, de modo que cuando la magnitud de la variabilidad es muy grande, el intervalo es muy amplio, lo que implica que se proporciona información poco útil.
La varianza del estimador esta dada en unidades generalmente de difícil manejo y por ello, se utiliza una medida relativa con base en valores porcentuales, denominada coeficiente de variación estimado c.v.e.
Criterios para utilizar el coeficiente de variación estimado
Una estimación se considera de buena calidad si su c.v.e. es menor del 5%; práctica, entre el 5 % y el 10%; aceptablemente practico, si es mayor del 10 % y menor del 15%, y de uso restringido, si es mayor del 15%. Por cuanto con un 95% de probabilidad, el intervalo que cubre el parámetro desconocido.
Para el mejor entendimiento del significado y los diferentes valores que toman los coeficientes de variación en los cuadros presentados, se deben considerar los siguientes aspectos. - El subestrato de inclusión forzosa tiene la información de todas las unidades económicas que lo conforman y, por lo tanto, cuando la estimación se refiera sólo a este subestrato, el coeficiente de variación será cero pues sólo hay una muestra posible que corresponde exactamente a todas las unidades que conforman el subestrato y en consecuencia, no hay sino una única estimación del parámetro.
- El diseño de la muestra se realizó para obtener estimaciones, para totales nacionales, con un error de muestreo aproximado de 5%, para las variables ingresos y personal ocupado. Otro nivel de desagregación está sujeto a que su precisión no necesariamente sea buena.
总结
---------------------------
“服务是每次请求时生成的异质产品,用户不享有所有权,不能与生产分离进行交易,也不能运输和储存。销售的是每次需求时使用服务的权利。”
哥伦比亚经济中服务业的重要性,以其在国民生产总值(占国民生产总值的52.6%)和就业(占就业人口的61.7%)中的份额来衡量,提出了需要拥有统计信息以跟踪和分析其行为的需求。
国家统计局,在其机构使命和持续努力提供及时和可靠数据的框架内,开发了旨在填补缺乏统计信息活动的测量流程。在这方面,1995年开始了针对酒店、餐饮和旅行社服务活动的年度服务调查。根据研究设计,每年都会根据信息需求添加其他服务。因此,1997年包括了广告活动;2000年包括了人员获取和供应、私人安全和计算机与邮政活动;以及2003年,包括了电信服务。
随后,作为改善服务统计数据计划的一部分,以及作为跨机构工作(国家统计局、国家发展规划部、共和国银行和商务部)诊断该部门信息需求的结果,从2006年开始调整年度服务调查,将收集工具统一到一个唯一的表格中,并将研究的覆盖范围扩大到其他服务活动。
这样,当前调查的范围包括酒店和餐饮、辅助运输活动、旅行社、邮政和电信、房地产业务、企业租赁、高等教育、与健康人类相关的活动、电影、广播和电视以及其他娱乐和服务活动。
这些结果将允许向不同用户提供统计分析,用于分析该部门的产出和就业,用于不同子部门的特征描述,作为部门规划和政策的投入,以及作为国际协议谈判的工具。
本文件的目的是向用户和公众介绍年度服务调查的方法,同时有助于促进透明度和对这项研究统计数据质量的技术性的信任,从而更好地利用产生的信息。
分析单位
---------------------------
观测单位
观测单位是专门或主要在国内外从事研究服务的公司,拥有NIT。
分析单位
分析单位是专门或主要在国内外从事研究服务的公司,拥有NIT。
抽样单位
抽样单位是专门或主要在国内外从事研究服务的公司,拥有NIT。
研究对象
研究对象是在国内正式设立的(具有NIT和商业登记)经济单位,位于国内,专门提供酒店和餐饮服务(H类)、房地产业务、企业租赁和租赁活动(K类)、辅助运输活动、旅行社活动(63类);邮政和电信(64类);高等教育服务(8050);与健康人类相关的活动(851)、电影、广播、电视以及其他娱乐和服务活动(921)和其他服务活动(930类)。
数据类型
---------------------------
普查(cen)
抽样程序
---------------------------
抽样设计
抽样框架
服务企业的抽样框架是名单,其覆盖范围是全国性的,并于1995年从1990年经济普查中获得的服务目录开始构建。该目录通过社会公司监督局、监督和安全私营公司、合作社、商会、工会、旅游副部级、黄页、国家统计局年度、月度和季度调查的信息进行了更新。
最后,根据1990年经济普查中获得的目录,于2008年对目录进行了最后一次更新,其中包括了来自不同来源的信息;国家统计局微企业调查数据、2008年进行的具有10名以上雇员的单位经济活动经济普查、2007年年度服务调查、呼叫中心运营、电子邮件和传真。
考虑到主题覆盖范围,服务生产的生产框架大小为65.989家公司,并包含有关每个公司经济活动、收入和雇员人数的辅助信息。
登记设计由以下变量组成:字段名称、描述、数据类型(自动编号、数值、日期、文本)、长度和应取的值。目录的结构由61个变量组成。
抽样设计
应用的抽样类型是概率分层元素抽样。
分层的原因是辅助信息的可用性,这允许检测差异并将人口划分为层,在这种情况下,辅助信息一方面来自CIIU经济部门,它产生了主题层,另一方面,设计变量根据企业规模产生层,这减少了方差并允许为每个层提供单独的估计值。
根据目标,根据服务活动形成了六个层。每个层的界限已确定。
人口被组织成由以下标准定义的具有同质性的层:首先,根据公司的主要经济活动,根据适用于哥伦比亚的国际统一工业分类修订3版的代码。
其次,按年收入和雇员人数划分。在每一层内,根据收入和雇员人数形成了子层,这样做是因为在每一层的研究中,人口分布是不对称的,存在一些大型单位和许多小型单位。需要考虑一个代表性较大的单位组或强制加入(IF)组以及一个概率加入(IP)组,其余单位属于这些组。为了确定这两个组,使用了Hidiroglou方法。
HIDIROGLOU方法
对于给定的精度水平,提供了一个算法来将人口划分为强制加入层和概率加入层,以最小化简单分层随机抽样设计的估计量的方差,假设在概率加入层中进行简单随机抽样,不进行替换。
在人口具有不对称分布的原则下,对于简单分层随机抽样设计,估计量的方差具有抛物线行为,其最小值可以通过交互式方法找到,这一点确定了企业大小的界限,为此应用了方程。
该方法的一般算法如下:
- 将设计变量按从大到小的顺序排序。
- 将最大的企业作为强制加入,并计算其余企业的方差。
- 将两个最大的企业作为强制加入,并计算其余企业的方差。
- 重复此过程,每次增加强制加入的企业数量,直到方差最小。在设计变量在该点上的值被认为是大型企业子层的界限,通常被认为是强制加入。
对于概率子层,使用了简单随机抽样方法进行单位选择。为此,使用了负协调方法,该方法包括进行N(层概率大小)次试验,使用均匀分布(0.1)的概率分配,将这些数字分配给每个元素,按随机值排序元素,并考虑与n(样本大小)个最小随机值相对应的元素作为样本。
由于预算限制,未能为每个子层选择概率样本。计划仅对强制加入子层进行信息收集,即大型企业层,这被称为服务大型企业普查。
数据收集方式
---------------------------
通过网页自动填写电子表格(例如在抽样调查或普查中选择;例如在调查中)
研究工具
---------------------------
表格包含一个额外的模块,对应于信息和通信技术(TIC),其目标是识别被调查企业实施的技术,其结果在针对此主题的特定公告中发布。
通过网页填写表格,除了节省纸张外,还允许信息捕获和一致性的过程更加高效。在该系统中,公司可以打印或查看填写手册,其中展示了每个章节的基本说明。
表格的结构组织如下:
- 第一章。识别和一般数据。
- 第二章。净运营收入和非运营收入。
- 1.根据来源分配的收入。
- 2.提供服务产生的收入(CPC代码1.1)。
- 第三章。运营成本和非运营成本。
- 1.运营成本(由雇员产生的费用)。
- 2.引起的其他运营成本和费用。
- 3.成本和费用根据目的分配。
- 第四章。平均年雇员人数。
- 第五章。有形固定资产的变动。
- 第六章。有形固定资产的折旧。
- 1.累计折旧的变动。
- 2.使用的折旧方法。
- 第七章。无形固定资产。
- 第八章。按部门分配。
- 电信模块,从供应的角度来看。
- 信息技术和通信模块,从需求的角度来看。
清洗操作
---------------------------
档案合并
在信息捕获时,系统(在线)自动开始合并数据库,此外,各地区办事处监控收集信息的质量和覆盖范围。
验证和一致性规范
为了验证和一致性,为表格中的每个变量制定了规范,这些规范包含在捕获应用程序中。在这些规范中,与字段名称、字段类型和长度、变量应具有的值、一致性条件、不一致时应显示的消息以及错误类型相关联。
这样,如果公司通过网页填写调查,系统将指示缺失或不一致的数据,并允许记录信息、纠正或关联相应的观测值。同样,如果表格以纸张形式填写,审阅员在系统中进行捕获过程,该系统将显示出现的不一致性(行和列的总和、章节之间的交叉),并必须与来源进行验证、纠正或记录观测值(如果适用)。一些称为强制性的错误可以在审阅员的绝对责任和知识下进行验证。
在捕获应用程序中包含接受范围,用于主要变量的参与和变化,这允许审阅员获得包含参考年份、上一年份和相应变化的报告。如果这种变化与设定的范围相比很高。
数据处理
---------------------------
数据一致性验证和调整
在信息接收后,对表格进行审阅和编码,以验证其一致性。这一阶段的主要目标是信息与填写和审阅手册中规定的参数一致。同样,应用程序包含一致性规范,其目标是检测在数据捕获时每个表格中的错误数据。当发生这种情况时,程序会发送一条消息,要求进行纠正或澄清观测值。这些检查在企业和个别层面上进行。
通常遵循的程序如下:
- 检测缺失、无效或不兼容的数据。
- 定位异常数据,比较调查或普查的前期数据或来自其他来源的数据。
- 验证预先填写的信息是否正确。
- 使用来源帮助完成遗漏的信息。
- 检查表格中指示的交叉是否已验证;这避免了在纸张表格的记录过程中出现后续不便。
- 每当在表格的任何单元格中发现差异或不一致性时,都会要求信息提供者提供解释和澄清,记录其观测值,并对必要的修改或纠正进行修改。这样,就可以永久地提高调查的质量和效率。
使用SAS编写的程序检测其他类型可能的差异,例如极端值、异常值、不符合验证规范的数据,这些程序是根据特定请求编写的。
为调查设计的应用程序还包括一系列报告,这些报告允许控制未提供信息的来源,即所谓的债务来源。此外,可以识别其他由于某些不同于债务的新情况而缺失的来源,例如不在目录中提供的地址或未进行经济活动的公司或已清算的公司等。
缺失值处理和/或覆盖范围调整
---------------------------
基于年变化的缺失值处理方法,在该方法中,使用可以替代缺失数据的资料,以便缺失值处理的数据接近实际值。该方法假设数据具有时间序列的自相关性和不同聚合阶段的同质性;这意味着缺失值的处理必须与时间序列的历史行为和包含缺失值的水平的历史行为一致。
对于债务记录的缺失值处理,使用数据序列的增长率或数据的变化。
在这些考虑的基础上,首先将估计缺失值相对于前期数据的变动,考虑到每个企业的时间序列变动历史和每个活动的变动历史。
要处理的缺失值的变化是通过以下方式获得的:企业的时间序列变动历史平均值和活动的变动历史平均值。
正如Lozano所阐述的,“目的是使用迭代方法估计未知参数,使用最小二乘法和将总和限制为等于一,以便在缺失值处理中收敛”。
该模型描述了缺失值变动的处理,作为企业和时间序列变动历史平均值和活动变动历史平均值变化的加权平均值,其中βi是变化的加权系数。
抽样误差估计
---------------------------
统计分析
国家统计局中央物流团队在完成最后一次关闭后的数据库一致性分析后,将数据库发送到经济主题,在那里分析所有变量的参与和变化,并与其他来源的信息进行比较。
此外,通过在SAS中设计的程序,计算和验证了生产总价值、中间消费、增加值、雇员人数和净投资(在“主题内容”部分描述)以及指标;技术系数、劳动生产率、总生产率和平均薪酬(在“指标设计”部分引用)。
如果发现错误或不一致性,主题将发送相应的观测值到物流,以便进行审查和纠正,在某些情况下,在来源的帮助下进行。
随后,这些变量在按每个研究活动和组织法律实体分解的输出表格中呈现。从这些表格中,在新闻发布会上,针对每个活动,对每个变量和指标在参考期间和与前一年数据进行描述性分析。
背景分析
---------------------------
为了加强信息一致性的分析,为每个活动制定了背景文档,其中描述了在该期间国家经济行为的最重要方面。此外,根据数据的可用性,对于每个研究活动,将调查结果与其他来源的信息进行比较。这些来源可以是内部的,主要是国家账户和外部账户部门,以及工会、部、监督局、研究机构等。
在发布结果和新闻稿之前,将结果提交给由共和国银行、商务部、国家发展规划部和国家统计局组成的跨机构服务委员会。
研究过程质量控制指标
---------------------------
质量指标的目标是近似地获得对调查审阅和捕获过程的质最的度量,以便进行持续的跟踪和评估。
为了获得指标,对分配给每个操作员的所有表格进行审查,并帮助分析每个变量在表格中的得分,这些审查由项目助理技术员进行。
因此,每个过程负责人的质量指标(IC)是通过计算助理技术员审查的每个表格的得分来获得的平均算术值。
因此,针对地区办事处的过程质量指标(IC)是地区办事处每个过程负责人(RP)在EAS中指标的平均值。
地区办事处总质量指标相当于从过程中获得指标的平均简单值。
此外,还制定了一个机会指标,其目标是“跟踪和控制生产、分析和传播结果的主要活动,以识别导致进度延误的原因,并伴随着保证满足客户需求的行动计划”。
为了获得指标,记录活动、评分负责人、计划日期、执行日期、相应的评分(如果满足为1,如果不满足为0)、违约原因、针对违约采取的措施以及相应的证据。
抽样误差
---------------------------
选择样本的目标是通过它来估计关于人口的一个或多个方面的未知特征,例如某个事件的频率、平均值、总和、比例等。在抽样理论中,这些值被称为参数。
当可变性很大时,估计的参数失去效用,因为人口中参数的真实值可能在一个很宽的区间内,这并不提供有用的信息。
概率样本是从人口中获取的部分,通过使用抽样设计进行随机选择获得,该设计确保了人口中的每个元素都有已知且大于零的包括在样本中的概率。
从一个人口中可以获取不同的样本,并且从每个样本中可以获得对感兴趣参数的估计,不同样本的估计分布称为样本分布,该分布中由随机性引起的可变性的幅度称为估计量的方差;可变性幅度越小,对感兴趣参数的估计的精度就越好。
基于对这种可变性估计,构建了参数估计的置信区间,当可变性很大时,置信区间很宽,这意味着提供的信息很少有用。
估计量的方差通常以难以处理的单位给出,因此,使用基于百分比的相对度量,称为估计方差系数(c.v.e)。
使用估计方差系数的准则
一个估计被认为是高质量的,如果其c.v.e.小于5%;实践上,在5 %和10 %之间;如果c.v.e.大于10 %且小于15 %,则被认为是可接受的实践;如果c.v.e.大于15 %,则被认为是受限使用的。
因为以95 %的置信度,包含未知参数的区间。
为了更好地理解表中系数变动的含义和不同值,应考虑以下方面。 - 强制加入子层包含构成该子层的所有经济单位的信息,因此,当估计仅涉及该子层时,方差系数将为零,因为只有一个可能的样本与构成子层的所有单位相对应,因此,没有对参数的单一估计。
- 抽样设计是为了获得估计,对于总收入和雇员人数,其抽样误差大约为5%,对于其他分解级别,其精度不一定很好。
提供机构:
microdatos.dane.gov.co



