Encuesta Sobre Ambiente y Desempeño Institucional Departamental- EDID - 2014 - ENTIDAD . - Colombia
收藏microdatos.dane.gov.co2017-10-18 更新2025-03-21 收录
下载链接:
https://microdatos.dane.gov.co/index.php/catalog/402
下载链接
链接失效反馈官方服务:
资源简介:
Resumen
---------------------------
Desde mediados de los ochenta, el proceso de descentralización en Colombia, ha recibido un impulso en sus componentes administrativo, político y fiscal. Este proceso ha estado acompañado del fortalecimiento institucional de las entidades territoriales para que los tres ejes avancen conjuntamente. Sin embargo, en el ámbito territorial, estos ajustes no se han implementado en paralelo.
Por consiguiente, entre las entidades territoriales existen diferencias en su infraestructura institucional, más complejas en unas que otras por razones de escala en la prestación de bienes y servicios públicos. Por ejemplo, en el ámbito departamental, se presentan divergencias, respecto a la eficacia y eficiencia administrativa con la que atienden sus funciones. Aunque existen indicadores de tipo cuantitativo para medir tales divergencias, no se cuenta con mediciones cualitativas obtenidas de percepciones de los actores del desarrollo regional.
El DANE, identificó en el marco del Plan Estratégico Nacional de Estadística -PENDES, que en el ámbito del sector público local predomina información sobre finanzas públicas y empleo, que no está acompañada de indicadores (de corte longitudinal y transversal), sobre el desarrollo institucional de las entidades territoriales.
Con el fin de caracterizar el desarrollo institucional territorial, a partir de las percepciones de sus servidores públicos, el DANE identificó como una tarea prioritaria el diseño de una nueva operación estadística, que suministre información con respecto a la percepción que tienen los funcionarios sobre el estado que han alcanzado las entidades territoriales a partir de los cambios institucionales introducidos.
La integración de una operación estadística en esa dirección, permite complementar la tarea de consolidación de un conjunto de información sobre el sector público territorial, que se caracterice por generar información única, pública, confiable, oportuna y accesible; esto con el fin de que en el seno del Sistema Estadístico Nacional (SEN) se empiece a implementar un módulo relacionado con la administración pública departamental, el cual se vincule a un sub-sistema de información política.
En ese orden de ideas, en 2007 el DANE, con base en la Encuesta sobre Ambiente y Desempeño Institucional Departamental (EDID), dio inicio a la creación de un acervo de información estadística estratégica en materia de gobernanza y gobernabilidad en el sector público territorial. Este propósito contribuye al desarrollo de uno de los ejes del Plan Nacional de Desarrollo, que busca la consolidación de un Estado con un enfoque gerencial.
Con estos elementos, la EDID pretende proporcionar a la sociedad colombiana información estadística actualizada y estratégica sobre la percepción que tienen los servidores públicos del desarrollo institucional de los entes territoriales en terminos de cómo perciben el ambiente y el desempeño institucional en las entidades en la cuales prestan sus servicios. En consecuencia la información generada, servirá de apoyo para el mejoramiento de la política pública en descentralización.
La encuesta se realiza por muestreo probabilístico en 32 gobernaciones y el Distrito Capital. La recolección de información se efectúa en formularios electrónicos por auto-diligenciamiento a través de la página WEB del DANE, por los servidores públicos seleccionados aleatoriamente en la muestra.
Geographic coverage
---------------------------
Aunque la cobertura de las entidades que se estudia es nacional, los servidores objeto de estudio son únicamente los que laboran en la oficina central de cada Gobernación del territorio nacional y del Distrito Capital (Bogotá D.C.).
Analysis unit
---------------------------
UNIDAD DE OBSERVACIÓN
Son los servidores públicos con una antigüedad superior a seis meses en la entidad, y que laboran en el nivel central de las gobernaciones y el Distrito Capital.
UNIDAD DE ANÁLISIS
Es la entidad pública territorial y el total gobernaciones y Distrito Capital.
UNIDAD DE MUESTREO
Corresponde a los servidores públicos que pertenecen a las entidades objeto de estudio.
Universo de estudio
---------------------------
Servidores públicos pertenecientes al nivel central de las gobernaciones del territorio nacional y del Distrito Capital (Bogotá D.C.).
Kind of data
---------------------------
Encuesta por muestreo (ssd)
Sampling procedure
---------------------------
MARCO MUESTRAL
Para la encuesta sobre ambiente y desempeño institucional departamental, el marco muestral corresponde al listado de servidores públicos de cada una de las entidades objeto de estudio. Esta información es solicitada, todos los años, por las territoriales del DANE, a las oficinas de recursos humanos de las entidades participantes y al final la información se consolida en el DANE CENTRAL.
El marco contiene variables que identifican a los servidores: nombres, apellidos y cedula de ciudadanía. Otras variables que facilitan su ubicación como: la entidad, el área o dependencia, el municipio donde trabaja, la sede y el correo electrónico. Y otras variables que los caracterizan como: el cargo, el sexo y la fecha de ingreso del funcionario.
Para identificar problemas de sobre cobertura o sub cobertura del marco, cada año se compara el número de servidores de las entidades con respecto al del año anterior, cuando existen diferencias significativas se procede a confirmar y depurar la información con ayuda de la fuente.
Es poco frecuente pero puede suceder que se repitan servidores en el marco, los funcionarios que se identifican con este problema pueden estar en dos entidades diferentes o en la misma entidad. Cuando el funcionario está en dos entidades es porque el funcionario cambió recientemente de trabajo, o se encuentra en comisión; dado que ningún funcionario debe trabajar al mismo tiempo en más de una entidad.
Con respecto a las razones para que un funcionario se repita en la misma entidad generalmente son, porque el funcionario tiene un ascenso, porque está en alguna especie de comisión o por algún error de digitación. En todo caso los servidores repetidos del marco se identifican y depuran de la forma más apropiada según sea el caso.
TIPO DE MUESTREO
El diseño muestral propuesto para esta encuesta es estratificado y el método de selección en cada estrato es Muestreo Aleatorio Simple (MAS). El criterio de estratificación dentro de cada entidad está dado por la jerarquía del cargo, formándose tres niveles:
- Nivel 1: directivos, asesores y ejecutivos
- Nivel 2: profesionales y técnicos
- Nivel 3: asistenciales
La estratificación busca garantizar que los resultados tomen en cuenta el punto de vista de cada nivel jerárquico. El número total de estratos depende del número de entidades y el número de niveles jerárquicos dentro de cada entidad.
DEFINICIÓN TAMAÑO DE LA MUESTRA
El ideal de la encuesta es tomar el punto de vista de todos los funcionarios de las entidades de estudio, sin embargo existen entidades cuya población excede posibilidades logísticas y económicas. Por tal motivo para algunas entidades se hace una muestra de funcionarios y en otras se hace censo.
Cuando se hace muestra, el número de funcionarios seleccionados, se basa en ejercicios teóricos-prácticos y experiencias en años anteriores que aseguran indicadores con coeficiente de variación menor del 5% dentro de cada entidad.
Cuando se hace censo es porque el número de funcionarios en la entidad es menor o igual a 110. Adicionalmente, el censo en las entidades que tienen menor número de servidores públicos, pretende garantizar la confidencialidad y reserva estadística de las fuentes.
La relación entre tamaño poblacional de la entidad y la muestra se presenta en la siguiente tabla.
Relación entre tamaño poblacional y muestra seleccionada:
Número de funcionarios entre: Entre 111 Y 150
Tamaño de muestra :110
Número de funcionarios entre: Entre 151 Y 200
Tamaño de muestra :120
Número de funcionarios entre: Entre 201 Y 250
Tamaño de muestra :130
Número de funcionarios entre: Entre 251 Y 350
Tamaño de muestra :140
Número de funcionarios entre: Entre 351 Y 450
Tamaño de muestra :160
Número de funcionarios entre: Entre 451 Y 800
Tamaño de muestra :230
Número de funcionarios entre: Entre 801 Y 2000
Tamaño de muestra aproximado :300
Más de 2000
Tamaño de muestra aproximado: 350
Con base al tamaño de muestra por entidad definido en la tabla anterior se asigna un tamaño de muestra para cada nivel jerárquico. La asignación de tamaño de muestra dentro de cada nivel es proporcional al tamaño del nivel con respeto al total de la entidad. Si cualquier nivel jerárquico tiene menos de 8 servidores, entonces se hace censo de este nivel y no muestra.
Sampling deviation
---------------------------
Muestra seleccionada: 6 842 servidores públicos territoriales.
Muestra efectiva: 6 309 servidores públicos territoriales.
Las principales razones que explican la perdida de muestra se describen a continuación:
- Elementos fuera del universo: son todos aquellos elementos seleccionados en la muestra que no pertenecen al universo de estudio; entre éstos se encuentran servidores públicos que ya no pertenecen a la entidad por causa de defunción, jubilación o retiro.
- Elementos sin información: corresponde a los elementos que pertenecen al universo de estudio, pero no se obtiene información de ellos. Dentro de este grupo se encuentran los servidores que no se pudieron localizar durante el operativo de campo y los que rechazaron realizar la encuesta.
Mode of data collection
---------------------------
Autodiligenciamiento de formulario electrónico vía página web (por selección; por ejemplo en encuestas por muestreo o censos)
Research instrument
---------------------------
DISEÑO DE INSTRUMENTOS
El cuestionario, en su componente temático, está constituido por 215 literales distribuidos en 52 preguntas que conforman las variables de estudio sobre ambiente y desempeño institucional nacional. De igual manera, cuenta con cuatro (4) variables de clasificación que permiten discriminar resultados por entidad, sexo, tiempo de servicio y nivel jerárquico.
MÓDULO CREDIBILIDAD EN LAS REGLAS
- Ubicación laboral: Contiene toda la información relacionada con la ubicación laboral del Encuestado.
- C. Ambiente laboral: Indaga la percepción sobre el grado de satisfacción respecto al reconocimiento de la labor en la entidad, a los incentivos laborales ofrecidos por ella y al entorno laboral en que se desarrollan sus actividades.
- D. Administración de Recursos Físicos: Indaga la percepción de los servidores públicos sobre la administración de los recursos físicos.
- E. Evaluación y Control: Indaga la percepción de los servidores públicos con relación al seguimiento en la administración de recursos físicos y el ambiente laboral.
MÓDULO CREDIBILIDAD EN LAS POLÍTICAS
- F. Directrices Internas a la Entidad: Indaga la percepción de los servidores con respecto a las normas y orientaciones que rigen la actuación de una entidad en asuntos de carácter interno
- G. Políticas Externas: Indaga la percepción sobre los lineamientos que provienen de entidades de mayor jerarquía.
- H. Evaluación y Control: Indaga la percepción de los servidores públicos con relación al seguimiento de las políticas y directrices.
MÓDULO SUFICIENCIA DE RECURSOS Y PREVISIBILIDAD
- I. Planeación: Indaga la percepción de los servidores públicos con respecto a la previsión que se tiene de los recursos para lograr los objetivos de cada entidad.
- J. Presupuesto: Indaga la percepción de los servidores públicos con respecto al proceso presupuestal de la entidad.
MÓDULO PLANEACIÓN DE DESARROLLO Y PARTICIPACIÓN CIUDADANA
- K. Evaluación y control: Indaga la percepción de los servidores públicos con relación al seguimiento en la planeación y el presupuesto.
- L. Planeación del desarrollo: Los siguientes enunciados buscan conocer la percepción de los servidores públicos territoriales con respecto a la participación ciudadana en los planes y programas que desarrollan sus entidades y la importancia de la misma para el departamento.
El desarrollo del sistema de información para la captura de información de la Encuesta sobre Ambiente y Desempeño Institucional Nacional – EDI– se realiza mediante formulario electrónico ubicado en la página Web del DANE y como metodo de contingencia, se dispone de formularios en papel, que posteriormente son trascritos al formulario electrónico.
Por una parte, el desarrollo de sistemas de captura para el componente Web que se acopla a la página Web del DANE, tiene en cuenta las especificaciones de diseño y construcción de formularios electrónicos suministrados por la Oficina de Sistemas del DANE.
Asimismo, para facilitar la operación, la administración y el mantenimiento del sistema de información se elaboran los respectivos manuales de usuario y sistemas. Los componentes de la herramienta informática propuesta, tienen como finalidad facilitar la captura, la actualización (agregar, modificar y eliminar registros de la base de datos), la consulta y la producción de reportes de cobertura, y la administración de la información contenida en el sistema manejador de base de datos y en el sistema administrador de aplicaciones del sistema.
Cleaning operations
---------------------------
TRANSMISIÓN DE DATOS A DANE CENTRAL
En el método de recolección por formulario electrónico, la información se transmite en línea, hacia una base de datos estructurada en ORACLE, lo cual permite que a medida que el usuario diligencie el formulario, los datos sean almacenados y consultados en tiempo real.
La Oficina de Sistemas del DANE establece diferentes perfiles de usuario con permisos definidos de acuerdo al rol que desempeñe en el operativo, los usuarios son:
- Funcionario de la entidad, quien autodiligencia y consulta la encuesta a través de la página Web.
- Call Center, quien consulta el estado del operativo, el reporte de cobertura y el listado de usuarios activos seleccionados por entidad.
- Coordinador territorial, quien diligencia las novedades, consulta el estado del operativo y reportes de cobertura.
- Administrador grupo temático u operativo, quien consulta el estado del operativo y reportes de cobertura.
- Administrador de base de datos, quien tiene control y responsabilidad total sobre la información almacenada en la base de datos.
Los backups de bases de datos en el servidor ORACLE, se realizan de manera automática y programada diariamente en un horario previamente establecido, siendo éstos responsabilidad del Administrador de bases de datos de la entidad DANE Central.
CONSOLIDACIÓN DE ARCHIVOS
A los archivos recibidos se les realiza un proceso de transformación que permite la lectura y cargue de la información contenido en los mismos a la base de datos.
La estructura de la base de datos esta divida en: tabla de muestra, tablas de control y así como las que contienen la información recolectada referente a los diferentes capítulos de la encuesta.
Las tablas de la base de datos tienen relación entre si, de acuerdo a las reglas de normalización, además de criterios como: llave primaria, llave foránea e índices, que permiten una mejor interrelación, desempeño y funcionalidad en la base de datos.
Una vez los archivos son transformados, se inicia el proceso de cargue a la base de datos, la información contenida en los archivos es leída, validada, organizada y finalmente cargada.
El principal criterio de clasificación al momento de la generación de reportes que muestran la información almacenada, es la división político-administrativa del país; estos reportes son generados tanto a nivel nacional como departamental, municipal, así como por entidades seleccionadas en la muestra.
NORMAS DE VALIDACIÓN Y CONSISTENCIA
En conjunto con el equipo temático, estadístico y de sistemas se verifica que el desarrollo final del formulario de captura electrónico, cumpla con el diseño determinado de normas de validación y consistencia establecidas para esta encuesta; este proceso se lleva a cabo realizando pruebas por parte de los equipos involucrados en el desarrollo. Cabe aclarar que estas pruebas se realizan antes del inicio de operativo en campo con el fin de hallar posibles errores, además de unificar conceptos con respecto a los formularios.
VERIFICACIÓN DE LA CONSISTENCIA INTERNA DE LOS DATOS Y AJUSTES
El principal tipo de inconsistencia interna que puede ocurrir son los registros duplicados en la base de datos; con esto se genera un reporte que se envía a cada territorial para su verificación por parte del equipo operativo, el cual una vez consolidados y evaluados los registros de campo contra los reportes enviados, deben informar cualquier irregularidad encontrada a DANE Central, donde el equipo de sistemas asignado a la encuesta, se encarga de realizar los cambios correspondientes, así como la consolidación final de la base de datos.
Response rate
---------------------------
La precisión de la estimación se construye utilizando la varianza estimada del estimador del parámetro.
Con la varianza estimada del total o de la razón, se puede construir el coeficiente de variación estimado del parámetro como medida de precisión, la idea es que entre menor sea el coeficiente de variación estimado cve, menor incertidumbre habrá sobre la estimación.
INTERPRETACIÓN DE LA PRECISIÓN
Uno de los principales criterios para determinar la calidad de la estimación de un parámetro es la variabilidad que tienen los posibles resultados de dicha estimación. Esta variabilidad se conoce como varianza del estimador, la cual depende de muchos factores, como el diseño muestral, el tamaño de la muestra, el parámetro que se desea estimar, los niveles de desagregación, entre otros.
La varianza se calcula básicamente como la suma del cuadrado de las distancias entre los diferentes valores de una variable y su valor promedio, en este caso, los diferentes valores corresponden a las posibles estimaciones, las cuales, a su vez, provienen de las posibles muestras. Posteriormente, se toma el cuadrado de las distancia para evitar que éstas se anulen entre sí y se disfrace la verdadera dispersión de los datos; por esta razón, la varianza proporciona la variabilidad en unidades al cuadrado, es decir, personas al cuadrado, ganado al cuadrado o hectáreas cuadradas, lo que no permite una comprensión fácil de esta magnitud.
La raíz cuadrada de esta varianza es la que se denomina desviación estándar de la distribución o error estándar. Esta medida de dispersión tiene la ventaja que la unidad de medida de dispersión corresponde a la unidad de la variable de interés, se establece en términos de personas, hectáreas o pesos, aunque queda la dificultad de saber si una desviación es grande o pequeña; así, por ejemplo, una variabilidad de un millón de pesos puede ser muy grande si se habla del promedio de ingresos de los empleados, pero es absolutamente pequeño si se determina sobre el total del volumen de ventas en la industria del país.
El coeficiente de variación estimado, más conocido como error de muestreo, corresponde al valor que indica el grado de precisión con el cual se está reportando un resultado de las estimaciones de los parámetros definidos con anterioridad. Es decir, se trata de la magnitud de la incertidumbre de una estimación. Se define como la variación porcentual del error estándar a la estimación central, es decir, se trata del cociente entre el error estándar del estimador y el estimador multiplicado por 100.
Aunque la varianza, el error estándar y el coeficiente de variación miden la magnitud de la variabilidad de la distribución muestral del estimador, es decir, lo que comúnmente se denomina error de muestreo, el coeficiente de variación tiene la ventaja de proporcionar esta medida en términos porcentuales, por ello se constituye en una medida común para estimaciones.
Se suele considerar que el resultado de una estimación es bueno si su coeficiente de variación es menor de 5%; aceptablemente práctico, entre 5% y 10%; de baja precisión si está en el rango mayor de 10% y menor de 15%; y no útil si es mayor a 15%.
Para entender mejor el significado y los diferentes valores que toman los coeficientes de variación en los cuadros de salida, se debe tener en cuenta que el diseño de la muestra se realizó para obtener estimaciones con alta precisión a nivel nacional por entidad. Las estimaciones para otros niveles de desagregación (como sector) están sujetas a que su precisión no necesariamente sea buena y por tanto el dato no sea confiable.
Es por esta razón que en algunos cuadros de salida aparece, por ejemplo, el total de una variable a nivel nacional y por alguna categoría de análisis con coeficientes de variación pequeños, mientras que para otras categorías de la misma variable los cve son muy altos, en ocasiones del 30 % e incluso mayores del 100 %. En estos casos, el DANE publica la cifra aunque no sea confiable, básicamente para que en los cuadros de salida la información de los totales se observe consistente y porque en muchos casos, el usuario por operaciones aritméticas simples puede deducir el valor correspondiente a esa estimación. Sin embargo, es muy importante que los usuarios de la información sean conscientes del bajo nivel de precisión que tienen estas estimaciones.
Esta situación puede darse por varias causas. Por ejemplo, cuando el fenómeno estudiado ocurre con gran frecuencia en algunas de las categorías de la variable de clasificación, por lo cual la estimación para dichas categorías es de alta calidad; pero puede ocurrir que para otras categorías en los que el fenómeno no es frecuente la estimación no es buena pues el tamaño de muestra no es suficiente. También puede obedecer al hecho de que en algunas de estas categorías el fenómeno es muy variable mientras en otras es más uniforme, lo que genera menor varianza en las estimaciones.
Todos los resultados que se producen se presentan en cuadros de salida, donde cada estimación tiene su respectivo cve o error muestral. En general, a medida que se incrementa la desagregación de las estimaciones, según las variables de clasificación, el error muestral se incrementa, básicamente porque el tamaño de muestra que incide sobre estos grupos es menor.
Sampling error estimates
---------------------------
ANÁLISIS ESTADÍSTICO
Los indicadores mencionados evalúan la calidad de la investigación de la siguiente manera:
- Indicador de calidad del informe de resultados:
Se definen cinco componentes para evaluar la calidad del informe, a saber:
1.Pertinencia de la temática (para la política pública)
2.Aporte al campo de conocimiento estadístico
3.Precisión en el cálculo de Indicadores
4.Consistencia metodológica y descriptiva (de Objetivos a resultados)
5.Claridad en la exposición de los resultados
A cada componente se le asigna un valor de 20 puntos. Luego se agregan los resultados parciales, con el fin de obtener una medida global con base 100.
- Indicador de muestra efectiva aplicada: Muestra Efectiva/ Muestra Seleccionada
- Indicador de oportunidad de la publicación del documento de resultados:
(Fecha en que termina la recolección + 2 meses) - (Número de meses en que se publica después de terminada la recolección)
ANÁLISIS DE CONTEXTO
Este análisis consta en primera instancia del cálculo de las frecuencias de todas las variables nominales medidas en la encuesta. A partir de los resultados de las frecuencias sobre cada variable, se determinan características estudiadas en la EDID sobre cada entidad objeto de estudio en términos de ambiente y desempeño institucional.
El proceso más importante que se puede generar con los resultados de la EDID es la comparabilidad a través del tiempo, en este sentido los resultados obtenidos permiten que las entidades tengan los valores por frecuencia, indicador e índice de todos los años y comparar su comportamiento año tras año. Por otro lado, con los resultados anuales de cada variable, las entidades pueden hacer comparaciones con respecto a años anteriores, otras entidades, sectores institucionales y grupos funcionales.
En este mismo sentido, para garantizar la consistencia y claridad en los resultados y así mantener la comparabilidad, la EDID también realiza comités (interno, externo) conformados por el equipo de trabajo EDID, profesionales, directivos y expertos del DANE; expertos independientes y representantes de entidades organismos nacionales e interinstitucionales; e instituciones académicas involucradas, en las temáticas objeto de estudio.
En términos generales, estos comités permiten el desarrollo de discusiones internas, socializar los resultados y realiza sugerencias que únicamente apuntan a la mejora continúa de la encuesta.
Adicionalmente, se consultan la información proveniente de otras fuentes que investigan temáticas relacionadas con las entidades públicas, con el fin de comparar los resultados obtenidos durante la vigencia. Algunas de las fuentes consultadas se encuentra el Índice de Transparencia Departamental, elaborado por el la Corporación Transparencia Internacional; y el Ranking de desempeño fiscal, elaborado por el Departamento Nacional de Planeación.
INDICADORES PARA EL CONTROL DE CALIDAD DE LOS PROCESOS DE LA INVESTIGACIÓN
La encuesta genera tres indicadores para el control de la calidad:
- Indicador de Calidad del Informe de Resultados: Este Indicador permite establecer la calidad de los informes de resultado, medido por cinco dimensiones fundamentales (Pertinencia, Aporte, Precisión, Consistencia y Claridad).
- Indicador de muestra efectiva aplicada: Este Indicador permite establecer la cantidad de personas que presentaron la encuesta para que sea representativa. Mide la eficacia del proceso de recolección.
- Indicador de oportunidad de la publicación del documento de resultados: Permite medir la oportunidad de la publicación del documento de resultados de la EDI.
INTERPRETACIÓN DE LA PRECISIÓN
Uno de los principales criterios para determinar la calidad de la estimación de un parámetro es la variabilidad que tienen los posibles resultados de dicha estimación. Esta variabilidad se conoce como varianza del estimador, la cual depende de muchos factores, como el diseño muestral, el tamaño de la muestra, el parámetro que se desea estimar, los niveles de desagregación, entre otros.
La varianza se calcula básicamente como la suma del cuadrado de las distancias entre los diferentes valores de una variable y su valor promedio, en este caso, los diferentes valores corresponden a las posibles estimaciones, las cuales, a su vez, provienen de las posibles muestras. Posteriormente, se toma el cuadrado de las distancia para evitar que éstas se anulen entre sí y se disfrace la verdadera dispersión de los datos; por esta razón, la varianza proporciona la variabilidad en unidades al cuadrado, es decir, personas al cuadrado, ganado al cuadrado o hectáreas cuadradas, lo que no permite una comprensión fácil de esta magnitud.
La raíz cuadrada de esta varianza es la que se denomina desviación estándar de la distribución o error estándar. Esta medida de dispersión tiene la ventaja que la unidad de medida de dispersión corresponde a la unidad de la variable de interés, se establece en términos de personas, hectáreas o pesos, aunque queda la dificultad de saber si una desviación es grande o pequeña; así, por ejemplo, una variabilidad de un millón de pesos puede ser muy grande si se habla del promedio de ingresos de los empleados, pero es absolutamente pequeño si se determina sobre el total del volumen de ventas en la industria del país.
El coeficiente de variación estimado, más conocido como error de muestreo, corresponde al valor que indica el grado de precisión con el cual se está reportando un resultado de las estimaciones de los parámetros definidos con anterioridad. Es decir, se trata de la magnitud de la incertidumbre de una estimación. Se define como la variación porcentual del error estándar a la estimación central, es decir, se trata del cociente entre el error estándar del estimador y el estimador multiplicado por 100.
Aunque la varianza, el error estándar y el coeficiente de variación miden la magnitud de la variabilidad de la distribución muestral del estimador, es decir, lo que comúnmente se denomina error de muestreo, el coeficiente de variación tiene la ventaja de proporcionar esta medida en términos porcentuales, por ello se constituye en una medida común para estimaciones.
Se suele considerar que el resultado de una estimación es bueno si su coeficiente de variación es menor de 5%; aceptablemente práctico, entre 5% y 10%; de baja precisión si está en el rango mayor de 10% y menor de 15%; y no útil si es mayor a 15%.
Para entender mejor el significado y los diferentes valores que toman los coeficientes de variación en los cuadros presentados, se debe tener en cuenta que el diseño de la muestra se realizó para obtener estimaciones con alta precisión a nivel nacional por entidad. Las estimaciones para otros niveles de desagregación (como sector) están sujetas a que su precisión no necesariamente sea buena y por tanto el dato no sea confiable.
Es por esta razón que en algunos cuadros aparece, por ejemplo, el total de una variable a nivel nacional y por alguna categoría de análisis con coeficientes de variación pequeños, mientras que para otras categorías de la misma variable los cve son muy altos, en ocasiones del 30 % e incluso mayores del 100 %. En estos casos, el DANE publica la cifra aunque no sea confiable, básicamente para que en los cuadros de salida la información de los totales se observe consistente y porque en muchos casos, el usuario por operaciones aritméticas simples puede deducir el valor correspondiente a esa estimación. Sin embargo, es muy importante que los usuarios de la información sean conscientes del bajo nivel de precisión que tienen estas estimaciones.
Esta situación puede darse por varias causas. Por ejemplo, cuando el fenómeno estudiado ocurre con gran frecuencia en algunas de las categorías de la variable de clasificación, por lo cual la estimación para dichas categorías es de alta calidad; pero puede ocurrir que para otras categorías en las que el fenómeno no es frecuente, la estimación no es buena, pues el tamaño de muestra no es suficiente. También puede obedecer al hecho de que en algunas de estas categorías el fenómeno es muy variable mientras en otras es más uniforme, lo que genera menor varianza en las estimaciones.
Todos los resultados que se producen se presentan en cuadros de salida, donde cada estimación tiene su respectivo cve o error muestral. En general, a medida que se incrementa la desagregación de las estimaciones, según las variables de clasificación, el error muestral se incrementa, básicamente porque el tamaño de muestra que incide sobre estos grupos es menor.
自20世纪80年代中期以来,哥伦比亚的权力下放过程在其行政、政治和财政组成部分中得到了推动。这一进程伴随着对地方实体机构的加强,以实现三个方面的协同发展。然而,在地方层面,这些调整并未平行实施。因此,在地方实体之间存在其制度基础设施的差异,一些地方更为复杂,这归因于公共服务提供规模的原因。例如,在省级层面,存在关于行政效率和执行其职能的行政效率差异。尽管存在衡量这些差异的定量指标,但没有关于区域发展参与者感知的质量指标的测量。
在《国家统计战略计划》(PENDES)框架下,国家统计局(DANE)确定了在地方公共部门领域,公共财政和就业信息占主导地位,但没有伴随关于地方实体制度发展的纵向和横向指标。为了从其公务人员的感知中描述地方制度发展,国家统计局将设计一个新统计操作作为一项优先任务,提供关于公务人员对地方实体制度状态感知的信息,这些状态是通过引入制度变革实现的。这种统计操作的整合,可以补充关于地方公共部门的集合信息任务,这些信息具有独特性、公开性、可靠性、及时性和可访问性;这旨在在全国统计系统(SEN)中开始实施一个与省级公共行政管理相关的模块,并将其与政治信息子系统联系起来。
按照这一思路,2007年国家统计局根据《省级环境和机构绩效调查》(EDID),开始创建关于公共部门地方治理和治理的统计信息战略资产。这一目标有助于推动国家发展计划的一个轴线的发展,该轴线寻求巩固一个具有管理视角的国家。基于这些要素,EDID旨在向哥伦比亚社会提供关于公务人员对地方实体制度发展的感知的统计信息和战略信息,在术语上,这是关于他们如何感知他们在提供服务的实体中的环境和机构绩效。因此,生成的信息将作为改善下放政策的支持。
该调查通过对32个省份和首都(波哥大)的公务员进行概率抽样来实施。信息收集通过DANE网站上的电子表格进行自我填写,由随机选择的样本中的公务员完成。
地理覆盖范围
---------------------------
尽管研究的实体覆盖全国,但研究对象仅限于在全国每个省份和首都(波哥大)的中央办公室工作的公务员。
分析单元
---------------------------
观察单元
具有超过六个月在实体工作经历的公务员,并在省或首都的中央工作。
分析单元
公共实体、所有省份和首都。
抽样单元
---------------------------
抽样单元对应于属于研究实体的公务员。
研究范围
---------------------------
属于全国各省和首都(波哥大)中央办公室的公务员。
数据类型
---------------------------
抽样调查(ssd)
抽样程序
---------------------------
抽样框架
对于省级环境和机构绩效调查,抽样框架对应于每个研究实体公务员的名单。这项信息每年由DANE的地方机构向参与实体的资源人力资源办公室请求,最终信息在DANE中央机构进行整合。
框架包含识别公务员的变量:姓名、姓氏和身份证号码。其他有助于其定位的变量:实体、区域或部门、工作地点的乡镇、地点和电子邮件地址。还有其他描述公务员的变量:职位、性别和官员的入职日期。
为了识别框架的过度覆盖或不足覆盖问题,每年都会比较实体中公务员的数量与上一年相比,当存在显著差异时,将使用来源帮助确认和清理信息。
重复公务员的情况很少见,但可能发生,这些公务员可能在两个实体中或同一个实体中被识别。当公务员在两个实体中时,是因为公务员最近更换了工作或正在执行任务;因为没有任何公务员应该同时在多个实体中工作。
公务员重复在同一个实体中的原因通常是,公务员晋升、在某个委员会中任职或因打字错误。
在所有情况下,框架中的重复公务员都会被识别并按照最合适的方式进行清理。
抽样类型
为这次调查提出的抽样设计是分层设计,每个层级的抽样方法是简单随机抽样(SRS)。每个实体内的分层标准是职位的层级,形成三个级别:
- 级别1:主管、顾问和执行人员
- 级别2:专业和技术人员
- 级别3:辅助人员
分层旨在确保结果考虑到每个层级级别的观点。总层级的数量取决于实体的数量以及每个实体内的层级数量。
样本大小定义
调查的理想目标是获得实体中所有公务员的观点,然而,一些实体的员工数量超出了物流和经济能力。因此,对于某些实体,将进行公务员样本,而在其他实体中进行普查。
当进行样本时,选定的公务员数量基于理论-实践练习和以前年份的经验,确保每个实体内的指标具有小于5%的变异系数。当进行普查时,是因为实体中的公务员数量少于或等于110。此外,在公务员数量较少的实体中进行的普查旨在保证来源的保密性和统计数据的保密性。
以下表格显示了实体人口规模与所选样本之间的关系。
人口规模与所选样本之间的关系:
数量:在111至150之间
样本大小:110
数量:在151至200之间
样本大小:120
数量:在201至250之间
样本大小:130
数量:在251至350之间
样本大小:140
数量:在351至450之间
样本大小:160
数量:在451至800之间
样本大小:230
数量:在801至2000之间
样本大小近似值:300
超过2000
样本大小近似值:350
基于上述表格中定义的每个实体的样本大小,为每个层级分配样本大小。每个层级内的样本分配与层级相对于实体的总大小成比例。如果任何层级级别有少于8名公务员,则对该层级进行普查,而不是样本。
抽样偏差
---------------------------
所选样本:6,842名地方公务员。
有效样本:6,309名地方公务员。
以下是对样本丢失的主要原因的描述:
- 超出宇宙的元素:是所有那些在样本中选中但不属于研究宇宙的元素;其中包含由于死亡、退休或离职而不再属于实体的公务员。
- 没有信息的元素:对应于属于研究宇宙的元素,但未获得其信息。在此组中包括在实地操作期间无法找到的公务员和拒绝参加调查的公务员。
数据收集方式
---------------------------
通过网页进行电子表格自我填写(例如,在抽样调查或普查中)
研究工具
---------------------------
仪器设计
调查问卷在其主题组件中由215个文字组成,分布在52个问题中,构成了关于国家和机构环境和绩效的变量。同样,它还包含四个(4)分类变量,允许根据实体、性别、服务时间和层级级别对结果进行区分。
模块:规则的可信度
- 工作地点:包含与调查对象工作地点相关的所有信息。
- C. 工作环境:调查对实体中劳动的认可程度、提供的劳动激励以及工作环境中活动的发展程度的满意度。
- D. 物理资源管理:调查公务员对物理资源管理的看法。
- E. 评估和控制:调查公务员对物理资源管理和工作环境的跟踪的看法。
模块:政策可信度
- F. 实体内部指导方针:调查公务员对规定实体在内部事务中行为的规范和指导的看法。
- G. 外部政策:调查对来自更高层级实体的指导方针的看法。
- H. 评估和控制:调查公务员对政策和指导方针跟踪的看法。
模块:资源充足性和可预测性
- I. 规划:调查公务员对实现每个实体目标所需资源预见的看法。
- J. 预算:调查公务员对实体预算过程的看法。
模块:发展和公民参与的规划
- K. 评估和控制:调查公务员对规划和预算跟踪的看法。
- L. 发展规划:以下陈述旨在了解地方公务员对在其实体开发的计划和项目中公民参与的看法以及其对部门的重要性。
《国家级环境和机构绩效调查》(EDI)信息捕获系统的开发是通过位于DANE网站上的电子表格进行的,作为应急措施,提供了纸质表格,随后将其转录到电子表格中。
一方面,开发用于与DANE网站配合的Web组件的捕获系统,考虑到DANE系统办公室提供的电子表格设计和构建规范。
另一方面,为了便于操作、管理和维护信息系统,制定了相应的用户手册和系统手册。该工具的信息技术组件的目的是便于捕获、更新(添加、修改和删除数据库中的记录)、查询和生成覆盖范围报告以及管理数据库管理系统和系统管理应用程序中的信息。
清理操作
---------------------------
向DANE中央机构传输数据
在通过电子表格收集的方法中,信息在线传输到结构化的ORACLE数据库中,这使得用户在填写表格时,数据可以实时存储和查询。
DANE系统办公室建立了不同的用户配置文件,并定义了根据其在操作中扮演的角色而定的权限,用户包括:
- 实体官员,通过网站自我填写和查询调查。
- 呼叫中心,查询操作状态、覆盖范围报告和按实体选择的用户列表。
- 地区协调员,填写新信息、查询操作状态和覆盖范围报告。
- 主题组或操作管理员,查询操作状态和覆盖范围报告。
- 数据库管理员,对数据库中存储的信息拥有完全控制和责任。
在ORACLE服务器上的数据库备份每天自动和程序化地执行,由DANE中央机构的数据库管理员负责。
文件合并
对收到的文件进行转换,以便将其中包含的信息读取和加载到数据库中。
数据库的结构分为:样本表、控制表以及包含关于调查不同章节收集的信息的表。
数据库表之间根据规范化规则相互关联,以及如主键、外键和索引等标准,这有助于数据库中更好的交互、性能和功能性。
一旦文件被转换,就开始将信息加载到数据库中的过程,读取、验证、组织和最终加载文件中的信息。
在生成显示存储信息的报告时,主要分类标准是国家的政治-行政划分;这些报告在国家级、省级、市级以及按样本中选择的实体生成。
验证和一致性规范
与主题、统计和系统团队一起,验证最终电子捕获表格的开发是否符合为本次调查设定的验证和一致性规范;这一过程通过涉及开发的相关团队进行的测试来完成。应明确指出,这些测试在实地操作开始之前进行,目的是找出可能的错误,并统一关于表格的概念。
内部数据一致性和调整的验证
可能发生的最主要类型的不一致性是数据库中的重复记录;这会生成一份报告,发送给每个地区,由操作团队进行验证,该团队一旦对实地记录和发送的报告进行整合和评估,就必须向DANE中央机构报告发现的任何不规则性,由负责调查的系统团队负责进行相应的更改以及数据库的最终整合。
响应率
---------------------------
估计的精确性是通过估计估计参数的方差来构建的。
使用估计的总体或比率方差,可以构建估计参数的估计变异系数,作为精确性的度量。目标是使估计的变异系数cve越小,对估计的不确定性就越小。
精确性的解释
确定参数估计质量的一个主要标准是估计可能结果的变异性。这种变异性称为估计器的方差,它取决于许多因素,如抽样设计、样本大小、要估计的参数、分解水平等。
方差基本上是变量值与其平均值之间距离的平方和,在这种情况下,不同的值对应于可能的估计,这些估计反过来又来自可能的样本。然后,取距离的平方,以避免它们相互抵消并掩盖数据的真实分散性;因此,方差提供了以平方单位为单位的变异性,即以平方为单位的人员、牲畜或公顷,这不允许对这一量级有一个简单的理解。
方差的平方根被称为分布或标准误差。这种散布度量具有以下优点,即散布的度量单位与变量的单位相对应,以人员、公顷或货币为单位设定,尽管存在知道一个偏差是很大还是很小的困难;例如,一百万的变异性,如果谈论的是员工的平均收入,可能很大,但如果确定的是国家工业总销售额,则绝对很小。
估计的变异系数,更常称为抽样误差,是表示报告先前定义的参数估计结果精确程度的值。也就是说,它是估计不确定性的量级。定义为误差标准与估计中央值的百分比变化。也就是说,它是估计标准误差与估计值的比例乘以100。
尽管方差、标准误差和变异系数衡量了估计分布的抽样分布的变异性,即通常所说的抽样误差,但变异系数的优点是提供以百分比表示的这种度量,因此它成为估计的常用度量。
通常认为,如果估计的变异系数小于5%,则估计结果是好的;如果在5%到10%之间,则被认为是可接受的;如果大于10%且小于15%,则精度低;如果大于15%,则不可用。
为了更好地理解输出表中系数变异的意义和不同值,必须考虑样本设计是为了在全国范围内按实体获得高精度估计。
对于其他分解水平(如部门)的估计,其精度不一定很好,因此数据不可靠。
因此,在一些表格中,例如,会出现变量的总数值和某些分析类别的系数变异很小,而对于同一变量的其他类别,系数变异很高,有时达到30%甚至更高。在这些情况下,DANE会发布数据,尽管不可靠,主要是为了确保在输出表中总信息的一致性,并且因为在许多情况下,用户可以通过简单的算术运算推导出该估计的相应值。然而,非常重要的一点是,信息用户必须意识到这些估计的低精度。
这种情况可能由多种原因造成。例如,当研究的现象在分类变量的某些类别中发生频率很高时,因此这些类别的估计质量很高;但可能发生的是,在现象不常见的其他类别中,估计质量不高,因为样本量不足。
此外,这可能是因为在这些类别中,现象的变异性很大,而在其他类别中则更均匀,这导致估计的方差较低。
所有产生的结果都显示在输出表中,其中每个估计都有其相应的cve或抽样误差。一般来说,随着根据分类变量分解估计的增加,误差抽样也会增加,主要是因为影响这些群体的样本量较小。
抽样误差估计
---------------------------
统计分析
所提到的指标以以下方式评估研究的质量:
- 结果报告质量指标:
定义五个组成部分来评估报告的质量,即:
1. 主题的相关性(对于公共政策)
2. 对统计知识领域的贡献
3. 指标计算的精确性
4. 方法论和描述性的一致性(从目标到结果)
5. 结果陈述的清晰度
每个组成部分分配20分。然后添加部分结果,以便获得基于100的全局度量。
- 应用有效样本的样本有效指标:有效样本/选择样本
- 结果文档发布机会指标:
(收集结束日期+2个月)-(收集结束后发布的时间)
分析背景
---------------------------
此分析首先包括计算调查中所有名义变量的频率。基于每个变量的频率结果,确定EDID中每个研究实体在环境和机构绩效方面的研究特征。
EDID结果可以生成的重要过程之一是通过时间比较的可比性。在这方面,获得的结果允许实体获得每年和指标的值,并按年份比较其行为。
另一方面,通过每个变量的年度结果,实体可以就以前年份、其他实体、机构部门和功能组进行比较。
同样,为了确保结果的一致性和清晰性以及保持可比性,EDID还建立了委员会(内部、外部),由EDID工作团队、专业人士、直接领导和DANE的专家组成;独立专家和来自国家机构、跨机构实体的代表;以及涉及研究主题的学术机构。
总的来说,这些委员会允许进行内部讨论、交流结果并提出建议,这些建议仅针对调查的持续改进。
此外,还咨询了来自其他来源的信息,这些来源研究与公共实体相关的主题,以便比较在有效期内获得的结果。一些被咨询的来源包括由透明国际公司编制的《省级透明度指数》和由国家计划部门编制的《绩效排名》。
研究过程的质量控制指标
---------------------------
调查产生三个指标来控制研究的质量:
- 结果报告质量指标:此指标允许确定结果报告的质量,通过五个基本维度来衡量(相关性、贡献、精确性、一致性和清晰度)。
- 应用有效样本的样本有效指标:此指标允许确定代表性地参加调查的人数。
- 结果文档发布机会指标:允许衡量EDI结果文档发布的机会。
精确性的解释
---------------------------
确定参数估计质量的一个主要标准是估计可能结果的变异性。这种变异性称为估计器的方差,它取决于许多因素,如抽样设计、样本大小、要估计的参数、分解水平等。
方差基本上是变量值与其平均值之间距离的平方和,在这种情况下,不同的值对应于可能的估计,这些估计反过来又来自可能的样本。然后,取距离的平方,以避免它们相互抵消并掩盖数据的真实分散性;因此,方差提供了以平方单位为单位的变异性,即以平方为单位的人员、牲畜或公顷,这不允许对这一量级有一个简单的理解。
方差的平方根被称为分布或标准误差。这种散布度量具有以下优点,即散布的度量单位与变量的单位相对应,以人员、公顷或货币为单位设定,尽管存在知道一个偏差是很大还是很小的困难;例如,一百万的变异性,如果谈论的是员工的平均收入,可能很大,但如果确定的是国家工业总销售额,则绝对很小。
估计的变异系数,更常称为抽样误差,是表示报告先前定义的参数估计结果精确程度的值。也就是说,它是估计不确定性的量级。定义为误差标准与估计中央值的百分比变化,即误差标准与估计值的比例乘以100。
尽管方差、标准误差和变异系数衡量了估计分布的抽样分布的变异性,即通常所说的抽样误差,但变异系数的优点是提供以百分比表示的这种度量,因此它成为估计的常用度量。
通常认为,如果估计的变异系数小于5%,则估计结果是好的;如果在5%到10%之间,则被认为是可接受的;如果大于10%且小于15%,则精度低;如果大于15%,则不可用。
为了更好地理解输出表中系数变异的意义和不同值,必须考虑样本设计是为了在全国范围内按实体获得高精度估计。
对于其他分解水平(如部门)的估计,其精度不一定很好,因此数据不可靠。
因此,在一些表格中,例如,会出现变量的总数值和某些分析类别的系数变异很小,而对于同一变量的其他类别,系数变异很高,有时达到30%甚至更高。在这些情况下,DANE会发布数据,尽管不可靠,主要是为了确保在输出表中总信息的一致性,并且因为在许多情况下,用户可以通过简单的算术运算
提供机构:
microdatos.dane.gov.co



