Encuesta de Consumo Cultural - ECC - 2020 - Colombia
收藏microdatos.dane.gov.co2023-01-31 更新2025-03-23 收录
下载链接:
https://microdatos.dane.gov.co/index.php/catalog/691
下载链接
链接失效反馈官方服务:
资源简介:
Resumen
---------------------------
El Departamento Administrativo Nacional de Estadística (DANE), como coordinador del Sistema Estadístico Nacional (SEN) y en el marco del proyecto de Planificación y Armonización Estadística, trabaja por el fortalecimiento y consolidación del SEN mediante los siguientes procesos: la producción de estadísticas estratégicas; la generación, adaptación, adopción y difusión de estándares; la consolidación y armonización de la información estadística y la articulación de instrumentos, actores, iniciativas y productos. Estas acciones tienen como fin mejorar la calidad de la información estadística estratégica, su disponibilidad, oportunidad y accesibilidad para responder a la gran demanda que se tiene de ella.
Consciente de la necesidad y obligación de brindar a los usuarios mejores productos, el DANE desarrolló una guía estándar para la presentación de metodologías que contribuye a la visualización y entendimiento del proceso estadístico. Con este instrumento la entidad elaboró los documentos metodológicos de sus operaciones e investigaciones estadísticas que quedan a disposición de los usuarios especializados y del público en general. Allí se presentan de manera estándar, completa y de fácil lectura las principales características técnicas de los procesos y subprocesos de cada investigación, lo que permite su análisis, control, replicabilidad y evaluación.
Esta serie de documentos favorecen la transparencia, confianza y credibilidad de la calidad técnica de la institución para un mejor entendimiento, comprensión y aprovechamiento de la información estadística. Tal información es producida bajo los principios de coherencia, comparabilidad, integralidad y calidad de las estadísticas.
Geographic coverage
---------------------------
La encuesta tiene un cubrimiento a nivel nacional para las cabeceras municipales y se realiza cada dos años. Se entregan indicadores a Total Cabecera y para las siguientes seis regiones: BOGOTA, CARIBE, ORIENTAL, CENTRAL, PACIFICA y AMAZONIA/ORINOQUIA
Analysis unit
---------------------------
UNIDAD DE OBSERVACIÓN
Está constituida por las viviendas, los hogares y las personas.
UNIDAD DE ANÁLISIS
Corresponden a las viviendas, los hogares y las personas de 5 años y más.
UNIDAD DE MUESTREO
Existen varias unidades de muestreo dependiendo de la etapa de la cual se esté hablando. Las unidades primarias de muestreo se relacionan con la primera etapa, las unidades secundarias con la segunda etapa y así sucesivamente. Para esta encuesta en particular se definen 3 etapas, y sus unidades de muestreo asociadas son las siguientes:
Unidades Primarias de Muestreo (UPM): se denominan así los municipios de 7.000 y más habitantes. Los municipios de menor tamaño se han combinado con algún vecino de similares características, para completar un tamaño mínimo de 7.000 habitantes y poder así garantizar los requerimientos de tamaño muestral a este nivel.
Unidades Secundarias de Muestreo (USM): son las manzanas en las cabeceras municipales.
Unidades Terciarias de Muestreo (UTM): son los segmentos o medidas de tamaño MT (áreas de 10 viviendas en promedio) en la cabecera, con límites naturales fácilmente identificables en los que se encuestan todos los hogares.
Universo de estudio
---------------------------
Está conformado por la población civil no institucional residente en las cabeceras municipales del territorio nacional.
Kind of data
---------------------------
Datos de manejo de tiempo (tbd)
Sampling procedure
---------------------------
PLAN MUESTRAL
TIPO DE MUESTREO :
Teniendo en cuenta los objetivos de la encuesta, se optó por un diseño muestral probabilístico, estratificado, multietápico y de conglomerados
PROBABILISTICO:
Cada elemento del universo de estudio tiene una probabilidad de selección conocida y superior a cero. Esta información permite determinar a priori la precisión deseada en las estimaciones y posteriormente, calcular la precisión de los resultados obtenidos a partir de la información recolectada.
MULTIETÁPICO
Para lograr la selección de las unidades de observación (viviendas, hogares o personas) se seleccionaron secuencialmente las unidades de muestreo en tres etapas (UPM, USM y UTM) con probabilidades de selección en función del número de viviendas.
En una primera etapa, la UPM, utilizando la técnica de selección controlada dentro de cada estrato.
Para la segunda etapa, la USM a nivel de manzana. Para la selección de manzanas, se utiliza una selección de muestra proporcional al tamaño sistemática (PPT-SIS) de manzanas.
En la tercera etapa se selecciona el segmento o UTM con un muestreo aleatorio simple de conglomerados (MASC).
En este proceso de selección por etapas sólo se requiere una actualización cartográfica detallada de las áreas seleccionadas.
ESTRATIFICADO
Para la estratificación y selección de la muestra, en las capitales de departamento seleccionadas, las áreas geográficas se organizaron cartográficamente en sectores, secciones y manzanas, con la información del número de viviendas a nivel de manzana.
Para el resto del país, el proceso de selección contempló la previa estratificación de las UPM.
Las UPM se estratificaron de acuerdo con los siguientes criterios:
Geográficos, a nivel de departamento.
Socioeconómicos, a nivel de UPM, con los siguientes indicadores:
Nivel de urbanización, en términos de la cantidad de población de las cabeceras municipales.
Estructura urbano-rural de la población municipal (% de población en cabecera).
Cada municipio con 7.000 o más habitantes en su población total, se constituyó en UPM. Los de menor población se agruparon con un vecino para constituirse en UPM.
DE CONGLOMERADOS
Para el caso de esta encuesta los conglomerados están definidos por la unidad terciaria de muestreo y corresponde a un promedio de 10 viviendas (contiguas), donde se encuestan todas las viviendas, hogares y personas que lo conforman.
ROTACIÓN DE LA MUESTRA
Dado el carácter bianual de la encuesta y con el fin de controlar la repetición de la encuesta a los mismos hogares, lo cual puede generar rechazos y la reducción en la cobertura y calidad de la encuesta, se definieron los procedimientos que se resumen a continuación:
En las diferentes cabeceras seleccionadas de la muestra, cada manzana es segmentada en grupos. Cada grupo o segmento tiene aproximadamente 10 viviendas. En la primera ronda se selecciona una manzana y de esta se toma un segmento aleatoriamente, para la siguiente ronda de la encuesta, se elige un segmento diferente al inicial. Se procede de esta forma en las siguientes rondas hasta agotar la manzana, es decir, hasta que se hayan encuestado todos los segmentos pertenecientes a la manzana. Cuando se agota la manzana se toma una manzana vecina para empezar de nuevo el proceso.
CÁLCULO DEL TAMAÑO DE LA MUESTRA
Los cálculos se realizan con las fórmulas correspondientes al tipo de diseño muestral. Se ajustan con base en el efecto de los conglomerados en el diseño (deff).
Sampling deviation
---------------------------
AJUSTES DE COBERTURA ( O AJUSTE DE COBERTURA POR NO RESPUESTA)
El ajuste de cobertura se realiza cuando se pierden segmentos u hogares. Cuando hay pérdida de segmentos se ajusta a nivel de UPM, calculando la razón entre el número de segmentos seleccionados y el número de segmentos efectivamente encuestados. Si hay perdida de hogares el ajuste se realiza a nivel de segmento, se calcula la razón entre número de hogares encontrados en el segmento y el número de hogares efectivos completos.
Mode of data collection
---------------------------
Entrevista personal asistida con DMC (dispositivo móvil de captura)
Research instrument
---------------------------
DISEÑO DEL CUESTIONARIO
El instrumento para la recolección de información de la ECC consta de 4 capítulos en el componente de identificación de hogar y personas y 5 capítulos en el componente de consumo cultural. Para el correcto desarrollo del formulario se cuenta con el manual de diligenciamiento y conceptos básicos en el que se ilustra paso a paso cada uno de los capítulos.
Para cada uno de los capítulos está definido un objetivo, que permite determinar y entender el alcance de los temas trabajados a lo largo de la encuesta.
De acuerdo con la población objetivo, y para el correcto diligenciamiento de la encuesta, se cuentan con diferentes informantes por capítulo.
Cleaning operations
---------------------------
DISEÑO DEL PROCESAMIENTO
Este diseño se inicia con el análisis de las normas de validación y consistencia remitidos por el área temática, seguido a este proceso se diseña el sistema de captura, la base de datos, el programa de cargue de información, generación de reportes y frecuencias simples, revisión de validación e inconsistencia de la información recolectada en campo, cuando el operativo termina se hace consolidación de la base de datos, se anonimiza teniendo como base el protocolo diseñado por el equipo temático y entregado al equipo de sistemas para tal propósito y se generan los cuadros de salida.
DISEÑO DE SISTEMAS DE CAPTURA DE DATOS
La captura de información se hace a través del Dispositivo Móvil de Captura (DMC). El desarrollo de sistemas de captura con dispositivos móviles debe integrar aspectos de diseño, instalación y obtención de datos de los DMC y cargue de archivos a la base de datos. Para facilitar la operación, administración y mantenimiento del sistema se cuenta con el manual del usuario de la encuesta.
Adicionalmente como parte del diseño de sistemas se realizan las siguientes actividades:
Diseño y desarrollo del software de captura y generación de instaladores para DMC: en este subproceso se construye el aplicativo del software que será utilizado en el operativo de recolección de la información, mediante el desarrollo de cinco fases a saber:
Fase 1. Diseño del formulario. En esta fase se crea el formulario de captura con los objetos y herramientas que el software facilita, teniendo siempre en cuenta las normas de validación y consistencia presentadas por el grupo temático de la encuesta.
Fase 2. Configuración de tablas que alimentan el diseño. Se preparan los archivos de datos que alimentan el diseño de la encuesta.
Fase 3. Creación de perfiles del usuario. Se implementa en el software de captura la estructura jerárquica con la que se planeó el operativo de recolección en términos del personal y sus funciones. En el software se reconocen los perfiles de las personas que supervisan y las personas que encuestan.
Fase 4. Creación de la estructura de carpetas para el almacenamiento físico de los datos recolectados en el operativo.
Pretende estandarizar la nomenclatura que se debe utilizar para la creación de nombres de archivos y de carpetas que se utilizarán durante todo el proceso de recolección, y principalmente agrupar la información del proyecto en una sola parte o espacio físico para coadyuvar al almacenamiento y recuperación eficiente de la misma. En esta estructura se deben almacenar los archivos contenidos en las SD, los reportes de cobertura y las copias de seguridad de la base de datos ORACLE.
Fase 5. Generación del software instalador del aplicativo para DMC. Genera el software instalador del aplicativo para DMC teniendo en cuenta la estructura jerárquica de los perfiles de usuario, este es el último paso antes de la entrada a producción del sistema.
CREACIÓN DE LA BASE DE DATOS
Se cuenta con un motor de bases de datos ORACLE y un esquema creado para la investigación que permite el cargue y almacenamiento general de los datos. La base de datos para la investigación asignada, es una base de datos relacional en donde cada tabla corresponde a un capítulo de la encuesta, existe un único registro por vivienda.
Se debe asignar el número de la encuesta asociado a la investigación y definir los tipos de datos, texto de la pregunta, listas de valores asociadas, subpreguntas entre otros. De igual manera definir los formularios y subformularios: para las encuestas a hogares generalmente incluyen los tres niveles básicos para la toma de información: Vivienda, Hogar y Personas, cada uno de los niveles relacionado consta de uno o varios capítulos de acuerdo a la temática. Opcionalmente se establecen los flujos y validaciones de todas y cada una de las preguntas descritos en el manual de validación y consistencias remitido por el equipo temático.
En la estructura del formulario se debe asociar a cada pregunta el código equivalente con el código de pregunta en ORACLE, incluyendo el número de formulario. Adicionalmente, como parte del diseño, se crea un ETL (Extract, Transform and Load) en Pentaho Data Integration y se carga la muestra a una tabla de la base de datos, para poder realizar el cargue de la información.
TRANSMISIÓN DE DATOS
Diariamente se envía información de encuestas completas a DANE Central. Para este proceso se consolida la información y se realiza la transmisión de datos de las encuestas a través del FTP (File Transfer Protocol), que es un protocolo de red para la transferencia de archivos entre sistemas conectados a una red, basado en la arquitectura cliente-servidor. Desde el equipo cliente las ciudades o municipios se conectan a un servidor para descargar archivos desde él o para enviarlos.
A cada ciudad o municipio se le crea un buzón en el servidor FTP del DANE Central, en el cual se dispone la información de las encuestas completas que se recolectan diariamente. Al final del operativo, se incluye toda la información faltante de los segmentos asignados para recolección (Encuestas completas e incompletas).
Igualmente, es tarea del apoyo informatico remitir un formato de apoyo de sistemas en el cual debe diligenciar la información de cada una de las encuestas que está cargando al FTP, para que el área de sistemas al descargar la información verifique que la cantidad de encuestas cargadas corresponde con la cantidad diligenciada en el formato, y de esta forma garantizar que se cargaran a base de datos la totalidad de las encuestas transmitidas.
CONSOLIDACIÓN DE ARCHIVOS DE DATOS
Recibidos los archivos, la información es descargada del buzón FTP y almacenada en una estructura jerárquica por fecha, para realizar la desencripción de los datos. Una vez se seleccionan los archivos que se deben cargar en la base de datos, se realiza el proceso de carga utilizando la transformación diseñada con Pentaho Data Integration.
CODIFICACIÓN
Semanalmente se comparte la base de datos con el equipo temático, para realizar la validación de inconsistencias de la información recolectada en campo, dentro de ellas la verificación de respuestas abiertas las cuales deberían estar incluidas dentro de las categorías definidas en el formulario de recolección; el equipo temático genera un archivo con las viviendas en las cuales existen este tipo de inconsistencia, el cual es remitido a cada territorial para que se haga la pertinente corrección, es decir, la respuesta abierta sea categorizada dentro de las opciones disponibles.
DICCIONARIO DE DATOS
El diccionario de datos es una tabla correlativa, con la cual se puede observar, la relación de cada una de las tablas de la base de daos y su correspondencia con el formulario de la encuesta, así como los tipos de variables utilizados, tamaños y valores permitidos.
ANONIMIZACIÓN DE MICRODATOS
El DANE ofrece los niveles apropiados de seguridad de la información para la generación y el acceso a los microdatos anonimizados.
El equipo de temática determina las variables que por confidencialidad deben ser anonimizadas en la base de datos que se va a publicar y a partir de la base de datos final, es decir, solo con las encuestas completas, arma un archivo que remite al área de sistemas. Dicha área luego de realizar ese proceso reenvía el archivo al área temática para su verificación y aprobación y posterior publicación en la página web de DANE.
Para esta encuesta se determina no incluir en la base de datos algunas variables correspondientes a la identificación de las viviendas como son la dirección, barrio, número telefónico, etc. y datos de identificación de las personas tales como nombre y apellido, fecha de nacimiento, entre otras.
Sampling error estimates
---------------------------
ANÁLISIS ESTADÍSTICO
En la ejecución de la ECC y su procesamiento, se pueden generar sesgos de información que pueden producirse por el mal diligenciamiento de formularios, una ubicación geográfica inadecuada, errores en la consolidación de la información y su procesamiento, los cuales se conocen como errores no muestrales. Para corregir y controlar dichas falencias y mantener los niveles de calidad se hace una revisión constante por parte de cada uno de los componentes estadístico, temático, operativo y de sistemas. Dichos procesos resultan cuantificados y evaluados mediante indicadores de completes, cobertura y coeficiente de variación, que en consecuencia miden la calidad del resultado final.
En particular, el error de muestreo se constituye en una herramienta para establecer parámetros de precisión en los resultados. Para su uso e interpretación se debe tener en cuenta que si la dispersión es alta, los parámetros estimados pierden utilidad, pues el valor verdadero del parámetro, en el universo, puede estar en un intervalo muy amplio lo cual no proporciona información útil. Por lo tanto, esta medida de variabilidad es un criterio muy importante para determinar la calidad de una estimación.
ANÁLISIS DE CONTEXTO
Una vez finalizado el operativo de campo y efectuado el respectivo cierre, las territoriales envían un análisis de contexto, donde se relacionan las actividades culturales más relevantes de su municipio e informan los comportamientos atípicos presentados durante el proceso de recolección, dentro de la temática de estudió e igualmente informan de situaciones y aspectos que influyen en los consumos culturales de cada municipio.
Así mismo los resultados obtenidos de la ECC, se analizan teniendo en cuenta la información de hechos nacionales relacionados en reportajes o noticias nacionales.
COMITÉS DE EXPERTOS
La coordinación temática de la ECC, convoca a un Comité Técnico Interno antes de la publicación con el fin de presentar los resultados obtenidos y analizar el comportamiento de los principales indicadores de consumo cultural y uno Externo después de la publicación, si es aprobado por la Dirección DIMPE, lo anterior con el fin de dar a conocer las cifras a los diferentes expertos del sector.
ANÁLISIS DE CONSISTENCIA
Primero el grupo temático define, considerando las características de la investigación, una serie de validaciones y consistencias entre preguntas y flujos en el cuestionario. Luego de este primer paso, se trabaja con los grupos estadístico y de sistemas en la aplicación de estos procedimientos en el formulario que está en el DMC. Entre los tres grupos se hacen las diferentes pruebas para corroborar que el aplicativo funcione de acuerdo con las normas establecidas.
Este proceso se efectúa mediante pruebas directas en las que participan los equipos que hacen parte de la encuesta (logística, sistemas, muestras y temático). Se destaca que esta etapa se realiza antes de iniciar el operativo en campo, dado que el propósito es hallar y corregir posibles errores o dificultades así como estandarizar los conceptos y flujos que contiene el formulario de la encuesta.
Durante el operativo de campo, la información de hogares y encuestas completas, se compara y concilia con los resultados generados por el grupo de sistemas todas las semanas, para determinar si existen inconsistencias o no, y de ahí, tomar las respectivas acciones operativas para lograr obtener la información con calidad y en el tiempo estipulado.
ANÁLISIS DE COMPARABILIDAD
Con el propósito de contrastar la coherencia y la consistencia de los resultados y realimentar los análisis realizados, se diligencia una matriz donde se registran las variables principales de la encuesta y las variables relacionadas de las diferentes fuentes estadísticas, en temas de asistencia a eventos, presentaciones y espectáculos, lectura y audiovisuales, asistencia a espacios culturales. Con este insumo se hace un análisis de tendencias donde se observan los resultados de los indicadores de las diferentes fuentes versus los indicadores arrojados por la ECC, así mismo se tiene en cuenta la serie histórica de la encuesta para la comparabilidad.
VERIFICACIÓN DE LA ANONIMIZACIÓNDE MICRODATOS
El equipo temático verifica los microdatos anonimizados, de forma que se asegure que las variables incluidas en la base de datos correspondan con los códigos del diccionario de datos y sean consistentes con la base final usada para el procesamiento de resultados. Igualmente comprueba que la descripción de variables de la Encuesta de Consumo Cultural, se haya subido al aplicativo Nesstar correctamente.
摘要
--------------------------------
国家统计局(DANE)作为国家统计系统(SEN)的协调者和规划与统计协调项目的一部分,致力于通过以下过程加强和巩固SEN:战略统计的生产;标准的生成、适配、采用和传播;统计信息的整合和协调,以及工具、参与者、倡议和产品的衔接。这些行动旨在提高战略统计信息的质量、可用性、及时性和可及性,以满足对其的巨大需求。
意识到提供更优质产品的重要性和义务,DANE制定了一套标准指南,用于方法论展示,有助于统计过程的可视化和理解。通过此工具,该机构编制了其操作和统计调查的方法论文件,这些文件可供专业用户和公众查阅。其中,以标准、完整和易于阅读的方式呈现了每个调查的主要技术特征和子过程,这有助于其分析、控制、可重复性和评估。
这些文件促进了机构的透明度、信任和可靠性,有助于更好地理解、理解和利用统计信息。此类信息是根据一致性、可比性、完整性和统计质量的原则生产的。
地理覆盖范围
--------------------------------
调查覆盖全国范围的市镇首脑,每两年进行一次。提供总首脑和以下六个地区的指标:波哥大、加勒比、东方、中央、太平洋和亚马孙/奥里诺科。
分析单元
--------------------------------
观察单位
由房屋、家庭和人员组成。
分析单位
对应于5岁及以上的房屋、家庭和人员。
抽样单位
存在多个抽样单位,取决于所讨论的阶段。抽样的一级单位与第一阶段相关,二级单位与第二阶段相关,依此类推。对于这项特定的调查,定义了3个阶段,其相应的抽样单位如下:
抽样一级单位(UPM):指人口超过7,000的市镇。人口较少的市镇已与某些类似特征的邻镇合并,以完成至少7,000人的最小规模,从而确保该级别的样本量要求。
抽样二级单位(USM):是市镇首脑的街区。
抽样三级单位(UTM):是首脑的10户家庭平均规模的区域(MT),其中边界容易识别,对其中所有家庭进行调查。
研究范围
--------------------------------
由居住在全国市镇首脑的非机构化公民人口组成。
数据类型
--------------------------------
时间管理数据(待定)
抽样程序
--------------------------------
抽样计划
抽样类型:
考虑到调查的目标,选择了一种概率抽样、分层、多阶段和聚类设计。
概率抽样:考虑到调查的目标,选择了一种概率抽样、分层、多阶段和聚类设计。
概率抽样:考虑到调查的目标,选择了一种概率抽样、分层、多阶段和聚类设计。
概率抽样:考虑到调查的目标,选择了一种概率抽样、分层、多阶段和聚类设计。
多阶段:为了实现观察单位(房屋、家庭或人员)的选取,依次在三个阶段(UPM、USM和UTM)中选择了抽样单位,其选择概率根据房屋数量而确定。
在第一阶段,UPM,使用每个层内的控制选择技术。
在第二阶段,USM在街区层面。对于街区的选择,使用按街区大小系统抽样的方法(PPT-SIS)。
在第三阶段,选择区域或UTM,使用简单的聚类抽样(MASC)。
在此阶段选择过程中,仅需要详细更新所选区域的地图。
分层:在分层和抽样选择过程中,在选定的部门首府,地理区域被地图化组织为区域、部分和街区,并提供了街区层面的房屋数量信息。
对于其他国家,选择过程包括对UPM的预先分层。
UPM按以下标准分层:
地理的,在部门层面。
社会经济,在UPM层面,以下指标:
城市化水平,以市镇首脑的人口数量衡量。
市镇人口的城市-农村结构(市镇首脑人口百分比)。
总人口中7,000人或更多的人口的城市,构成UPM。人口较少的城市与一个邻镇合并,以构成UPM。
聚类的:对于这项调查,聚类由抽样三级单位定义,对应于10户家庭的平均连续区域,其中调查所有家庭、家庭和人员。
样本轮换:鉴于调查的双年性质和防止对同一家庭重复调查的目的,以避免产生拒绝和降低调查覆盖范围和质量,定义了以下程序:
在选定的不同样本首脑中,每个街区被划分为组。每个组或段大约有10户房屋。在第一轮中,选择一个街区并随机选择一个段,在下一轮调查中,选择一个不同于初始的段。以此类推进行下一轮,直到耗尽街区,即耗尽属于街区的所有段。当耗尽街区时,选择相邻街区以重新开始过程。
样本量计算:使用相应的抽样设计公式进行计算。根据聚类的效应进行调整(deff)。
抽样误差估计
--------------------------------
覆盖调整(或非回应覆盖调整):当丢失段或家庭时进行覆盖调整。当丢失段时,在UPM层面进行调整,计算所选段与实际调查段之间的比率。如果丢失家庭,则在段层面进行调整,计算段内找到的家庭数量与实际完成的家庭数量之间的比率。
数据收集方式
--------------------------------
辅助DMC(移动数据采集)的个人访谈
研究工具
--------------------------------
问卷设计:
ECC收集信息所用的工具由4个章节组成,涉及家庭和人员识别组件,以及5个章节的文化消费组件。为了正确填写表格,有填写指南和基本概念,其中逐步说明了每个章节。
每个章节都定义了一个目标,这有助于确定和理解调查中讨论的主题范围。
根据目标人口和正确填写调查的需要,每个章节都有不同的信息提供者。
数据清洗操作
--------------------------------
处理设计:
此设计从分析由主题领域提交的验证和一致性规范开始,然后设计捕获系统、数据库、信息加载程序、报告生成和频率单,以及检查在实地收集的信息的验证和一致性。当操作结束后,进行数据库的整合,根据主题团队设计的协议进行匿名化,并将其交给系统团队进行处理,并生成输出表格。
数据捕获系统设计:
通过DMC(移动数据采集)捕获信息。使用移动设备捕获数据的设计必须整合设计、安装和DMC的数据获取以及文件的数据库加载。为了便于操作、管理和维护系统,有问卷用户手册。
此外,作为设计的一部分,还进行了以下活动:
设计和发展DMC捕获软件和生成安装程序:在此子过程中,构建了在信息收集操作中使用的软件应用程序,通过以下五个阶段:
阶段1. 表单设计。在此阶段,创建捕获表单,使用软件提供的对象和工具,同时始终考虑由调查主题团队提出的验证和一致性规范。
阶段2. 配置为设计提供数据的表。准备为调查设计提供数据的文件。
阶段3. 创建用户配置文件。在捕获软件中实施在人员及其职能方面计划的操作收集的层次结构。在软件中识别监督人员和调查人员的人员配置文件。
阶段4. 创建用于存储在实地收集的数据的物理存储的文件夹结构。旨在标准化在收集过程中应使用的文件和文件夹命名约定,主要目的是将项目信息分组在一个部分或物理空间中,以协助高效存储和恢复信息。在此结构中应存储存储在SD卡中的文件、覆盖范围报告和数据库的备份。
阶段5. 生成DMC应用程序的安装程序。根据用户配置文件的层次结构生成DMC应用程序的安装程序,这是进入生产的最后一步。
创建数据库:
拥有Oracle数据库引擎和为研究创建的方案,允许加载和存储一般数据。分配给研究的数据库是关系数据库,其中每个表对应于调查的一个章节,每个房屋只有一个记录。
必须为调查分配问卷编号并定义数据类型、问题文本、相关值列表、子问题等。
同样,定义表单和子表单:对于家庭调查,通常包括三个基本级别,用于收集信息:房屋、家庭和人员,每个级别都关联一个或多个章节,根据主题而定。可选地,建立所有和每个问题的流和验证,这些在主题团队提交的验证和一致性手册中描述。
在表单结构中,必须将每个问题与在Oracle中对应的提问代码相关联,包括表单编号。此外,作为设计的一部分,在Pentaho Data Integration中创建ETL(提取、转换和加载),并将样本加载到数据库中的一个表中,以便能够进行信息加载。
数据传输:
每天将完整问卷的信息发送到DANE中央。为此过程,整合信息并通过FTP(文件传输协议)传输问卷数据,该协议是一种基于客户-服务器架构的用于在连接到网络的系统之间传输文件的协议。从客户端,城市或市镇连接到服务器,以从服务器下载文件或将文件发送到服务器。
为每个城市或市镇在DANE中央的FTP服务器上创建一个邮箱,其中放置每天收集的完整问卷信息。在操作结束后,包括分配给收集的段的所有缺失信息(完整和未完成的问卷)。
同样,信息技术支持团队的任务是提交一个系统支持格式,其中必须填写每个正在加载到FTP的问卷的信息,以便系统团队在下载信息时验证加载的问卷数量是否与填写在格式中的数量相符,从而确保所有传输的问卷都加载到数据库中。
数据文件合并:
收到文件后,从FTP邮箱中下载信息并将其存储在按日期分层的分层结构中,以进行数据描述。一旦选择要加载到数据库中的文件,就使用设计的转换进行加载过程。
编码:
每周与主题团队共享数据库,以验证在实地收集的信息中的不一致性,其中包括检查开放式回答,这些回答应包含在收集表单中定义的类别中;主题团队生成一个包含存在此类不一致性的家庭的文件,并将其发送到每个地区进行相应的纠正,即开放式回答应分类在可用的选项中。
数据字典:
数据字典是一个相关表,可以观察每个数据库表与问卷表单的对应关系,以及使用的变量类型、大小和允许的值。
匿名化微数据:DANE提供适当的保密信息级别,以生成和访问匿名化微数据。
主题团队确定需要在要发布的数据库中匿名化的变量,从最终数据库开始,即仅使用完整的问卷,构建一个文件并将其发送到系统团队。然后,该团队在执行该过程后将其发送回主题团队进行验证和批准,然后发布在DANE网站上。
对于这项调查,确定不包括数据库中的一些与房屋识别相关的变量,例如地址、街区、电话号码等,以及与人员识别相关的数据,例如姓名、姓氏、出生日期等。
抽样误差估计
--------------------------------
统计分析:
在执行ECC及其处理过程中,可能会产生信息偏差,这些偏差可能由表单填写不当、地理位置不当、信息整合和处理中的错误产生,这些错误被称为非抽样误差。为了纠正和控制这些缺陷并保持质量水平,由统计、主题、操作和系统每个组件进行持续审查。这些过程通过完成率、覆盖率系数和变异系数指标进行量化,从而衡量最终结果的质量。
特别是,抽样误差构成了确定结果精确度参数的工具。在使用和解释时,应考虑如果分散度很高,估计参数将失去效用,因为参数的真值在总体中可能在一个很宽的区间内,这不会提供有用的信息。因此,这种变异度度量是确定估计质量的重要标准。
分析背景:
一旦完成实地操作并执行相应的关闭,地区团队将发送一个分析背景,其中将与其市镇最相关的文化活动联系起来,并报告在收集过程中出现的行为异常,在研究主题范围内,同样,还报告影响每个市镇文化消费的各个方面和情况。
同样,对ECC获得的结果进行分析时,考虑到与国家事实相关的报告或新闻。
专家委员会:ECC的主题协调团队在发布前召集内部技术委员会,以介绍获得的结果并分析主要文化消费指标的行为,如果由DIMPE主任批准,在发布后,将召集外部委员会,以便向该领域的不同专家公布数字。
一致性分析:首先,主题团队根据研究的特征定义了一系列验证和问卷中的问题和流之间的验证和一致性。然后,与统计和系统团队一起在DMC中的问卷上应用这些程序。在三个团队之间进行不同的测试,以证实应用程序符合规定的标准。
此过程通过直接测试进行,其中调查的各个团队(后勤、系统、样本和主题)参与其中。突出的是,这个阶段在开始实地操作之前进行,目的是找出和纠正可能的错误或困难,以及标准化问卷中包含的概念和流程。
在实地操作期间,每周比较和协调家庭和完整问卷的信息与系统团队生成的结果,以确定是否存在不一致性,然后采取相应的操作行动,以在规定的时间内获得高质量的信息。
可比性分析:为了对比结果的连贯性和一致性,并补充所进行的分析,填写一个矩阵,其中记录调查的主要变量和不同来源的相关变量,在参与事件、演示和演出、阅读和视听、参加文化空间的主题上。利用此资料进行趋势分析,观察不同来源的指标与ECC产生的指标之间的比较,同时考虑调查的历史系列,以进行可比性分析。
微数据匿名化验证:主题团队验证匿名化微数据,以确保包含在数据库中的变量与数据字典中的代码相对应,并与用于处理结果的最终数据库保持一致。同样,检查调查的文化消费的描述是否已正确上传到Nesstar应用程序。
提供机构:
microdatos.dane.gov.co



