five

Encuesta de Consumo Cultural 2010 - Colombia

收藏
catalog.ihsn.org2019-03-29 更新2025-03-22 收录
下载链接:
http://catalog.ihsn.org/catalog/5280
下载链接
链接失效反馈
官方服务:
资源简介:
Abstract --------------------------- Las prácticas culturales asociadas al consumo de bienes y servicios ofertados por el sector cultural, así como al uso del tiempo libre, se plantean como nuevas dimensiones en la estructuración de la vida, tanto de los individuos como de los distintos grupos sociales. Una prueba de ello es la promulgación de lineamientos internacionales sobre el capital social y cultural de los pueblos y naciones, junto con el auge de los derechos y libertades que hacen visible una amplia gama de minorías sociales y culturales. Sumado a ello, la creciente aparición de políticas estatales, que favorecen el desarrollo de la cultura, el deporte y la recreación, han expuesto y convertido en agenda pública una realidad importante: la dimensión social y cultural del ser humano. Bajo esta perspectiva, la apropiación, posesión y uso de bienes, servicios y espacios culturales se ha convertido en un objeto de interés de las ciencias sociales, de la institucionalidad pública y de los organismos multilaterales, en tanto que se han convertido en prácticas específicas que permiten seguirle la pista a los procesos culturales. En distintas latitudes, desde diferentes perspectivas y magnitudes, algunos estudios han intentado abordar el tema del consumo cultural de acuerdo con las características nacionales o poblacionales, las preferencias ciudadanas o los gastos realizados por las personas. En Colombia, a pesar de que existen mediciones alrededor de la oferta y del dinero gastado por las personas en bienes y servicios promovidos por el sector cultural, así como en actividades de entretenimiento, diversión y ocio, dichas mediciones no tienen la amplitud y periodicidad requeridas. De acuerdo con lo anterior, el DANE, en su interés de extender sus fronteras temáticas, ha adoptado el programa misional “Estadísticas políticas y culturales” como respuesta a las necesidades de información estadística de calidad que demandan los diferentes usuarios sobre el complejo y amplio universo de lo cultural, en términos de confiabilidad, oportunidad, pertinencia y coherencia. Bajo el componente Cultura, Deporte y Recreación, el DANE lleva a cabo la Encuesta de Consumo Cultural, que tiene como objetivo hacer un mapa general de algunas prácticas culturales asociadas al uso y apropiación que hacen las personas de bienes, servicios y espacios ofertados y dispuestos por el sector cultural, así como de las horas asignadas al tiempo libre y el tipo de actividades desarrolladas en él. La Encuesta se suma a otra serie de estudios que ha realizado el DANE en el tema cultural: la Cuenta Satélite de Cultura, los módulos de televisión (en convenio con la Comisión Nacional de Televisión) y hábitos de lectura (trabajo con varias entidades, entre ellas el Ministerio de Cultura, Cámara Colombiana del Libro y Fundalectura), y las preguntas integradas en otras investigaciones que ofrecen nueva información sobre lo cultural como el Censo 2005, la Gran Encuesta Integrada de Hogares (GEIH) y la Encuesta de Ingresos y Gastos (EIG). En la siguiente metodología se exponen los principales componentes conceptuales, técnicos y operativos que constituyen la Encuesta de Consumo Cultural. En los primeros capítulos el lector encuentra los antecedentes de la investigación, los estudios que han precedido esta iniciativa en Colombia así como el diseño estadístico, el cual incluye el componente muestral, de indicadores e instrumentos. En los capítulos siguientes están los detalles del proceso de producción estadística como de análisis, discusión y difusión de los resultados, como la relación de la bibliografía que soporta la investigación. Geographic coverage --------------------------- Tiene un cubrimiento a nivel nacional de las cabeceras municipales y en 6 dominios regionales así: Atlántica, Oriental, Central, Pacifica, Bogotá D.C, y Orinoquía-Amazonía. Analysis unit --------------------------- UNIDAD DE OBSERVACIÓN Está constituida por las viviendas, los hogares y las personas. UNIDAD DE ANÁLISIS Cada una de las viviendas y hogares seleccionados al igual que las personas de 5 años y más que los conforman. UNIDAD DE MUESTREO La Medida de Tamaño (MT) o segmento, está conformada por un promedio de diez viviendas, las cuales se indagan todas, se incluyen todos los hogares de cada vivienda y cada persona de cada hogar Universe --------------------------- El universo para la Encuesta de Consumo Cultural está conformado por la población civil no institucional residente en las cabeceras municipales del territorio nacional. Kind of data --------------------------- Encuesta por muestreo (ssd) Sampling procedure --------------------------- DISEÑO MUESTRAL TIPO DE MUESTREO : Teniendo en cuenta los objetivos de la encuesta, el diseño muestral es probabilístico, estratificado, multietápico, de conglomerados, según los siguientes criterios: - Probabilístico: cada unidad de la población objetivo tiene una probabilidad de selección conocida y mayor a cero. Este tipo de muestra permite determinar a priori la precisión deseada en los resultados principales, y posteriormente calcular la precisión de los resultados obtenidos a partir de la información recolectada. - Estratificado: clasifica las unidades de muestreo en grupos homogéneos, en función de variables independientes, altamente asociadas con los indicadores de estudio y poco correlacionadas entre sí, con el objeto de maximizar la precisión de los resultados al disminuir la varianza de las estimaciones. LOS CRITERIOS DE ESTRATIFICACIÓN SON: A nivel macro, el país se clasificó en dos subuniversos: el primero corresponde a las 24 ciudades con sus áreas metropolitanas y el segundo, constituido por las cabeceras municipales. Las áreas geográficas se organizaron según sectores, secciones y manzanas con la información del número de viviendas a nivel de manzana y el estrato socioeconómico. El segundo estrato corresponde al resto de cabeceras, los municipios se estratifican de acuerdo con los siguientes criterios: - Geográficos, a nivel de regiones constituidas por departamentos. - Socioeconómicos, a nivel municipal, con los siguientes indicadores: Nivel de urbanización, en términos de la cantidad de población de las cabeceras municipales. Estructura urbano-rural de la población municipal (% de población en cabecera): Proporción de la población con necesidades básicas insatisfechas (NBI), la cual, a su vez, se clasificó en 4 intervalos: Intervalo A: [0 - 29,8%) Intervalo B: [29,8% - 42,7%) Intervalo C: [42,7% - 57,3%) Intervalo D: [57,3% - 100%] - Tamaño poblacional del estrato. Cada municipio con 7.000 o más habitantes en su población total, se constituyó en Unidad Primaria de Muestreo (UPM). Los de menor población se agruparon con un vecino para constituirse en UPM. Las UPM cuyo tamaño era similar al tamaño promedio de los estratos, se constituyeron en estratos de "certeza"; para efectos probabilísticos tuvieron probabilidad 1. Las demás UPM se agruparon en estratos de no certeza, aplicando las variables de estratificación en el orden de prioridad especificado antes. - Multietápico: corresponde a tres unidades de selección: * Unidades Primarias de Muestreo (UPM), subdividida en dos estratos de certeza y no certeza: Estrato de certeza o inclusión forzosa: las áreas metropolitanas y el resto de capitales departamentales, y aquellos municipios de tamaño intermedio cuya población es similar o mayor que el tamaño promedio de los estratos de su departamento. Estrato de no certeza o inclusión probabilística: corresponde a las UPM seleccionadas con probabilidad proporcional al tamaño (PPT) de los estratos conformados por dos o más UPM. La técnica de selección controlada utilizada permitió mediante un procedimiento probabilístico incrementar las probabilidades de selección de las combinaciones preferidas de UPM que podían ser seleccionadas en una región, adicionalmente a lo obtenible con un muestreo estratificado corriente. * Unidades Secundarias de Muestreo (USM). En las cabeceras municipales, las USM son grupos de manzanas contiguas del mismo municipio, que contienen un mínimo de 12 medidas de tamaño (MT), cada MT con un promedio de 10 viviendas. * Unidades Terciarias de Muestreo (UTM). La selección dentro de cada USM de una o más UTM, dependiendo de las requeridas, del tamaño y cantidad de USM preseleccionadas en cada municipio. Cada UTM es un segmento con un promedio de 10 viviendas contiguas (intervalo de viviendas contiguas [7 a 14]). - Conglomerados: Corresponde a la unidad final de muestreo, que es la medida de tamaño o segmento; es el área que contiene un promedio de diez viviendas, en la cual se investigan todas las viviendas, todos los hogares y todas las personas. La concentración de la muestra en conglomerados presenta grandes beneficios en el nivel operativo; lo cual reduce, en forma considerable, los tiempos, los costos, y facilita la supervisión. DEFINICIÓN DEL TAMAÑO DE LA MUESTRA: Los cálculos se hicieron con fórmulas correspondiente al tipo de diseño muestral. El Efecto de los Conglomerados en el Diseño (deff), determinado como una relación para cada dominio, entre la varianza real de este diseño de conglomerados y la que se obtendría con un diseño Aleatorio Simple de Elementos (MAS)51. Los parámetros básicos a estimar son proporciones del 10%, con un error estándar relativo no mayor del 5% Mode of data collection --------------------------- Entrevista personal asistida con DMC (dispositivo móvil de captura) Research instrument --------------------------- DISEÑO DEL CUESTIONARIO Esta encuesta contiene 8 capítulos enumerados de la A. a la H. que integran un total de 82 preguntas para personas de 12 años y más. Para el correcto desarrollo del formulario se cuenta con el manual de diligenciamiento y conceptos básicos en el cual se ilustra paso a paso cada uno de los capítulos. Cleaning operations --------------------------- TRANSMISIÓN Y PROCESAMIENTO DE LA INFORMACIÓN Luego de la recolección diaria por medio de los DMC, el apoyo de sistemas transmite al DANE Central por buzón FTP (File Transfer Protocol) la información recolectada, la cual es descargada y organizada para el posterior cargue a la base de datos. Con la información almacenada en la base de datos, se realiza un procesamiento de la información, transponiendo las tablas de almacenamiento vertical a las tablas de la investigación creadas por capítulos, para poder realizar consultas y generación de reportes de cobertura requeridos por los equipos temático y logístico. ENVÍO DE INFORMACIÓN Una vez se le hace entrega de una DMC, cada encuestador, es responsable de realizar una copia de seguridad en la correspondiente tarjeta SD del DMC, tan pronto haya terminado de diligenciar la encuesta en cada una de las viviendas asignadas. Finalizado el día de recolección de información, el supervisor debe recoger las DMC de los encuestadores a su cargo y realizar las siguientes actividades: - Realizar una copia de seguridad (tarjeta SD de Backup) tal y como la entrega el encuestador. - Realizar revisión de calidad de cada uno de los puntos realizados durante el día. - Proceder al cierre de los puntos cuya revisión de calidad ha sido satisfactoria. - Realizar una copia de seguridad una vez sea realizado el cierre de puntos. Seguido a este proceso, el supervisor deberá entregar al apoyo de sistemas la SD de backup para su posterior consolidación y envío. El apoyo de sistemas por medio del aplicativo SWIN desarrollado en Java, y utilizando la SD de backup, debe generar mediante un árbol jerárquico los archivos a remitir a DANE Central. Una vez ha generado el archivo debe realizar la transmisión a través del FTP (File Transfer Protocol), al cual se conectan mediante un usuario y contraseña previamente remitido, allí puede cargar o descargar la información que será remitida; a cada ciudad se le crea un buzón en el servidor FTP del DANE, en el cual se dispone la información de las encuestas completas que se recolectan diariamente. CONSOLIDACIÓN DE LA BASE DE DATOS Una vez estos archivos son recibidos, la información es almacenada en una estructura jerárquica de acuerdo a la procedencia, supervisor y encuestador. A continuación, se ejecuta el proceso de detección y separación de archivos duplicados, utilizando el aplicativo CloneSpy, con el fin de no cargar encuestas repetidas en la base de datos. Esta información permanece encriptada para garantizar la seguridad hasta la trasmisión. Por lo tanto, una vez se han seleccionado los archivos que se deben cargar en la base de datos, se realiza el proceso de carga, utilizando un aplicativo hecho a la medida en Java. Tan pronto se tiene en base de datos la totalidad de la información recolectada en campo, se hace una depuración final de la información, realizada por medio de programas de validación y consistencia, los cuales son creados y ejecutados por el equipo temático y de sistemas. Una vez la base esta depurada totalmente se consolida y se remite al grupo estadístico para continuar con los diferentes procesos. ANONIMIZACIÓN DE LA BASE DE DATOS Cuando se tiene la base depurada y consolidada de los hogares completos, se procede a realizar la anonimización de la base de datos. Para realizar este proceso, los equipos temáticos y de sistemas se reúnen para verificar cuáles son las variables que se deben ocultar durante el proceso de anonimización, las cuales permiten la confidencialidad de la información. NORMAS DE VALIDACIÓN Y CONSISTENCIA En primera instancia, el grupo temático define, con base en las características de la investigación, una serie de validaciones y consistencias entre preguntas y flujos en el cuestionario. Luego de este primer paso, se trabaja con los grupos estadístico y de sistemas en la aplicación de estos procedimientos en el formulario que está en el DMC. Entre los tres grupos se hacen las diferentes pruebas para corroborar que el aplicativo funcione de acuerdo con las normas establecidas. Este proceso se efectúa mediante pruebas directas en las que participan los equipos que hacen parte de la encuesta (logística, sistemas, muestras y temático). Se destaca que esta etapa se realiza antes de iniciar el operativo en campo, dado que el propósito es hallar y corregir posibles errores o dificultades así como estandarizar los conceptos y flujos que contiene el formulario de la encuesta. Response rate --------------------------- ERRORES DE MUESTREO El error estándar, que es el indicador de la precisión de los resultados estimados, refleja la variabilidad del azar, propia de las muestras probabilísticas. En un muestreo probabilístico la calidad de las estimaciones se mide través de la magnitud de la variabilidad del indicador de interés. Entre menor sea esta variabilidad, mayor será la precisión de la estimación del indicador. Esta variabilidad del estimador está dada en unidades generalmente de difícil manejo, por ello se utiliza una medida relativa con base en valores porcentuales, denominada coeficiente de variación o error relativo del estimador (cv). El diseño de la muestra se realiza para obtener estimaciones con una precisión establecida de acuerdo a los dominios de estudio, por lo cual, cualquier otro nivel de desagregación o parámetro estimado está sujeto a que su precisión no necesariamente sea buena y por tanto el dato no sea confiable. Sampling error estimates --------------------------- CÁLCULO DE PRECISIÓN DE LOS RESULTADOS Uno de los principales criterios para determinar la calidad de la estimación de un parámetro es la variabilidad que tienen los posibles resultados de dicha estimación. Esta variabilidad se puede medir con la varianza del estimador, la cual depende de muchos factores como el diseño de la muestra, el tamaño de la muestra, el parámetro que se desea estimar, los niveles de desagregación, entre otros. Otra medida de variabilidad relacionada con la varianza es la Desviación estándar de la distribución o error estándar que se calcula como la raíz cuadrada de la varianza. Un criterio más uniforme para determinar la precisión de un estimador es el coeficiente de variación, el cual se define como el cociente entre el error estándar y el estimador multiplicado por 100. Aunque la varianza, el error estándar y el coeficiente de variación, miden la magnitud de la variabilidad de la distribución de la muestra del estimador, es decir, lo que comúnmente se denomina el error de muestreo, el coeficiente de variación tiene la ventaja de dar esta medida en términos porcentuales, por lo cual es una medida común para estimaciones. En este aspecto, entre menor sea el error muestral menos incertidumbre se tiene de un resultado e indica que dicho resultado es más preciso. La encuesta de Consumo Cultural espera obtener coeficientes de variación estimados -cve- inferiores al 8% para los principales indicadores a nivel nacional e inferiores al 12% para los principales indicadores a nivel regional. Data appraisal --------------------------- DISEÑO DEL ANÁLISIS DE RESULTADOS ANÁLISIS ESTADÍSTICO En la ejecución de la encuesta y su procesamiento, se pueden generar sesgos de información que pueden producirse por el mal diligenciamiento de formularios, una ubicación geográfica inadecuada, errores en la consolidación de la información y su procesamiento, los cuales se conocen como errores no muestrales. Para corregir y controlar dichas falencias y mantener los niveles de calidad se hace una revisión constante por parte de cada uno de los componentes estadístico, temático, operativo y de sistemas. Dichos procesos resultan cuantificados y evaluados mediante indicadores de completes, cobertura y coeficiente de variación, que en consecuencia miden la calidad del resultado final. En particular, el error de muestreo se constituye en una herramienta para establecer parámetros de precisión en los resultados. Para su uso e interpretación se debe tener en cuenta que si la dispersión es alta, los parámetros estimados pierden utilidad, pues el valor verdadero del parámetro, en el universo, puede estar en un intervalo muy amplio lo cual no proporciona información útil. Por lo tanto, esta medida de variabilidad es un criterio muy importante para determinar la calidad de una estimación. ANÁLISIS DE CONTEXTO Este análisis consta en primera instancia del cálculo de las frecuencias simples de todas las variables medidas en la encuesta. A partir de los resultados de las frecuencias sobre cada variable, se determinan características sociodemográficas y se describe la población objeto de estudio. Se realizan comparaciones de proporciones entre el Censo General de Población (2005) y la muestra y se establece el desfase con datos externos, que puede ser explicado por el nivel de cobertura. Para las variables más importantes de la encuesta, se emplean las frecuencias para observar niveles de desagregación aceptables. Posteriormente, por ser el resultado de una metodología de muestreo probabilístico aplicado en la población de estudio, los cuadros de salida proveen conclusiones de la totalidad de los individuos que son la población objeto de estudio. Sin embargo, debe tenerse cuidado con las desagregaciones, ya que en este caso muy pocos individuos podrían proporcionar la información que se infiere a una población específica. En este aspecto, la validación con datos externos es prioritaria. El análisis de coherencia se desarrolla en el sentido de que las densidades demográficas principales del Censo (2005) coincidan en proporción y en densidad con los resultados de las variables demográficas consultadas por la encuesta. INDICADORES PARA EL CONTROL DE LA CALIDAD DE LOS PROCESOS DE INVESTIGACIÓN Para establecer la calidad de los datos que provee la encuesta, se obtienen cuatro indicadores a saber: el coeficiente de variación estimado, la tasa de cobertura, la tasa de encuestas completas y la tasa de oportunidad. En los cuadros de salida se establecen los coeficientes de variación para cada uno de los indicadores de la encuesta. Respecto a los otros tres indicadores, estos se calculan a partir de los datos recolectados en el operativo de campo como del cronograma de la operación estadística. Indicador de cobertura: permite medir la cantidad de hogares encuestados con respecto al total de hogares seleccionados según el diseño muestral. Para que este indicador sea aceptable, es esencial que haya logrado el mínimo nivel de referencia que, para el caso, es del 90% frente al total de hogares seleccionados en la muestra. Indicador de oportunidad: este indicador se refiere a la oportunidad sobre la entrega de resultados de la Encuesta de Consumo Cultural, y el resultado de la medida de este indicador se da en días.

摘要 --------------------------- 与消费文化相关联的文化和娱乐产品的消费实践,以及休闲时间的利用,已成为个体和不同社会群体生活结构中的新维度。这一点在国际上关于民族和国家社会资本及文化资本的指导方针的颁布,以及广泛的社会和文化少数群体的权利和自由的兴起中得到了证明。 在此基础上,国家政策的日益增多,这些政策有利于文化、体育和娱乐的发展,将一个重要的现实问题置于公共议程之上:即人类的社会和文化维度。 从这一视角出发,对文化、娱乐产品和空间的占有、拥有和使用已成为社会科学、公共机构和多边机构关注的对象,因为它们已成为追踪文化进程的具体实践。 在不同纬度和不同视角下,一些研究试图根据国家或人口特征、市民偏好或个人支出来探讨文化消费问题。在哥伦比亚,尽管存在关于文化部门提供的文化和娱乐产品、娱乐和休闲活动的提供和支出的衡量标准,但这些衡量标准缺乏所需的广度和周期性。 鉴于此,国家统计局在其扩大主题边界的过程中,采纳了“文化和政治统计”使命计划,以响应不同用户对高质量文化信息统计数据的需要,这些数据涵盖了从可靠性、时效性、相关性到一致性的复杂而广泛的文化领域。 在“文化和体育与休闲”组成部分下,国家统计局开展了文化消费调查,其目标是绘制与个人对文化部门提供和可供的物品、服务和空间的消费和使用相关的某些文化实践的一般图景,以及分配给休闲时间的小时数和在该时间中进行的活动类型。 该调查补充了国家统计局在文化主题上所进行的一系列研究:文化卫星账户、电视模块(与国家电视委员会合作)和阅读习惯(与多个实体合作,包括哥伦比亚文化部、哥伦比亚图书商会和Fundalectura),以及纳入其他研究中的综合问题,这些研究提供了关于文化的新信息,如2005年人口普查、综合家庭大调查(GEIH)和文化消费调查(EIG)。 以下方法论阐述了构成文化消费调查的主要概念、技术和操作组成部分。在最初章节中,读者可以找到研究的背景,包括在哥伦比亚先于这一倡议的研究,以及包括样本、指标和工具在内的统计设计。在随后的章节中,详细介绍了统计生产过程,包括结果的分析、讨论和传播,以及支持研究的文献。 地理覆盖范围 --------------------------- 全国范围内涵盖所有市级首府和以下6个区域领域:大西洋、东方、中央、太平洋、波哥大D.C.和奥里诺科亚-亚马逊。 分析单元 --------------------------- 观测单元 由住宅、家庭和个人组成。 分析单元 每个选定的住宅和家庭,以及5岁及以上的人员,都构成一个分析单元。 样本单元 样本量(MT)或段,由平均十个住宅组成,其中所有住宅都被调查,包括每个住宅中的每个家庭。 总体 --------------------------- 文化消费调查的总体由居住在国家级首府的民事非机构化居民组成。 数据类型 --------------------------- 抽样调查(ssd) 抽样程序 --------------------------- 抽样设计 类型: 考虑到调查的目标,抽样设计是概率性的、分层性的、多阶段的、群组性的,根据以下标准: - 概率性:目标群体中的每个单元都有已知的、大于零的选中概率。这种类型的样本允许预先确定主要结果所需的精度,并随后根据收集到的信息计算结果的精度。 - 分层:根据独立变量将样本单元分类为同质组,这些变量高度相关于研究指标,彼此之间相关性较低,目的是通过减少估计的方差来最大化结果的精度。 分层标准: 在宏观层面,国家被划分为两个子总体:第一个包括24个城市及其大都市区,第二个由首府组成。 地理区域根据区域、部分和街区组织,并使用街区层面的住宅数量和社会经济阶层的信息。 第二个阶层对应于其他首府,根据以下标准对市镇进行分层: - 地理的,在地区层面,由部门组成。 - 社会经济的,在市级层面,以下指标: 城市化水平,以首府人口数量衡量。 城乡结构(首府人口中在首府的比例):基本需求未满足(NBI)的人口比例,该比例被进一步分为4个区间: 区间A:[0 - 29,8%] 区间B:[29,8% - 42,7%] 区间C:[42,7% - 57,3%] 区间D:[57,3% - 100%] 阶层的人口规模。 总人口达到7,000人或以上的市镇构成了抽样单元(UPM)。人口较少的市镇与相邻的市镇组合以构成UPM。 与阶层规模相似的平均UPM构成了“确定性”阶层;从概率的角度来看,它们具有概率1。其他UPM被组合成“不确定性”阶层,应用上述优先级指定的分层变量。 - 多阶段:对应于三个选择单元: * 抽样单元(UPM),细分为确定性和不确定性阶层: 确定性阶层或强制包含:大都市区和其他部门首府,以及人口规模与部门平均规模相似或更大的中等规模市镇。 不确定性阶层或概率性包含:对应于按概率按比例大小(PPT)选定的UPM。所使用的控制选择技术通过概率性程序增加了在区域内可能被选中的UPM组合的选择概率,这超出了常规分层抽样的可能性。 * 抽样二级单元(USM)。 在首府,USM是同一市镇内相邻街区组成的组,每个组包含至少12个样本量(MT),每个MT平均包含10个住宅。 * 抽样三级单元(UTM)。 在每个USM内选择一个或多个UTM,具体取决于所需的数量、在市镇中预先选定的USM的数量和数量。 每个UTM是一个包含平均10个相邻住宅的段(相邻住宅区间[7到14])。 - 群组:对应于最终抽样单元,即样本量或段;是包含平均十个住宅的区域;在该区域内调查所有住宅、所有家庭和所有个人。在操作层面上,样本集中在群组中具有很大的好处;这大大减少了时间、成本,并简化了监督。 样本大小定义: 计算使用与抽样设计类型相对应的公式。每个域的群组设计效果(deff),作为每个域中此群组设计真实方差与获得随机简单元素设计(MAS)51的真实方差之间的比率来确定。要估计的基本参数是10%的比例,相对误差标准不大于5%。 数据收集方式 --------------------------- 个人访谈,辅助使用DMC(移动数据捕获设备) 研究工具 --------------------------- 问卷设计 本调查包含从A到H的8个章节,共计82个问题,适用于12岁及以上的人。为了正确开发表格,提供了一份填写手册和基本概念手册,其中逐步说明了每个章节。 数据清洗操作 --------------------------- 信息传输和处理 通过DMC每日收集后,系统支持通过FTP(文件传输协议)将收集到的信息传输到国家统计局中央,然后下载和组织以供后续加载到数据库。 在数据库中存储信息后,进行信息处理,将存储的表从垂直表转换为由章节创建的研究表,以便进行查询和生成所需的覆盖范围报告。 信息发送 一旦DMC被交付,每个调查员负责在完成每个分配住宅的问卷后立即在DMC相应的SD卡上执行备份。 完成信息收集日之后,监督员必须收集其负责的调查员的DMC,并执行以下活动: - 执行备份(备份DMC SD卡),就像调查员交付的那样。 - 对当天完成的每个点进行质量审查。 - 对质量审查满意的点进行关闭。 - 在点关闭后执行备份。 在此过程之后,监督员必须将备份SD卡交给系统支持以进行后续的合并和发送。 通过在Java中开发的SWIN应用程序,系统支持通过备份SD卡生成要发送到国家统计局中央的文件,并通过FTP(文件传输协议)进行传输,用户通过预先发送的用户名和密码连接到FTP,可以在其中上传或下载要发送的信息;每个城市在国家统计局的FTP服务器上都有一个邮箱,在该邮箱中可以存储每天收集的完整问卷信息。 数据库合并 一旦收到这些文件,根据来源、监督员和调查员将信息存储在分层结构中。接下来,执行检测和分离重复文件的过程,使用CloneSpy应用程序,以防止在数据库中加载重复的问卷。这些信息保持加密状态以确保安全。因此,一旦选择了要加载到数据库中的文件,就使用专门在Java中制作的应用程序进行加载过程。 一旦在数据库中获得了在实地收集的所有信息的总和,就通过验证和一致性程序进行最终的信息清理,这些程序由主题和系统团队创建和执行。一旦数据库完全清理,就将其发送到统计组以继续进行不同的过程。 数据库匿名化 当获得完整的家庭数据库并经过清理后,就进行数据库的匿名化。为了进行此过程,主题和系统团队会面,以确定在匿名化过程中应隐藏哪些变量,这些变量允许在匿名化过程中保持信息的机密性。 验证和一致性规范 首先,主题团队根据研究的特征定义了一系列验证和一致性,这些验证和一致性存在于问卷中的问题和流程之间。在此第一步之后,与统计和系统团队合作,将这些程序应用于DMC中的表格。在三个团队之间进行不同的测试,以证实该应用程序符合规定的标准。 此过程通过直接测试进行,其中涉及进行调查的团队(后勤、系统、样本和主题)。值得注意的是,这个阶段在启动实地操作之前进行,目的是找到和纠正可能的错误或困难,以及标准化问卷中包含的概念和流程。 响应率 --------------------------- 抽样误差 标准误差,这是估计结果精度的指标,反映了抽样概率性固有的随机变异性。 在概率抽样中,通过指标兴趣的变异性来衡量估计质量的程度。这种变异性越小,对指标的估计精度就越高。估计器的变异性由以下因素决定:抽样设计、样本大小、要估计的参数、分解水平等。与方差相关的另一个变异性度量是分布的方差或标准误差,它是方差的平方根。 确定估计器精度的更统一标准是变异系数,它被定义为误差标准与估计器的乘积乘以100。虽然方差、误差标准和变异系数都衡量估计器分布样本的变异性,即通常所说的抽样误差,但变异系数的优点是以百分比的形式给出这种度量,因此它是估计的常用度量。 在这方面,抽样误差越小,对结果的不确定性就越低,这表明该结果是更精确的。文化消费调查预计对主要指标的国家级系数变异估计值低于8%,对区域性主要指标低于12%。 数据评估 --------------------------- 结果分析设计 统计分析 在执行调查和其处理过程中,可能会产生信息偏差,这些偏差可能由问卷填写不当、地理位置不当、信息整合和处理中的错误产生,这些错误被称为非抽样误差。为了纠正和控制这些缺陷并保持质量水平,由统计、主题、操作和系统团队进行持续审查。这些过程通过完整率、覆盖率和变异系数等指标进行量化评估,从而衡量最终结果的质量。 特别是,抽样误差是确定结果精度参数的工具。在使用和解释时,必须注意,如果分散程度高,估计参数的价值可能失去效用,因为参数在总体中的真实值可能在一个很宽的区间内,这不会提供有用的信息。因此,这种变异性度量是确定估计质量的重要标准。 背景分析 此分析首先计算调查中测量的所有变量的简单频率。从每个变量的频率结果中,确定社会人口特征并描述研究目标人群。 进行与2005年人口普查和样本之间的比例比较,并确定与外部数据的偏差,这些偏差可以通过覆盖率解释。对于调查中最重要的变量,使用频率来观察可接受的分解水平。 随后,由于该方法是在研究目标人群中进行概率抽样,因此输出表格提供了关于目标人群中所有个体的结论。然而,必须小心处理分解,因为在某些情况下,非常少数的个体可能提供有关特定人群的信息。 在这方面,与外部数据的验证是优先的。一致性分析是在以下意义上进行的,即人口普查(2005)的主要人口密度与调查查询的人口统计变量密度在比例和密度上相匹配。
提供机构:
catalog.ihsn.org
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作