five

ENCUESTA DE HOGARES 2012 - Bolivia

收藏
fm.ine.gob.bo2019-07-10 更新2025-01-15 收录
下载链接:
http://fm.ine.gob.bo/index.php/catalog/51
下载链接
链接失效反馈
官方服务:
资源简介:
Resumen --------------------------- PROPÓSITO - OBJETIVO GENERAL La Encuesta de Hogares 2012 (EH 2012) es un instrumento del Instituto Nacional de Estadística (INE), que tiene como objetivo suministrar información sobre las condiciones de vida de los hogares, a partir de la recopilación de información de variables socioeconómicas y demográficas de la población boliviana, necesarias para la formulación, evaluación, seguimiento de políticas y diseño de programas de acción en el área social. OBJETIVOS ESPECÍFICOS La Encuesta de Hogares 2012 tiene los siguientes objetivos específicos: 1. Generar indicadores que permitan conocer la evolución de la pobreza, del bienestar y las condiciones de vida de los hogares. 2. Medir el alcance de los programas sociales en la mejora de las condiciones de vida de la población. 3. Servir de fuente de información a instituciones públicas y privadas que permitan posteriores investigaciones relacionadas a las variables en estudio. 4. Permitir la comparabilidad con investigaciones afines en relación a las variables investigadas. METODOLOGÍA La Encuesta de Hogares 2012 presenta un panorama completo sobre las condiciones de vida de la población boliviana. La unidad de análisis para esta encuesta fueron los hogares de Bolivia, con unidades muestrales como los Sectores Censales, Segmentos Censales, Viviendas, y la implementación de las Unidades Primarias de Muestreo (UPM) que concuerdan con los sectores censales o una agrupación de ellos. Es una encuesta con 8,736 viviendas seleccionadas. La metodología aplicada para la recolección de la información es la Entrevista Directa, conducida por personal debidamente capacitado que visitó las viviendas seleccionadas durante el periodo de recolección de información, utilizando una boleta multitemática que permite el estudio del bienestar de los hogares. ALCANCE TEMÁTICO a) Características Sociodemográficas b) Migración c) Salud d) Educación e) Condición de Actividad y Características Ocupacionales f) Ingresos del Hogar g) Gastos del Hogar h) Características de la Vivienda USUARIOS Y UTILIDADES Usuarios Productores: Unidad de Operativos de Campo del Área Social del INE. Utilidad: Proporcionar información sobre la calidad de vida de la población boliviana y contribuir al mejoramiento de la metodología de trabajo utilizada en la planificación y ejecución de encuestas a hogares. Usuarios Internos: Dirección de Cuentas Nacionales, Estadísticas e Indicadores Económicos y Sociales. Utilidad: Construcción de indicadores económicos y sociales, variables macroeconómicas, creación de sistemas de información estadística socioeconómica. Usuarios Externos: Ministerios, Unidad de Análisis y Políticas Económicas (UDAPE), organismos internacionales (Banco Interamericano de Desarrollo, Banco Mundial, CEPAL), investigadores, Organizaciones no Gubernamentales, medios de comunicación y población en general. Utilidad: Medición de indicadores de empleo, desempleo y subempleo, cálculo de indicadores de pobreza y desigualdad (Incidencia, Brecha y Severidad de la Pobreza), cálculo de indicadores de acceso y años de escolaridad, cálculo de indicadores demográficos. Elaboración y seguimiento de políticas de desarrollo económico y social. Geographic coverage --------------------------- A nivel nacional, urbana- rural y departamental. Analysis unit --------------------------- La investigación está dirigida al conjunto de hogares establecidos en viviendas particulares ocupadas de las ciudades capitales, resto urbano y área rural de Bolivia, en el periodo definido para la ejecución de la encuesta en la gestión 2012 Universo de estudio --------------------------- La encuesta cubre a todos los miembros del hogar que residen en viviendas particulares ocupadas. Kind of data --------------------------- Encuesta por muestreo (ssd) Sampling procedure --------------------------- Se estimo necesario replantear la Encuesta de Hogares en términos de un nuevo marco muestral (el Marco 2001) y un estudio profundo y extenso de estratificación, es así que a partir del 2011, la muestra de la EH incluye: a) una nueva estratificación del marco muestral b) la posibilidad de producir resultados a nivel departamento, excepto Beni y Pando, con resultados conjuntos. EL diseño muestral aplicado combina la estratificación estadística y la conglomeración de áreas geográficas, con el muestreo multietápico, por tanto, puede ser caracterizado como: · probabilístico, porque la probabilidad de selección es conocida y diferente de cero para cada elemento objeto de estudio, lo cual permite realizar inferencia estadística al total de la población objetivo; · por conglomerados, debido a que las unidades objeto de estudio (viviendas/hogares) se encuentran agrupadas en áreas conformadas, con fines de muestreo, en base a la información y cartografía del Censo de Población y Vivienda 2001, denominadas conglomerados; · estratificado, porque previo a la selección de conglomerados, estos son clasificados en estratos con el propósito de mejorar la precisión de los estimadores y permitir un mejor control de la distribución de la muestra; · multietápico, porque los elementos pertenecientes a la muestra se seleccionan en dos etapas en el área amanzanada; Etapa 1: Selección de conglomerados (UPM's); Etapa 2: selección de viviendas dentro la UPM elegida. En área dispersa la selección se realiza en tres etapas; Etapa 1: Selección de conglomerados UPM's; Etapa 2: selección de segmento(s) censales dentro la UPM elegida; Etapa 3: selección de viviendas dentro del segmento(s) elegido Las variables que han sido, y son, determinantes del cálculo de tamaños muestrales apropiados para cada estrato y dominio de estudio son: la tasa de desempleo y pobreza. Los datos de referencia para el cálculo del tamaño de muestra fueron en base a indicadores de pobreza y empleo obtenidos con la información de la Encuesta de Hogares 2007. El tamaño de muestra es de 8.736 viviendas, para mayor detalle sobre el diseño de la muestra y otros demás referentes a este, se encuesta dentro de los materiales de referencia externos el Documento del Diseño muestral. Para mayor referencia del diseño muestral, tamaño de muestra y distribución de la muestra, se encuentra a disposicion el documento de diseño muestral dentro de los materiales de referencia el Sampling deviation --------------------------- Durante el levantamiento de la información de la encuesta se produjeron incedencias, por lo que la muestra ejecutada fue de 8.415 viviendas encuestadas. Mode of data collection --------------------------- Face-to-face [f2f] Research instrument --------------------------- DISEÑO DE LOS CUESTIONARIOS: El diseño del cuestionario consiste en una boleta multitemática organizada en 8 secciones por lo que la boleta cubre las siguientes temáticas: Sección 1. Características Generales del Hogar y sus Miembros. Sección 2. Migración (para todos los miembros del hogar). Sección 3. Salud (menores de 5 años, mujeres de 13 a 50 años, todos los miembros del hogar). Sección 4. Educación (personas de 4 años y más). Sección 5. Empleo (solo para personas de 7 años y más de edad). Sección 6. Ingresos no Laborales del Hogar (solo para personas de 7 años y más de edad). Sección 7. Gastos. Sección 8. Vivienda. TIPO FUNCIONAL El cuestionario es semiestructurado ya que presenta preguntas precodificadas y preguntas abiertas. Específicamente, las características de las preguntas de la boleta son las siguientes: - Preguntas cerradas: Son las que tienen respuesta predeterminadas, en ellas se debe anotar sólo el código asignado a la categoría correspondiente. - Preguntas con respuestas que DEBEN SER LEÍDAS a los entrevistados/as: Se identifican por presentar las categorías de respuesta escritas en letra minúscula. - Preguntas con respuestas que NO DEBEN SER LEÍDAS a los entrevistados/as. Se identifican por presentar las categorías de respuesta escritas en letra mayúscula. - Preguntas abiertas: Son las que no presentan ninguna categoría preestablecida. Adicionalmente, en el cuestionario se presenta la siguiente información: - Flechas y Saltos: Son instrucciones gráficas (FLECHAS) o en texto (RECUADROS) que guían la entrevista a través de las diferentes preguntas y secciones de la boleta. - Cortes: Son grupos de preguntas o secciones completas que serán formuladas exclusivamente a ciertos grupos poblacionales distinguidos por edad, sexo u otra característica. Finalmente, el tipo de cuestionario son los hogares y su diseño es dirigido. Cleaning operations --------------------------- Las etapas secuenciales del procesamiento de los datos son: TRANSCRIPCIÓN DE DATOS: La información luego de ser validada en sus dos fases: 1) Revisión Regional por los Supervisores y Validadores en cada región y, 2) Validación Nacional por los Validadores en la oficina central, se procedió a la digitación de datos del cuestionario de la encuesta a un sistema de captura de datos diseñado en el software CSPro (Census and Survey Processing System), sistema de procesamiento para censos y encuestas. Este sistema permite el diseño de formularios, controles de rango y de flujo, al final d ela transcripción genera un listado de errores de inconsistencia por cuestionario de encuesta, mismo que es entregado para su revisión al equipo de Validación Nacional. Para el control de digitación correcta de datos de la encuesta, se procedió a la doble trascripción de información transcrita proporcionando un nivel importante de confianza, dado que ambas digitaciones fueron comparadas hasta que no existieran diferencias. Una vez identificada la jerarquía de los cuestionarios de la encuesta, se procede a construir los diccionarios de datos en la herramienta CSPro identificando cada sección y sus respectivas variables dentro del cuestionario. Como resultado del procesamiento de la información se cuenta con una Base de Datos de la Encuesta de Hogares 2012 que comprende un conjunto de archivos en ambiente SPSS los cuales se relacionan entre sí por la «llave de relación» denominado «FOLIO». VALIDACIÓN Y CODIFICACIÓN ASISTIDA: Una vez concluido el proceso de la transcripción se prepara la Base de Datos con las variables a codificar procedentes de las preguntas abiertas de las Secciones de Migración y de Empleo. El sistema para la codificación asistida fue programado en el lenguaje de programación Visual Basic 6. El administrador de base de datos utilizado es SQL Server 2005, el nombre de la base de datos es BDEH2012 que se encuentra en el servidor SVRCENTRALBD. El objetivo principal de la codificación asistida es la asignación de códigos a las descripciones literales del cuestionario con la utilización de Clasificadores, reduciendo tiempos y movimientos. La codificación asistida se caracteriza porque el operador de sistema verifica la descripción que ofrece el sistema y asigna su código respectivo. Posteriormente, se procedió a la revisión o supervisión de la asignación de códigos, dicho proceso fue ejecutado en archivos Excel y el trabajo fue desarrollado en bloques por códigos o descripciones cuyo objetivo fue uniformar los criterios, permitiendo la homogeneización de códigos de las diferentes variables. Se entiende por crítica de los datos a la acción de revisar y analizar las respuestas contenidas en los cuestionarios, para verificar la validez individual de las variables investigadas, la coherencia de los datos con otras variables y la integridad global de las mismas. Inicialmente una Pre Crítica es realizada en campo por encuestadores y supervisores en la que se revisan las relaciones existentes entre variables y el cumplimiento de flujos. En la EH - 2012, la codificación asistida, fue aplicada a las siguientes variables de respuesta abierta (descripciones literales): - Actividad y Ocupación anterior - Actividad y Ocupación principal - Actividad y Ocupación secundaria - Migración El sistema de Codificación utilizó las siguientes tablas externas de Actividad y Ocupación: • COB Clasificación de Ocupaciones de Bolivia (COB-99). • CAEB Clasificación de Actividades Económicas de Bolivia (CAEB2011). Response rate --------------------------- La no-respuesta ocurre cuando las viviendas u otras unidades de observación que se han seleccionado para la inclusión en una encuesta no reportan todos o algunos de los datos. Hay dos tipos de no-respuesta: i) ítem de no-respuesta y ii) la unidad de no-respuesta completa. El ítem de no-respuesta ocurre cuando una unidad encuestada tiene inexactitudes o se niega a proporcionar algunos ítems (preguntas) específicos de información. La unidad de no-respuesta completa se refiere a la pérdida al recolectar cualquier dato en la encuesta de una unidad muestral. Por ejemplo, no pueden obtenerse los datos de una vivienda elegible en la encuesta debido a la ausencia del informante, los caminos intransitables, la negativa para participar en la entrevista, o no disponibilidad del informante por otras razones. Este tipo de no - respuesta en la Encuesta de Hogares se llama Tipo A de no-entrevista. Históricamente, entre 4 y 5 por ciento de las unidades elegibles en un año dado de Tipo A de no-entrevistadas pero actualmente, ésta proporción de tipo A es considerada entre 6 y 7 por ciento. El porcentaje de la muestra que no se logro ejecutar de la Encuesta de Hogares es de 1,03% de la muestra total Para la Encuesta de Hogares 2012 la tasa de no respuesta es 3,7 Sampling error estimates --------------------------- EVALUACIÓN DE LA CALIDAD DE LOS DATOS: Los errores que afectan a toda encuesta pueden agruparse en dos grandes grupos: 1) Errores de muestreo que se originan por la obtención de resultados sobre las características de una población, a partir de la información recogida en una muestra de la misma. 2) Errores ajenos al muestreo que son comunes a toda investigación estadística, tanto si la información es recogida por muestreo como si se realiza un censo. Estos errores se presentan en cualquier fase del proceso estadístico: - Antes de la recolección de datos: por deficiencias del marco muestral e insuficiencias en las definiciones y/ conceptos y cuestionarios. - Durante la recolección de datos: por defectos en la labor de los entrevistadores y/o supervisores del trabajo de campo e incorrecta declaración por parte de los informantes. - Después de la recogida de los datos: errores en la depuración, crítica-codificación, grabación, tabulación e impresión de los resultados. CÁLCULO DE ERRORES MUESTRALES: Una de las medidas más importantes de precisión en las encuestas por muestreo es el error muestra. Es un indicador de variabilidad introducido al seleccionar una muestra en lugar de enumerar en toda la población bajo el supuesto que la información recolectada en la encuesta satisface con la propiedad de insesgada. Para cualquier encuesta dada, un error muestral de un estimador puede ser evaluado y utilizado para indicar la exactitud de los estimadores. Para diseños muestrales de encuestas de hogares que a menudo involucran estratificación, conglomeración y la probabilidad de selección desigual, las formas de estos estimadores son a menudo complejos y muy difíciles de evaluar. El cálculo de errores muestrales para los datos de encuestas de hogares requiere procedimientos que tengan en cuenta la complejidad del diseño muestral de los datos generados y el empleo apropiado de un software computacional. Para el cálculo de errores muestrales existen habitualmente ocho paquetes estadísticos: CENVAR, Epi Info, PC CARP, SAS, STATA, SUDAAN, SPSS y WesVarPC. La mayoría de estos paquetes utilizan las aproximaciones de serie de Taylor para determinar las estimaciones de los errores muestrales. En el marco muestral de la EH 2012, para el cálculo de errores muestrales el programa que se utilizó el módulo Muestras Complejas del Statistical Package for Social Science (SPSS) versión 13, el cual produce una tabla de salida o reporte con los indicadores: a) El valor estimado del parámetro (Valor estimado de la variable o indicador estadístico). b) Error estándar (Error muestral expresado en unidades de la variable que se está analizando). c) Coeficiente de variación (Error muestral expresado en términos relativos y mide los niveles de precisión de las estimaciones de los parámetros). d) Intervalo de confianza con un nivel de confianza del 95% (Intervalos con un nivel de confianza establecido (95%), incluyen el valor poblacional). e) El efecto del diseño (Deff) (Mide la eficiencia del diseño muestral multietápico, con respecto a un diseño muestral aleatorio simple). f) Número de observaciones. ESTIMACIÓN DE LA VARIANZA: Algunas encuestas por muestreo utilizan un mecanismo sistemático para la selección de las unidades primarias de muestreo (UPM), lo cual complica la estimación de la varianza. En efecto, no existe un estimador insesgado de la varianza bajo muestreo sistemático y no se puede medir la variabilidad muestral de los estimadores puntuales presentados en la sección anterior -ya que en efecto se realiza una sola selección aleatoria por estrato y se necesitan como mínimo dos selecciones aleatorias para estimar la varianza. En este caso, se dice que la varianza no es medible y no se puede calcular únicamente a partir de los datos de la muestra. Existen dos enfoques para tratar el problema: (1) utilizar modelos para la estimación de la varianza y (2) utilizar múltiples selecciones aleatorias. La decisión sobre que enfoque utilizar dependerá de los supuestos que asuma el usuario y de la capacidad computacional disponible. EL MÉTODO DE SERIE DE TAYLOR (LINEARIZACIÓN): La expansión de serie de Taylor ha sido utilizada en una variedad de situaciones en matemática y estadística. La puesta en práctica de la expansión de serie fue obtener una aproximación del valor de las funciones que se deben calcular, por ejemplo, la e^x exponencial o la función de logarítmica [log(x)]. La expansión de serie de Taylor para e^x supone tomar las derivadas de primer orden y de orden más alto de e^x con respecto a x; evaluando las derivadas para algún valor, generalmente cero; y construir una series de términos sobre la base de las derivadas.

数据集描述:摘要 --------------------------- 目的 - 总体目标 国家统计局(INE)的2012年家庭调查(EH 2012)是一项工具,旨在通过收集玻利维亚人口的社会经济和人口统计数据,为制定、评估、跟踪政策以及设计社会行动方案提供关于家庭生活状况的信息。 具体目标 2012年家庭调查具有以下具体目标: 1. 生成指标,以了解贫困、福利和家庭生活状况的变化。 2. 衡量社会项目在改善人民生活状况方面的范围。 3. 为公共和私营机构提供信息来源,以便进行与所研究变量相关的后续研究。 4. 允许与调查的变量相关的相似研究的可比性。 方法论 2012年家庭调查全面概述了玻利维亚人民的生活状况。分析单位为玻利维亚的家庭,抽样单元包括普查区、普查段、住房和抽样单元(UPM),这些单元与普查区或其组合相符。这是一项涉及8,736个住房的抽样调查。 信息收集所采用的方法是面对面访谈,由经过适当培训的人员进行,他们在信息收集期间访问了选定的住房,使用多主题问卷,允许研究家庭福利。 主题范围 a) 社会人口特征 b) 移民 c) 健康 d) 教育 e) 活动条件和职业特征 f) 家庭收入 g) 家庭支出 h) 住房特征 用户和用途 生产者用户:国家统计局社会领域现场操作单元。 用途:提供有关玻利维亚人民生活质量的信息,并有助于改进用于规划和执行家庭调查的工作方法。 内部用户:国民账户司、经济和社会统计指标司。 用途:构建经济和社会指标、宏观经济变量、创建社会经济统计信息系统。 外部用户:部委、分析和政策经济单元(UDAPE)、国际组织(美洲开发银行、世界银行、CEPAL)、研究人员、非政府组织、媒体和公众。 用途:衡量就业、失业和次失业指标,计算贫困和不平等指标(贫困发生率、贫困差距和贫困严重程度),计算获取教育和学龄指标,计算人口统计指标。制定和跟踪经济发展和社会政策。 地理覆盖范围 在国家层面,涵盖城市-农村和部门。 分析单元 研究针对在玻利维亚首都城市、其他城市和农村地区的私人住宅中居住的固定家庭。 研究范围 调查涵盖所有居住在私人住宅中的家庭成员。 数据类型 抽样调查(ssd) 抽样程序 估计有必要重新设计家庭调查,采用新的抽样框架(2001年框架)和深入的分层研究,因此,从2011年开始,家庭调查的样本包括: a) 新的抽样框架分层 b) 能够产生部门级结果,但除本尼和潘多外,结果合并。 抽样设计结合了统计分层和地理区域聚类,以及多阶段抽样,因此可以表征为: · 概率性的,因为每个研究对象的选中概率是已知的,且不为零,这允许对目标总体的全部进行统计分析; · 聚类的,因为研究对象(住房/家庭)根据抽样目的在构成区域内分组,这些区域基于2001年人口和住房普查的信息和制图,称为聚类; · 分层的,因为在选择聚类之前,这些聚类被分类为层,目的是提高估计量的精确度并允许更好地控制样本的分布; · 多阶段的,因为属于样本的元素在选定区域的两个阶段中进行选择;第一阶段:选择聚类(UPM);第二阶段:在选定的UPM中选择住房。 在分散区域,选择在三个阶段进行;第一阶段:选择UPM聚类;第二阶段:在选定的UPM中选择普查段;第三阶段:在选定的普查段中选择住房。 影响每个层和研究领域样本大小计算的决定性变量是失业和贫困率。 样本大小基于2007年家庭调查获得的贫困和就业指标进行计算。 样本大小为8,736个住房,有关样本设计和其他相关事宜的更多详细信息,请参阅外部参考资料中的样本设计文档。 抽样偏差 在收集调查信息期间发生了事件,因此实际执行的样本为8,415个已调查的住房。 数据收集方式 面对面 [f2f] 研究工具 问卷调查设计 问卷设计包括一个组织在8个部分中的多主题问卷,因此问卷涵盖了以下主题: 第一部分。家庭及其成员的一般特征。 第二部分。移民(针对家庭的所有成员)。 第三部分。健康(5岁以下儿童、13至50岁女性、家庭所有成员)。 第四部分。教育(4岁及以上的人)。 第五部分。就业(7岁及以上的人)。 第六部分。非劳动家庭收入(7岁及以上的人)。 第七部分。支出。 第八部分。住房。 功能类型 问卷是半结构化的,因为它包含预编码问题和开放式问题。具体来说,问卷中的问题的特征如下: - 封闭式问题:是具有预定答案的问题,在其中只需记录分配给相应类别的代码。 - 需要读给受访者听的答案:通过在字母小写中呈现答案类别来识别。 - 不需要读给受访者听的答案。通过在字母大写中呈现答案类别来识别。 - 开放式问题:是没有预先设定类别的开放性问题。 此外,在问卷中还提供了以下信息: - 标志和跳转:是引导访谈员通过问卷的不同问题和部分的图形(箭头)或文本(方框)说明。 - 切片:是仅针对根据年龄、性别或其他特征区分的特定人口群体构建的问题或部分。 最后,问卷的类型是针对家庭的,其设计是定向的。 数据清洗操作 数据处理的连续阶段如下: 数据转录 信息在两个阶段经过验证后:1)每个地区的监督员和验证员进行的区域审查,2)在中央办公室进行的全国验证,然后开始将问卷信息转录到在CSPro(人口和调查处理系统)软件中设计的捕获数据系统中。该系统允许设计表格、范围和流程控制,转录结束后生成一个包含问卷错误不一致列表的报告,该报告交付给验证团队进行审查。为了控制正确转录调查数据,进行了信息转录的双向转录,这提供了很高的置信度,因为两次转录都被比较,直到没有差异为止。一旦确定了问卷的层次结构,就在CSPro工具中构建数据字典,识别问卷中的每个部分及其相应的变量。信息处理的结果是拥有一个2012年家庭调查数据库,它包含一组在SPSS环境中相互关联的文件,这些文件通过“关系键”称为“FOLIO”相关联。 辅助编码和验证 转录过程完成后,准备数据库,其中包含来自移民和就业部分开放式问题的编码变量。 辅助编码系统是用Visual Basic 6编程语言编写的。所使用的数据库管理系统是SQL Server 2005,数据库的名称是BDEH2012,位于SVRCENTRALBD服务器上。 辅助编码的主要目标是使用分类器分配代码,以减少时间和移动。 辅助编码的特点是系统操作员检查系统提供的描述,并分配相应的代码。 随后,对代码分配进行了审查或监督,该过程在Excel文件中执行,工作在代码或描述块中开发,其目标是统一标准,允许不同变量的代码的统一。 数据批评是指审查和分析问卷中的答案,以验证所研究变量的单个有效性,验证数据与其他变量的连贯性以及数据的整体完整性。 最初,在实地由调查员和监督员进行了预批评,以审查变量之间的关系和流程的遵守情况。 在EH-2012中,辅助编码应用于以下开放式回答变量(描述性文字): - 前活动和工作 - 主要活动和工作 - 次要活动和工作 - 移民 辅助编码使用以下外部活动和工作表: • COB玻利维亚职业分类(COB-99)。 • CAEB玻利维亚经济活动分类(CAEB2011)。 响应率 不响应发生在选定的住房或其他观察单位未报告所有或某些数据时。有两种类型的不响应:i)项目不响应和ii)完全不响应。项目不响应发生在调查单位有错误或拒绝提供某些特定信息的项目时。完全不响应是指在与调查单位收集任何数据时丢失。例如,由于受访者缺席、道路不可通行、拒绝参加访谈或受访者因其他原因不可用,无法获得选定的调查单位的住房数据。这种不响应在家庭调查中称为A型不访谈。历史上,一年中约有4至5%的A型不访谈单位,但目前,这种A型不访谈的比例被认为在6至7%之间。 家庭调查2012的不响应率为1.03%。 抽样误差估计 数据质量评估:影响所有调查的误差可以归纳为两大类: 1)抽样误差,它源于从同一人口的样本中收集有关其特征的结果。 2)非抽样误差,它是整个统计调查的共同特征,无论是通过抽样还是进行人口普查收集信息。 这些误差在统计过程的任何阶段都会出现: - 在数据收集之前:由于抽样框架的缺陷、定义和/或概念的不足以及问卷的不足。 - 在数据收集期间:由于访谈员和/或监督员的现场工作缺陷以及受访者的错误声明。 - 在数据收集之后:由于清理、编码、记录、制表和打印结果中的错误。 抽样误差计算:抽样调查中精度最重要的衡量标准之一是抽样误差。它是由于选择样本而不是对整个总体进行计数而引入的变异性的指标。对于任何给定的调查,估计量的抽样误差可以评估和用于指示估计量的准确性。对于涉及分层、聚类和选择概率不等价的家用调查样本设计,这些估计量的形式通常是复杂且难以评估的。家用调查数据的抽样误差计算需要考虑数据抽样设计复杂性的程序和适当使用计算软件。 常用的八个统计软件包:CENVAR、Epi Info、PC CARP、SAS、STATA、SUDAAN、SPSS和WesVarPC。这些软件包中的大多数使用泰勒级数近似来确定抽样误差的估计。 EH 2012抽样框架中,用于计算抽样误差的程序是SPSS版本13的复杂样本模块,它生成一个包含以下指标的输出表或报告: a) 参数的估计值(变量的估计值或统计指标)。 b) 标准误差(以分析变量的单位表示的抽样误差)。 c) 变异系数(以相对术语表示的抽样误差,衡量参数估计的精确度水平)。 d) 95%置信区间(置信区间,置信水平设定为95%,包括总体值)。 e) 设计效应(Deff)(衡量多阶段抽样设计的效率,与简单随机抽样设计相比)。 f) 观察次数。 方差估计:一些抽样调查使用一种系统性的方法来选择抽样单元(UPM),这使方差估计复杂化。实际上,在系统抽样下不存在无偏的方差估计,并且无法测量前述部分中提出的估计量的样本变异。有两种方法来处理这个问题:(1)使用模型来估计方差;(2)使用多次随机抽样。选择哪种方法取决于用户所做的假设和可用的计算能力。 泰勒级数(线性化)方法:泰勒级数在数学和统计学中的各种情况下都已被使用。泰勒级数的实施是为了获得要计算的函数的值的近似,例如,指数函数e^x或对数函数[log(x)]。泰勒级数在e^x中的应用是取e^x相对于x的一阶和更高阶的导数;对某个值进行评估,通常是零;并在基于导数的术语上构建级数。
提供机构:
fm.ine.gob.bo
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作