Recently Published
Comparación de Métodos para Estimar Estadísticas Poblacionales con Diseño Muestral Complejo en R
Este documento presenta una comparación entre dos enfoques para la estimación de estadísticas poblacionales a partir de encuestas con diseño muestral complejo, utilizando como caso de estudio la Encuesta CASEN. A través del lenguaje R y el paquete survey, se abordan conceptos clave como estratificación, unidades de muestreo y factores de expansión. Además, se replican ejercicios con y sin el módulo especializado, mostrando sus diferencias en precisión y validez inferencial. El documento incluye visualizaciones, intervalos de confianza, pruebas estadísticas y recomendaciones metodológicas para un análisis riguroso y reproducible.
Explorando la Autocorrelación espacial
La autocorrelación espacial, mide el grado de dependencia entre observaciones geográficas cercanas. En otras palabras, examina si: "los valores de una variable en una ubicación están correlacionados con los valores de la misma variable en ubicaciones cercanas.
El concepto de autocorrelación esta estrechamente relacionado con la primera ley de Tobler, (Waldo Tobler, 1970), que establece que "todo está relacionado con todo lo demás, pero las cosas más cercanas están más relacionadas que las distantes". Esta ley de la geografía (si, la geografía tiene una ley), subraya la importancia de la proximidad en la relación entre observaciones espaciales.
En el documento, muestro los pasos a seguir, librerías y códigos en R, para determinar el comportamiento espacial de una variable.
Análisis de Cluster
El análisis de clúster es una técnica fundamental en el ámbito de la estadística multivariante y el aprendizaje automático, que permite clasificar (segmentar) entidades basándose en una variable a elección (atributos) o en la cercanía de puntos (densidad espacial). Su objetivo es minimizar la variabilidad dentro de cada grupo (homogeneidad), y maximizarla entre grupos.
En el siguiente documento, muestro como hacerlo en r, las librerias usadas, y algunos comentarios para su interpretación.
Estadística Poblacional. Uso Factor de Expansión
En este documento, mostramos cómo trabajar con factores de expansión en R utilizando paquetes como tidyverse, sf y ggplot2.
Este enfoque nos permite ajustar los datos muestrales y hacerlos representativos de la población total.
¿Qué hicimos?
Porcentaje de pobreza: Ajustamos los datos según los factores de expansión para calcular el porcentaje de pobreza en diferentes regiones.
Ingreso autónomo: Estimamos el ingreso promedio en cada región de Chile utilizando los factores de expansión para asegurar resultados precisos.
Visualización gráfica y cartográfica: Generamos gráficos y mapas para ilustrar los resultados, integrando datos socioeconómicos con la geometría de las regiones de Chile.