Encuestas Sociales

Juan Carlos Castillo

Sociología FACSO - UChile

2do Sem 2022

encuestas-sociales.netlify.com

Sesión 10: Baterías de indicadores múltiples: Indices y análisis factorial

1 / 41

¿Por qué usar baterías?2 / 41

3 / 41

Preguntas y error de medición

Para medir hechos observables simples usualmente se utiliza una pregunta (ej: edad)
Fenómenos complejos se miden en general con más de una pregunta, con el objetivo de dar mejor cuenta del atributo (i.e. minimizar error de medición)

4 / 41

Baterías de indicadores múltiplesen general las encuestas suelen incluir varias preguntas respecto de un mismo tema -> baterías de indicadores múltiples
5 / 41

Baterías de indicadores múltiples

en general las encuestas suelen incluir varias preguntas respecto de un mismo tema -> baterías de indicadores múltiples
cubren distintos aspectos de un mismo fenómeno complejo que no se agota en solo un indicador -> minimiza error de medición

5 / 41

Baterías de indicadores múltiples

en general las encuestas suelen incluir varias preguntas respecto de un mismo tema -> baterías de indicadores múltiples
cubren distintos aspectos de un mismo fenómeno complejo que no se agota en solo un indicador -> minimiza error de medición
problema: ¿cómo se analizan indicadores que están relacionados?¿cómo se muestran los resultados?

5 / 41

Análisis de indicadores en baterías

Univariado: se sugiere presentar análisis descriptivos que contengan todos los indicadores para poder comparar frecuencias

(likert plot, sjPlot)

6 / 41

Análisis de indicadores en baterías

2. Bivariado: tablas/gráficos de correlaciones

(corrplot)

7 / 41

Análisis de indicadores en baterías

Se podría asumir un concepto o dimensión subyacente a la batería de items
Para facilitar el avance en el análisis (por ejemplo, relacionar ese concepto subyacente con otras variables), muchas veces se reduce la batería a algún tipo de índice (sumativo/promedio)
¿Podemos asegurar que los items están realmente midiendo lo mismo?

8 / 41

¿Miden lo mismo?

9 / 41

Recordando: Error total de encuesta

(Groves et al, 2010, en RATSWD WP 245, 2015)

10 / 41

Preguntas y error de medición

En este marco se asume que el indicador es distinto del atributo, y que la medición del atributo o variable latente conlleva error
Cuando la el atributo se mide con más de una pregunta, se puede intentar estimar la variable latente mediante índices o técnicas de análisis factorial

11 / 41

Medición y error

antes de agrupar indicadores en un índice hay que evaluar si los indicadores se encuentran relacionados
- -> si miden constructos similares
- -> si la medición es confiable

12 / 41

¿Cómo estimar el nivel de relación entre indicadores que miden un mismo constructo?

13 / 41

¿Cómo estimar el nivel de relación entre indicadores que miden un mismo constructo?

Distintas maneras, pero todas se basan en la técnica de la correlación

13 / 41

Bases correlación

varianza $σ^{2} = \frac{\sum_{i = 1}^{n} (x_{i} - \bar{x})^{2}}{n - 1} = \frac{\sum_{i = 1}^{n} (x_{i} - \bar{x}) (x_{i} - \bar{x})}{n - 1}$
covarianza $c o v (x, y) = \frac{\sum_{i = 1}^{n} (x_{i} - \bar{x}) (y_{i} - \bar{y})}{n - 1}$

14 / 41

Correlación

$r = \frac{\sum_{i = 1}^{n} (x_{i} - \bar{x}) (y_{i} - \bar{y})}{(n - 1) σ_{x} σ_{y}}$

medida estandarizada de asociación entre variables continuas
varía entre -1 y 1
mientras más cercana a |1|, mayor es la correlación entre dos variables

15 / 41

Correlación

16 / 41

Correlaciones, baterías y dimensiones subyacentes17 / 41

Matriz de correlaciones (1)

Matriz hipotética de indicadores que miden un mismo constructo

18 / 41

Ej. Matriz de correlaciones (2)

Matriz hipotética de indicadores que miden constructos independientes

19 / 41

Ej. Matriz de correlaciones (3)

Matriz hipotética de variables que miden dos constructos independientes

20 / 41

Entonces:1. analizar la matriz de correlaciones antes de generar cualquiér técnica de reducción de información (ej: crear índice)2. evaluar la posibilidad de generación algún tipo de índice que resuma la información21 / 41

Datos ejemplo

batería atribuciones de pobreza, encuesta "Desigualdad, Justicia y Participación Política" - FONDECYT Iniciación 11121203 (2013-2015) Social justice and citizenship participation

22 / 41

load("input/data/data-proc.Rdata")
descr(data)

	var	label	n	NA.prc	mean	sd	range
2	falthab	Razones pobreza falta de habilidad	1228	1.365462	2.630293	1.254220	4 (1-5)
3	malasue	Razones pobreza mala suerte	1227	1.445783	2.019560	1.140079	4 (1-5)
1	faltesf	Razones pobreza falta de esfuerzo	1238	0.562249	3.155897	1.290758	4 (1-5)
4	sisecon	Razones pobreza sistema económico	1218	2.168675	4.036946	1.095047	4 (1-5)
5	siseduc	Razones pobreza sistema educativo	1227	1.445783	4.088835	1.088767	4 (1-5)

23 / 41

Gráfico barras frecuencia porcentual

plot_stackfrq(data)

24 / 41

Ajustando dimensiones

```{r echo=TRUE, fig.height=5, fig.width=12}
plot_stackfrq(data)
```

25 / 41

Ajustes adicionales

```{r echo=TRUE, fig.height=5, fig.width=12}
plot_stackfrq(data, sort.frq = "last.desc", geom.colors = "OrRd") +
theme(legend.position="bottom")
```

26 / 41

Matriz de correlaciones

cormat <- cor(data)
cormat

##         falthab malasue faltesf sisecon siseduc
## falthab       1      NA      NA      NA      NA
## malasue      NA       1      NA      NA      NA
## faltesf      NA      NA       1      NA      NA
## sisecon      NA      NA      NA       1      NA
## siseduc      NA      NA      NA      NA       1

Esta función no resulta ya que requiere que no existan casos perdidos

27 / 41

Matriz de correlaciones

Entonces:

cormat <- cor(na.omit(data))
cormat

##              falthab    malasue     faltesf     sisecon      siseduc
## falthab  1.000000000 0.31793357  0.36246039 -0.02787884 -0.005893529
## malasue  0.317933565 1.00000000  0.16936872  0.02755708  0.013865045
## faltesf  0.362460395 0.16936872  1.00000000 -0.06579454 -0.020114542
## sisecon -0.027878843 0.02755708 -0.06579454  1.00000000  0.593625639
## siseduc -0.005893529 0.01386504 -0.02011454  0.59362564  1.000000000

28 / 41

Matriz de correlaciones (Formato publicable)tab_corr(data)



 
Razones pobreza falta de habilidad
Razones pobreza mala suerte
Razones pobreza falta de esfuerzo
Razones pobreza sistema económico
Razones pobreza sistema educativo

Razones pobreza falta de habilidad
 
0.318***
0.362***
-0.028
-0.006

Razones pobreza mala suerte
0.318***
 
0.169***
0.028
0.014

Razones pobreza falta de esfuerzo
0.362***
0.169***
 
-0.066*
-0.020

Razones pobreza sistema económico
-0.028
0.028
-0.066*
 
0.594***

Razones pobreza sistema educativo
-0.006
0.014
-0.020
0.594***
 

Computed correlation used pearson-method with listwise-deletion.

29 / 41

	Razones pobreza falta de habilidad	Razones pobreza mala suerte	Razones pobreza falta de esfuerzo	Razones pobreza sistema económico	Razones pobreza sistema educativo
Razones pobreza falta de habilidad		0.318***	0.362***	-0.028	-0.006
Razones pobreza mala suerte	0.318***		0.169***	0.028	0.014
Razones pobreza falta de esfuerzo	0.362***	0.169***		-0.066*	-0.020
Razones pobreza sistema económico	-0.028	0.028	-0.066*		0.594***
Razones pobreza sistema educativo	-0.006	0.014	-0.020	0.594***
Computed correlation used pearson-method with listwise-deletion.

Matriz de correlaciones - gráfico

corrplot::corrplot(cormat)

30 / 41

Matriz de correlaciones - gráfico ajustado

  corrplot::corrplot(cormat,
    method = "color",
    addCoef.col = "#000390",
    type = "upper",
    tl.col = "black",
    col=colorRampPalette(c("white","#0068DC"))(8),
    bg = "white",
    na.label = "-")

31 / 41

Hacia la construcción de un índice32 / 41

Alpha de Cronbach

índice de consistencia interna de una batería
varía entre 0 y 1; valores más cercanos a 1 indican mayor consistencia
en general valores sobre 0.6 se consideran aceptables
más información aquí)

33 / 41

Alpha de Cronbach

funcion alpha de la librería psych
se genera un objeto (lo llamaremos alpha). Contiene bastante información, por ahora nos enfocaremos solo en el valor de alpha (raw_alpha)

alpha <-psych::alpha(data)

## Some items ( falthab malasue faltesf ) were negatively correlated with the total scale and 
## probably should be reversed.  
## To do this, run the function again with the 'check.keys=TRUE' option

alpha$total$raw_alpha

## [1] 0.4363206

34 / 41

Alpha de Cronbach

puntaje 0.43, por lo tanto bajo los valores aceptables de consistencia interna
esto ya se podía anticipar desde la matriz de correlaciones, que aparentemente mostraba dos dimensiones subyacentes a la batería
además, se genera un mensaje de advertencia sobre posibles items codificados a la inversa (dada la correlación entre items de dimensiones distintas)

35 / 41

Opciones

construcción de índices basados en la información de la matriz de correlaciones
análisis factorial

36 / 41

Construcción de índices37 / 41

Índice promedio

vamos a generar 2 índices a partir de esta batería: uno para atribución interna (falthab,faltesf,malasue) y otro para externa (sisecon,siseduc)
tema valores perdidos:
- para perder el mínimo de casos se recomienda realizar índice aún con casos que no hayan respondido algún item
- ya que esto distorsionaría el puntaje si fuera sumado, se hace un índice promedio, especificando que se calcule aún con valores perdidos

38 / 41

Indice de atribución interna (Promedio)

data <- cbind(data, "interna_prom"=rowMeans(data %>% select(falthab,faltesf,malasue), na.rm=TRUE))
data <- cbind(data, "externa_prom"=rowMeans(data %>% select(sisecon,siseduc), na.rm=TRUE))
names(data)

## [1] "falthab"      "malasue"      "faltesf"      "sisecon"      "siseduc"     
## [6] "interna_prom" "externa_prom"

39 / 41

Resumen

baterías y dimensiones subyacentes
evaluación de consistencia interna (previo a construcción de índices)
índices y factores (prox sesión)

40 / 41

Encuestas Sociales

Juan Carlos Castillo

Sociología FACSO - UChile

2do Sem 2022

encuestas-sociales.netlify.com

Sesión 10: Baterías de indicadores múltiples: Indices y análisis factorial

41 / 41

Help

Keyboard shortcuts

↑, ←, Pg Up, k

Go to previous slide

↓, →, Pg Dn, Space, j

Go to next slide

Home

Go to first slide

End

Go to last slide

Number + Return

Go to specific slide

b / m / f

Toggle blackout / mirrored / fullscreen mode

Clone slideshow

Toggle presenter mode

Restart the presentation timer

?, h

Toggle this help