+ - 0:00:00
Notes for current slide
Notes for next slide

Encuestas Sociales

Juan Carlos Castillo

Sociología FACSO - UChile

2do Sem 2022

encuestas-sociales.netlify.com


Sesión 10: Baterías de indicadores múltiples: Indices y análisis factorial

1 / 41

¿Por qué usar baterías?

2 / 41

3 / 41

Preguntas y error de medición

  • Para medir hechos observables simples usualmente se utiliza una pregunta (ej: edad)

  • Fenómenos complejos se miden en general con más de una pregunta, con el objetivo de dar mejor cuenta del atributo (i.e. minimizar error de medición)

4 / 41

Baterías de indicadores múltiples

  • en general las encuestas suelen incluir varias preguntas respecto de un mismo tema -> baterías de indicadores múltiples
5 / 41

Baterías de indicadores múltiples

  • en general las encuestas suelen incluir varias preguntas respecto de un mismo tema -> baterías de indicadores múltiples

  • cubren distintos aspectos de un mismo fenómeno complejo que no se agota en solo un indicador -> minimiza error de medición

5 / 41

Baterías de indicadores múltiples

  • en general las encuestas suelen incluir varias preguntas respecto de un mismo tema -> baterías de indicadores múltiples

  • cubren distintos aspectos de un mismo fenómeno complejo que no se agota en solo un indicador -> minimiza error de medición

  • problema: ¿cómo se analizan indicadores que están relacionados?¿cómo se muestran los resultados?

5 / 41

Análisis de indicadores en baterías

  1. Univariado: se sugiere presentar análisis descriptivos que contengan todos los indicadores para poder comparar frecuencias

(likert plot, sjPlot)

6 / 41

Análisis de indicadores en baterías

2. Bivariado: tablas/gráficos de correlaciones

(corrplot)

7 / 41

Análisis de indicadores en baterías

  • Se podría asumir un concepto o dimensión subyacente a la batería de items

  • Para facilitar el avance en el análisis (por ejemplo, relacionar ese concepto subyacente con otras variables), muchas veces se reduce la batería a algún tipo de índice (sumativo/promedio)

  • ¿Podemos asegurar que los items están realmente midiendo lo mismo?

8 / 41

¿Miden lo mismo?

9 / 41

Recordando: Error total de encuesta

(Groves et al, 2010, en RATSWD WP 245, 2015)

10 / 41

Preguntas y error de medición

  • En este marco se asume que el indicador es distinto del atributo, y que la medición del atributo o variable latente conlleva error

  • Cuando la el atributo se mide con más de una pregunta, se puede intentar estimar la variable latente mediante índices o técnicas de análisis factorial

11 / 41

Medición y error

  • antes de agrupar indicadores en un índice hay que evaluar si los indicadores se encuentran relacionados

    • -> si miden constructos similares
    • -> si la medición es confiable
12 / 41


¿Cómo estimar el nivel de relación entre indicadores que miden un mismo constructo?

13 / 41


¿Cómo estimar el nivel de relación entre indicadores que miden un mismo constructo?

Distintas maneras, pero todas se basan en la técnica de la correlación

13 / 41

Bases correlación

  • varianza σ2=i=1n(xix¯)2n1=i=1n(xix¯)(xix¯)n1

  • covarianza cov(x,y)=i=1n(xix¯)(yiy¯)n1

14 / 41

Correlación

r=i=1n(xix¯)(yiy¯)(n1)σxσy

  • medida estandarizada de asociación entre variables continuas

  • varía entre -1 y 1

  • mientras más cercana a |1|, mayor es la correlación entre dos variables

15 / 41




Correlación

16 / 41

Correlaciones, baterías y dimensiones subyacentes

17 / 41

Matriz de correlaciones (1)

Matriz hipotética de indicadores que miden un mismo constructo

18 / 41

Ej. Matriz de correlaciones (2)

Matriz hipotética de indicadores que miden constructos independientes

19 / 41

Ej. Matriz de correlaciones (3)

Matriz hipotética de variables que miden dos constructos independientes

20 / 41

Entonces:

1. analizar la matriz de correlaciones antes de generar cualquiér técnica de reducción de información (ej: crear índice)

2. evaluar la posibilidad de generación algún tipo de índice que resuma la información

21 / 41

Datos ejemplo

22 / 41
load("input/data/data-proc.Rdata")
descr(data)
var label n NA.prc mean sd range
2 falthab Razones pobreza falta de habilidad 1228 1.365462 2.630293 1.254220 4 (1-5)
3 malasue Razones pobreza mala suerte 1227 1.445783 2.019560 1.140079 4 (1-5)
1 faltesf Razones pobreza falta de esfuerzo 1238 0.562249 3.155897 1.290758 4 (1-5)
4 sisecon Razones pobreza sistema económico 1218 2.168675 4.036946 1.095047 4 (1-5)
5 siseduc Razones pobreza sistema educativo 1227 1.445783 4.088835 1.088767 4 (1-5)
23 / 41

Gráfico barras frecuencia porcentual

plot_stackfrq(data)

24 / 41

Ajustando dimensiones

```{r echo=TRUE, fig.height=5, fig.width=12}
plot_stackfrq(data)
```

25 / 41

Ajustes adicionales

```{r echo=TRUE, fig.height=5, fig.width=12}
plot_stackfrq(data, sort.frq = "last.desc", geom.colors = "OrRd") +
theme(legend.position="bottom")
```

26 / 41

Matriz de correlaciones

cormat <- cor(data)
cormat
## falthab malasue faltesf sisecon siseduc
## falthab 1 NA NA NA NA
## malasue NA 1 NA NA NA
## faltesf NA NA 1 NA NA
## sisecon NA NA NA 1 NA
## siseduc NA NA NA NA 1

Esta función no resulta ya que requiere que no existan casos perdidos

27 / 41

Matriz de correlaciones

Entonces:

cormat <- cor(na.omit(data))
cormat
## falthab malasue faltesf sisecon siseduc
## falthab 1.000000000 0.31793357 0.36246039 -0.02787884 -0.005893529
## malasue 0.317933565 1.00000000 0.16936872 0.02755708 0.013865045
## faltesf 0.362460395 0.16936872 1.00000000 -0.06579454 -0.020114542
## sisecon -0.027878843 0.02755708 -0.06579454 1.00000000 0.593625639
## siseduc -0.005893529 0.01386504 -0.02011454 0.59362564 1.000000000
28 / 41

Matriz de correlaciones (Formato publicable)

tab_corr(data)
  Razones pobreza falta de habilidad Razones pobreza mala suerte Razones pobreza falta de esfuerzo Razones pobreza sistema económico Razones pobreza sistema educativo
Razones pobreza falta de habilidad   0.318*** 0.362*** -0.028 -0.006
Razones pobreza mala suerte 0.318***   0.169*** 0.028 0.014
Razones pobreza falta de esfuerzo 0.362*** 0.169***   -0.066* -0.020
Razones pobreza sistema económico -0.028 0.028 -0.066*   0.594***
Razones pobreza sistema educativo -0.006 0.014 -0.020 0.594***  
Computed correlation used pearson-method with listwise-deletion.
29 / 41

Matriz de correlaciones - gráfico

corrplot::corrplot(cormat)

30 / 41

Matriz de correlaciones - gráfico ajustado

corrplot::corrplot(cormat,
method = "color",
addCoef.col = "#000390",
type = "upper",
tl.col = "black",
col=colorRampPalette(c("white","#0068DC"))(8),
bg = "white",
na.label = "-")

31 / 41

Hacia la construcción de un índice

32 / 41

Alpha de Cronbach

  • índice de consistencia interna de una batería

  • varía entre 0 y 1; valores más cercanos a 1 indican mayor consistencia

  • en general valores sobre 0.6 se consideran aceptables

  • más información aquí)

33 / 41

Alpha de Cronbach

  • funcion alpha de la librería psych

  • se genera un objeto (lo llamaremos alpha). Contiene bastante información, por ahora nos enfocaremos solo en el valor de alpha (raw_alpha)

alpha <-psych::alpha(data)
## Some items ( falthab malasue faltesf ) were negatively correlated with the total scale and
## probably should be reversed.
## To do this, run the function again with the 'check.keys=TRUE' option
alpha$total$raw_alpha
## [1] 0.4363206
34 / 41

Alpha de Cronbach

  • puntaje 0.43, por lo tanto bajo los valores aceptables de consistencia interna

  • esto ya se podía anticipar desde la matriz de correlaciones, que aparentemente mostraba dos dimensiones subyacentes a la batería

  • además, se genera un mensaje de advertencia sobre posibles items codificados a la inversa (dada la correlación entre items de dimensiones distintas)

35 / 41

Opciones

  • construcción de índices basados en la información de la matriz de correlaciones

  • análisis factorial

36 / 41

Construcción de índices

37 / 41

Índice promedio

  • vamos a generar 2 índices a partir de esta batería: uno para atribución interna (falthab,faltesf,malasue) y otro para externa (sisecon,siseduc)

  • tema valores perdidos:

    • para perder el mínimo de casos se recomienda realizar índice aún con casos que no hayan respondido algún item
    • ya que esto distorsionaría el puntaje si fuera sumado, se hace un índice promedio, especificando que se calcule aún con valores perdidos
38 / 41

Indice de atribución interna (Promedio)

data <- cbind(data, "interna_prom"=rowMeans(data %>% select(falthab,faltesf,malasue), na.rm=TRUE))
data <- cbind(data, "externa_prom"=rowMeans(data %>% select(sisecon,siseduc), na.rm=TRUE))
names(data)
## [1] "falthab" "malasue" "faltesf" "sisecon" "siseduc"
## [6] "interna_prom" "externa_prom"
39 / 41

Resumen

  • baterías y dimensiones subyacentes

  • evaluación de consistencia interna (previo a construcción de índices)

  • índices y factores (prox sesión)

40 / 41

Encuestas Sociales

Juan Carlos Castillo

Sociología FACSO - UChile

2do Sem 2022

encuestas-sociales.netlify.com


Sesión 10: Baterías de indicadores múltiples: Indices y análisis factorial

41 / 41

¿Por qué usar baterías?

2 / 41
Paused

Help

Keyboard shortcuts

, , Pg Up, k Go to previous slide
, , Pg Dn, Space, j Go to next slide
Home Go to first slide
End Go to last slide
Number + Return Go to specific slide
b / m / f Toggle blackout / mirrored / fullscreen mode
c Clone slideshow
p Toggle presenter mode
t Restart the presentation timer
?, h Toggle this help
Esc Back to slideshow