Para medir hechos observables simples usualmente se utiliza una pregunta (ej: edad)
Fenómenos complejos se miden en general con más de una pregunta, con el objetivo de dar mejor cuenta del atributo (i.e. minimizar error de medición)
en general las encuestas suelen incluir varias preguntas respecto de un mismo tema -> baterías de indicadores múltiples
cubren distintos aspectos de un mismo fenómeno complejo que no se agota en solo un indicador -> minimiza error de medición
en general las encuestas suelen incluir varias preguntas respecto de un mismo tema -> baterías de indicadores múltiples
cubren distintos aspectos de un mismo fenómeno complejo que no se agota en solo un indicador -> minimiza error de medición
problema: ¿cómo se analizan indicadores que están relacionados?¿cómo se muestran los resultados?
(likert plot,
sjPlot
)
2. Bivariado: tablas/gráficos de correlaciones
(corrplot
)
Se podría asumir un concepto o dimensión subyacente a la batería de items
Para facilitar el avance en el análisis (por ejemplo, relacionar ese concepto subyacente con otras variables), muchas veces se reduce la batería a algún tipo de índice (sumativo/promedio)
¿Podemos asegurar que los items están realmente midiendo lo mismo?
(Groves et al, 2010, en RATSWD WP 245, 2015)
En este marco se asume que el indicador es distinto del atributo, y que la medición del atributo o variable latente conlleva error
Cuando la el atributo se mide con más de una pregunta, se puede intentar estimar la variable latente mediante índices o técnicas de análisis factorial
antes de agrupar indicadores en un índice hay que evaluar si los indicadores se encuentran relacionados
varianza σ2=∑ni=1(xi−¯x)2n−1=∑ni=1(xi−¯x)(xi−¯x)n−1
covarianza cov(x,y)=∑ni=1(xi−¯x)(yi−¯y)n−1
r=∑ni=1(xi−¯x)(yi−¯y)(n−1)σxσy
medida estandarizada de asociación entre variables continuas
varía entre -1 y 1
mientras más cercana a |1|, mayor es la correlación entre dos variables
Matriz hipotética de indicadores que miden un mismo constructo
Matriz hipotética de indicadores que miden constructos independientes
Matriz hipotética de variables que miden dos constructos independientes
load("input/data/data-proc.Rdata")descr(data)
var | label | n | NA.prc | mean | sd | range | |
---|---|---|---|---|---|---|---|
2 | falthab | Razones pobreza falta de habilidad | 1228 | 1.365462 | 2.630293 | 1.254220 | 4 (1-5) |
3 | malasue | Razones pobreza mala suerte | 1227 | 1.445783 | 2.019560 | 1.140079 | 4 (1-5) |
1 | faltesf | Razones pobreza falta de esfuerzo | 1238 | 0.562249 | 3.155897 | 1.290758 | 4 (1-5) |
4 | sisecon | Razones pobreza sistema económico | 1218 | 2.168675 | 4.036946 | 1.095047 | 4 (1-5) |
5 | siseduc | Razones pobreza sistema educativo | 1227 | 1.445783 | 4.088835 | 1.088767 | 4 (1-5) |
plot_stackfrq(data)
```{r echo=TRUE, fig.height=5, fig.width=12}plot_stackfrq(data)```
```{r echo=TRUE, fig.height=5, fig.width=12}plot_stackfrq(data, sort.frq = "last.desc", geom.colors = "OrRd") +theme(legend.position="bottom")```
cormat <- cor(data)cormat
## falthab malasue faltesf sisecon siseduc## falthab 1 NA NA NA NA## malasue NA 1 NA NA NA## faltesf NA NA 1 NA NA## sisecon NA NA NA 1 NA## siseduc NA NA NA NA 1
Esta función no resulta ya que requiere que no existan casos perdidos
Entonces:
cormat <- cor(na.omit(data))cormat
## falthab malasue faltesf sisecon siseduc## falthab 1.000000000 0.31793357 0.36246039 -0.02787884 -0.005893529## malasue 0.317933565 1.00000000 0.16936872 0.02755708 0.013865045## faltesf 0.362460395 0.16936872 1.00000000 -0.06579454 -0.020114542## sisecon -0.027878843 0.02755708 -0.06579454 1.00000000 0.593625639## siseduc -0.005893529 0.01386504 -0.02011454 0.59362564 1.000000000
tab_corr(data)
Razones pobreza falta de habilidad | Razones pobreza mala suerte | Razones pobreza falta de esfuerzo | Razones pobreza sistema económico | Razones pobreza sistema educativo | |
---|---|---|---|---|---|
Razones pobreza falta de habilidad | 0.318*** | 0.362*** | -0.028 | -0.006 | |
Razones pobreza mala suerte | 0.318*** | 0.169*** | 0.028 | 0.014 | |
Razones pobreza falta de esfuerzo | 0.362*** | 0.169*** | -0.066* | -0.020 | |
Razones pobreza sistema económico | -0.028 | 0.028 | -0.066* | 0.594*** | |
Razones pobreza sistema educativo | -0.006 | 0.014 | -0.020 | 0.594*** | |
Computed correlation used pearson-method with listwise-deletion. |
corrplot::corrplot(cormat)
corrplot::corrplot(cormat, method = "color", addCoef.col = "#000390", type = "upper", tl.col = "black", col=colorRampPalette(c("white","#0068DC"))(8), bg = "white", na.label = "-")
índice de consistencia interna de una batería
varía entre 0 y 1; valores más cercanos a 1 indican mayor consistencia
en general valores sobre 0.6 se consideran aceptables
más información aquí)
funcion alpha de la librería psych
se genera un objeto (lo llamaremos alpha). Contiene bastante información, por ahora nos enfocaremos solo en el valor de alpha (raw_alpha
)
alpha <-psych::alpha(data)
## Some items ( falthab malasue faltesf ) were negatively correlated with the total scale and ## probably should be reversed. ## To do this, run the function again with the 'check.keys=TRUE' option
alpha$total$raw_alpha
## [1] 0.4363206
puntaje 0.43, por lo tanto bajo los valores aceptables de consistencia interna
esto ya se podía anticipar desde la matriz de correlaciones, que aparentemente mostraba dos dimensiones subyacentes a la batería
además, se genera un mensaje de advertencia sobre posibles items codificados a la inversa (dada la correlación entre items de dimensiones distintas)
construcción de índices basados en la información de la matriz de correlaciones
análisis factorial
vamos a generar 2 índices a partir de esta batería: uno para atribución interna (falthab,faltesf,malasue) y otro para externa (sisecon,siseduc)
tema valores perdidos:
Indice de atribución interna (Promedio)
data <- cbind(data, "interna_prom"=rowMeans(data %>% select(falthab,faltesf,malasue), na.rm=TRUE))data <- cbind(data, "externa_prom"=rowMeans(data %>% select(sisecon,siseduc), na.rm=TRUE))names(data)
## [1] "falthab" "malasue" "faltesf" "sisecon" "siseduc" ## [6] "interna_prom" "externa_prom"
baterías y dimensiones subyacentes
evaluación de consistencia interna (previo a construcción de índices)
índices y factores (prox sesión)
Keyboard shortcuts
↑, ←, Pg Up, k | Go to previous slide |
↓, →, Pg Dn, Space, j | Go to next slide |
Home | Go to first slide |
End | Go to last slide |
Number + Return | Go to specific slide |
b / m / f | Toggle blackout / mirrored / fullscreen mode |
c | Clone slideshow |
p | Toggle presenter mode |
t | Restart the presentation timer |
?, h | Toggle this help |
Esc | Back to slideshow |