Una variable cualitativa, ¿sigue cierta distribución de probabilidades?
Por ejemplo: se lanza un dado 1000 veces
set.seed(2021)
dado1200 = sample(1:6, 1200, replace = TRUE)
(tabla1200 = table(dado1200))
## dado1200
## 1 2 3 4 5 6
## 222 167 201 213 192 205
¿Está equilibrado el dado? Si lo está, las probabilidades de cada cara deben ser
probabilidades = c(1/6, 1/6, 1/6, 1/6, 1/6, 1/6)
Se usa un contraste chi cuadrado contrastar
H0: la distribución de frecuencias de los 1000 lanzamientos se
corresponde con probabilidades
comparando los valores observados y los esperados.
(mi_contraste = chisq.test(x = tabla1200, p = probabilidades))
##
## Chi-squared test for given probabilities
##
## data: tabla1200
## X-squared = 9.16, df = 5, p-value = 0.1028
No se rechaza H0.
Los valores esperados están en
mi_contraste$expected
## 1 2 3 4 5 6
## 200 200 200 200 200 200
y los observados son
tabla1200
## dado1200
## 1 2 3 4 5 6
## 222 167 201 213 192 205
Otras alternativa, si conoces la tabla de valores observados, por ejemplo,
## dado1200
## 1 2 3 4 5 6
## 200 218 203 177 197 205
es introducir los valores como un vector
chisq.test(x = c(200, 218, 203, 177, 197, 205), p = probabilidades)
##
## Chi-squared test for given probabilities
##
## data: c(200, 218, 203, 177, 197, 205)
## X-squared = 4.48, df = 5, p-value = 0.4826