En esta práctica vamos a trabajar en el contraste de hipótesis sobre parámetros de una población: la media, la varianza y la proporción. Los ejercicios son una selección del material del tutorial 07.
Usaremos fundamentalmente estas plantillas actualizadas 29/11/2017 para R
. Para interpretar correctamente las salidas de las plantillas es muy importante tener presenta que utilizan los siguientes estadísticos:
Para la media muestral, muestras grandes \[\frac{\bar X -\mu_0}{s/\sqrt{n}} \sim N(0,1)\] es decir, la media muestral está estandarizada. Recuerda que eso es equivalente a \[\bar X \sim N(\mu_0, s/\sqrt{n})\]
Para la media muestral, muestras pequeñas \[\frac{\bar X -\mu_0}{s/\sqrt{n}}\sim t_{n-1}\]
Para la varianza \[(n - 1) \frac{s^2}{\sigma_0^2}\sim \chi^2_{n-1}\]
La media, muestras grandes
La inspección de consumo está examinando un envío de latas de conserva, de las que el fabricante afirma que el peso medio son \(1000\) gramos. Al examinar una muestra aleatoria de \(100\) latas, un inspector obtuvo un peso medio muestral de \(998.5\) gramos, con una cuasivarianza muestral de \(s^2 = 36.1\) (gramos\(^2\)). Con esos datos, el inspector se pregunta si el peso medio de las latas es en realidad menor que el enunciado por el fabricante.
Este fichero contiene una muestra con cierto número de observaciones de una variable \(X\) de tipo normal. Usa esa muestra para contrastar la hipótesis nula: \[ H_0 = \{\mu \leq 27\}. \] con un nivel de significación \(\alpha = 0.05\)
Calcula el p-valor del contraste.
Imagina que, en el contraste anterior, decides rechazar \(H_0\) si la media de la muestra que obtienes es estrictamente mayor que \(27.2\). ¿cuál sería el nivel de significación asociado con esa regla de decisión?
La media, muestras pequeñas. En los dos casos debes escribir la hipótesis nula, la hipótesis alternativa, calcular el estadístico, el p-valor y la región de rechazo al \(95\%\).
Varianza, población normal
contrastar la hipótesis nula \[H_0:\,\sigma\leq \sigma_0,\] donde \(\sigma_0=0.2\), \(n = 15\), \(s = 0.24\).
Supongamos que \(X\) es una variable normal y que \(\sigma\) es la desviación típica de \(X\). Queremos contrastar la hipótesis alternativa \[H_1:\,\sigma \neq 3.7\] Para ello hemos tomado una muestra aleatoria que encontrarás en este fichero
Soluciones:
1.1 La región de rechazo la constituye el 5% de las varianzas muestrales posibles más grandes, porque son las que más contradicen la hipótesis nula (\(H_0:\,\sigma\leq 0.2\)), es decir, como \[(15 - 1) \frac{s^2}{0.2^2}\sim \chi^2_{15-1} \] si calculamos \(\chi^2_{15-1, 0.05}\)
(valcrit1 = qchisq(0.05, df = 14, lower.tail = FALSE))
## [1] 23.68479
la región de rechazo la forman las varianzas muestrales \(s^2\) que son mayores que
valcrit1 * (0.2)^2/(15-1)
## [1] 0.06767083
La varianza muestral que hemos observado es
(0.24)^2
## [1] 0.0576
que se encuentra dentro de la región de no rechazo.
1.2. El p-valor es la probabilidad de obtener un valor más extremo (en relación con \(H_0\)) que el obtenido (\(s=0.24\)). En este caso,
pchisq((15-1)*(0.24)^2/(0.2)^1, df = 15-1, lower.tail = FALSE)
## [1] 0.9952706
De nuevo, no la conclusi'on es que no hay evidencia muestral para rechazar \(H_0\)
2.1 Ahora se resuelve el ejercicio con la plantilla correspondiente () Aparecen los fragmentos de código que hay que completar
tabla = read.table(file = "Tut07-Ejercicio-ContrasteVarianza.csv", sep= " ", dec=".", header = FALSE)
muestra = tabla$V1
# Valor a contrastar de la DESVIACION TIPICA que aparece en la hipotesis nula.
# CUIDADO: NO INTRODUZCAS LA VARIANZA POR ERROR
(sigma0= 3.7)
# ¿Que tipo de contraste estamos haciendo?
# Escribe 1 si la HIP. ALTERNATIVA es sigma > sigma0, 2 si es sigma < sigma0, 3 si es sigma distinto de sigma0
TipoContraste = 3
# Nivel de significacion
(nSig= 0.5)
la plantilla devuelve (había un error antes del 26/11/2017)
"La region de rechazo la forman los Valores del Estadistico que no pertenecen al intervalo ( 95.0700889723451 , 156.714103829672 )"
Si te extraña esta región de no rechazo, date cuenta de que cuando \(s^2=\sigma_0^2\) el valor del estadístico es 124, que está centrado en dicha región. Como el estadístico es
\[(125 - 1) \frac{s^2}{3.7^2}\]
la región de rechazo la forman los valores de la varianza muestral que están fuera del intervalo
(3.7)^2*c( 95.0700889723451 , 156.714103829672 )/(125-1)
## [1] 10.49604 17.30174
En este caso la varianza muestral observada es 16.85, por lo que no hay motivos para rechazar \(H_0\).
2.2 El p-valor lo da la platilla directamente y vale
"El p-Valor es 0.08265"
La porporción
Hacer el ejercicio 3 del capítulo de contraste de hipótesis del libro de Julián de la Horra Navarro (mira en el aula virtual, en el bloque contenidos, en la columna izquierda).
Se trabaja con una muestra tomada en una colonia de gatos.
Bwt
) medio y mediano coinciden (independientemente de si son hembras o machos). Es decir, que el peso de la mitad de los individuos está por encima de la media y el de la otra mitad está por debajo. A la vista de la muestra, ¿estás de acuerdo con esa hipótesis?Para practicar más, puedes hacer: