Introducción.

En esta práctica vamos a trabajar en el contraste de hipótesis sobre parámetros de una población: la media, la varianza y la proporción. Los ejercicios son una selección del material del tutorial 07.

Usaremos fundamentalmente estas plantillas actualizadas 29/11/2017 para R. Para interpretar correctamente las salidas de las plantillas es muy importante tener presenta que utilizan los siguientes estadísticos:

Ejercicio A

La media, muestras grandes

  1. La inspección de consumo está examinando un envío de latas de conserva, de las que el fabricante afirma que el peso medio son \(1000\) gramos. Al examinar una muestra aleatoria de \(100\) latas, un inspector obtuvo un peso medio muestral de \(998.5\) gramos, con una cuasivarianza muestral de \(s^2 = 36.1\) (gramos\(^2\)). Con esos datos, el inspector se pregunta si el peso medio de las latas es en realidad menor que el enunciado por el fabricante.

    1. Al nivel de confianza \(95\)%, ¿qué responderías a la pregunta del inspector? Queremos, además, obtener el p-valor de este contraste.
    2. Utiliza ahora la plantilla para resolver de nuevo el ejercicio anterior (ahora el estadístico es la media muestral estandarizada).
    3. En este ejemplo de las latas, las dos colas de la distribución normal se pueden identificar, respectivamente, con uno de los problemas que preocupan al fabricante: la sanción de la inspección o el exceso de producto envasado. ¿Qué cola corresponde a cada uno de esos dos problemas?
  2. Este fichero contiene una muestra con cierto número de observaciones de una variable \(X\) de tipo normal. Usa esa muestra para contrastar la hipótesis nula: \[ H_0 = \{\mu \leq 27\}. \] con un nivel de significación \(\alpha = 0.05\)

    1. Determina la región de rechazo en las unidades del problema.
    2. Calcula el p-valor del contraste.

    3. Imagina que, en el contraste anterior, decides rechazar \(H_0\) si la media de la muestra que obtienes es estrictamente mayor que \(27.2\). ¿cuál sería el nivel de significación asociado con esa regla de decisión?

Ejercicio B

La media, muestras pequeñas. En los dos casos debes escribir la hipótesis nula, la hipótesis alternativa, calcular el estadístico, el p-valor y la región de rechazo al \(95\%\).

  1. En un experimento para medir el tiempo de reacción de las personas se les muestra a los sujetos un círculo de color en la pantalla del ordenador. Cuando el círculo cambia de color, el sujeto debe pulsar la barra de espacio del teclado tan rápido como pueda. En una sesión concreta del experimento, se midieron estos tiempos de reacción de un sujeto (en segundos). \[0.316,\quad 0.295,\quad 0.304,\quad 0.263,\quad 0.25\] El experimentador sospecha que el tiempo de reacción medio de este sujeto está por debajo de los 0.29 segundos. ¿Confirman estos datos sus sospechas?
  2. Un laboratorio farmacéutico prepara comprimidos que deben contener una dosis de 500mg de cierto principio activo. El sistema de control de calidad del laboratorio ha tomado una muestra de 15 comprimidos para comprobar si la dosis se ajusta a lo esperado. Los valores medidos, en miligramos, son: \[491, 503, 492, 502, 490, 500, 500, 501, 501, 501, 505, 491, 501, 493, 492\] Utiliza estos valores para comprobar si la dosis es la deseada.

Ejercicio C

Varianza, población normal

  1. contrastar la hipótesis nula \[H_0:\,\sigma\leq \sigma_0,\] donde \(\sigma_0=0.2\), \(n = 15\), \(s = 0.24\).

    1. Calcula la región de rechazo del contraste en las unidades del problema.
    2. Calcula el p-valor del contraste.
  2. Supongamos que \(X\) es una variable normal y que \(\sigma\) es la desviación típica de \(X\). Queremos contrastar la hipótesis alternativa \[H_1:\,\sigma \neq 3.7\] Para ello hemos tomado una muestra aleatoria que encontrarás en este fichero

    1. Calcula la región de rechazo (al nivel de significación del 5%) del contraste en las unidades del problema.
    2. Calcula el p-valor del contraste (recuerda que es bilateral).

Soluciones:
1.1 La región de rechazo la constituye el 5% de las varianzas muestrales posibles más grandes, porque son las que más contradicen la hipótesis nula (\(H_0:\,\sigma\leq 0.2\)), es decir, como \[(15 - 1) \frac{s^2}{0.2^2}\sim \chi^2_{15-1} \] si calculamos \(\chi^2_{15-1, 0.05}\)

(valcrit1 = qchisq(0.05, df = 14, lower.tail = FALSE))
## [1] 23.68479

la región de rechazo la forman las varianzas muestrales \(s^2\) que son mayores que

valcrit1 * (0.2)^2/(15-1)
## [1] 0.06767083

La varianza muestral que hemos observado es

(0.24)^2
## [1] 0.0576

que se encuentra dentro de la región de no rechazo.

1.2. El p-valor es la probabilidad de obtener un valor más extremo (en relación con \(H_0\)) que el obtenido (\(s=0.24\)). En este caso,

pchisq((15-1)*(0.24)^2/(0.2)^1, df = 15-1, lower.tail = FALSE)
## [1] 0.9952706

De nuevo, no la conclusi'on es que no hay evidencia muestral para rechazar \(H_0\)

2.1 Ahora se resuelve el ejercicio con la plantilla correspondiente () Aparecen los fragmentos de código que hay que completar

   tabla = read.table(file = "Tut07-Ejercicio-ContrasteVarianza.csv", sep= " ", dec=".", header = FALSE)  
   muestra = tabla$V1

  # Valor a contrastar de la DESVIACION TIPICA que aparece en la hipotesis nula.
  # CUIDADO: NO INTRODUZCAS LA VARIANZA POR ERROR
  (sigma0= 3.7)

  # ¿Que tipo de contraste estamos haciendo?
  # Escribe 1 si la HIP. ALTERNATIVA es sigma > sigma0, 2 si es sigma < sigma0, 3 si es sigma distinto de sigma0    
  TipoContraste = 3

  # Nivel de significacion
  (nSig= 0.5)

la plantilla devuelve (había un error antes del 26/11/2017)

  "La region de rechazo la forman los Valores del Estadistico que no pertenecen al intervalo  ( 95.0700889723451 , 156.714103829672 )"
  

Si te extraña esta región de no rechazo, date cuenta de que cuando \(s^2=\sigma_0^2\) el valor del estadístico es 124, que está centrado en dicha región. Como el estadístico es

\[(125 - 1) \frac{s^2}{3.7^2}\]

la región de rechazo la forman los valores de la varianza muestral que están fuera del intervalo

(3.7)^2*c( 95.0700889723451 , 156.714103829672 )/(125-1)
## [1] 10.49604 17.30174

En este caso la varianza muestral observada es 16.85, por lo que no hay motivos para rechazar \(H_0\).

2.2 El p-valor lo da la platilla directamente y vale

    "El p-Valor es 0.08265"

Ejercicio D

La porporción

  1. Hacer el ejercicio 3 del capítulo de contraste de hipótesis del libro de Julián de la Horra Navarro (mira en el aula virtual, en el bloque contenidos, en la columna izquierda).

  2. Se trabaja con una muestra tomada en una colonia de gatos.

    1. Se sospecha que hay una hembra por cada tres machos. A la vista de la muestra, ¿estás de acuerdo con esa hipótesis?
    2. Se sospecha que el peso (Bwt) medio y mediano coinciden (independientemente de si son hembras o machos). Es decir, que el peso de la mitad de los individuos está por encima de la media y el de la otra mitad está por debajo. A la vista de la muestra, ¿estás de acuerdo con esa hipótesis?

Ejercicio E

Para practicar más, puedes hacer:

  • Los ejercicios de los cuestionarios (que, de hecho, saldrán en el examen).
  • Puedes resolver, además, los ejercicios 4, 5, 6 y 15 del mismo capítulo del libro de de la Horra. De momento no te preocupes por aquellos en los que se pregunte por la potencia de un contraste o en los que aparezcan dos poblaciones.
  • Puedes hacer el ejercicio 11 del tutorial07; no uses las plantillas que hay en el tutorial (son correctas pero ligeramente diferentes, es para no liarnos).