En una ciudad, una muestra de 150 motoristas ha dado como resultado que 17 de ellos circulaban sin el casco reglamentario. Las autoridades locales consideran que debe iniciarse una campaña de concienciación sobre su uso cuando más del 10% de los motoristas no lo utilice.
1.-Se quiere determinar si hay evidencia suficiente, al nivel de significación \(\alpha = 0\text{.}05\), para poner en marcha la campaña.
Se ha observado una proporción muestral \(\hat p = 17/150 \sim 0.1133\) y, aunque es ligeramente superior al valor umbral a partir del que se pone en marcha la campaña de concienciación, es necesario saber si esa diferencia es significativa o si, por contra, se debe al azar (a la casualidad de la muestra aleatoria concreta que hemos tomado) y, aunque ligeramente superior a \(0.1\), es compatible con que la proporción de la población esté por debajo de \(0.1\). Es decir, queremos contrastar \[H_0:\,p \leq 0.1 \qquad H_1:\,p> 0.1\] En definitiva, se quiere tener una evidencia contundente de que se ha superado ese 10% antes de poner en marcha el protocolo (este planteamiento es propio del contraste de hipótesis; se dice que son conservadores, en el sentido de que hace falta una evidencia muestral grande para rechazar Ho). Podemos usar la plantilla Tut08-Contraste-Proporcion-UsandoZ.R
o, como la teoría dice que en caso de ser cierta Ho la distriución de la proporción muestral es \[\hat p \sim N\left(0.1,\sqrt{\dfrac{0.1*0.9}{150}}\right)\] puedes calcular el p-valor del contraste directamente
pnorm(.1133, mean = .1, sd = sqrt(.1*.9/150), lower.tail = FALSE)
## [1] 0.2935752
2.- Para presentar el asunto en el pleno del ayuntamiento, es necesario saber a partir de qu'e valor de la proporci'on de motoristas que infringen la normativa se debe activar la campa~na.
Lo que se pide es determinar el límite de la región de rechazo para el nivel de significación de 0.05 o, lo que es lo mismo, el valor de la proporción muestral que deja por encima de sí una probabilidad de 0.05. Con la información de que disponemos, se trata de
qnorm(0.05, mean = .1, sd = sqrt(.1*.9/150), lower.tail = FALSE)
## [1] 0.1402905
Si se prefiere usar la plantilla Tut08-Contraste-Proporcion-UsandoZ.R
, hay que tener en cuenta que allí se usa el hecho de que \[\frac{\hat p-0.1}{\sqrt{\dfrac{0.1*0.9}{150}}} \sim N\left(0,1\right)\] por lo que el valor crítique que se obtiene es
(z.alpha2 <- qnorm(0.05, mean = 0, sd = 1, lower.tail = FALSE))
## [1] 1.644854
y hay que destipificarlo para obtener el valor de la proporción muestral
(p <- 0.1 + z.alpha2 * sqrt(0.1*0.9/150))
## [1] 0.1402905
Traducido a número de motoristas en una muestra de 150, dado que
150*p
## [1] 21.04358
habría que observar, al menos 22 motoristas sin casco.
La tabla que puedes descargar de www3.uah.es//marcos_marva/2016-sanitaria-2pp.csv
muestra los efectos de un placebo y de la hidroclorotiacida sobre la presión sanguínea, medida a dos grupos de 11 pacientes.
1.- Se puede afirmar, al nivel del 5% de significación, que existe diferencia en la presión sanguínea media durante la utilización de estos fármacos? Se trata de una comparación de medias y, puesto que sólo nos interesa si los fármacos producen efectos diferentes sobre la presión sanguínea (y no cuál tiene mayor efecto), planteamos el contraste \[H_0:\,\mu_p = \mu_c \qquad H_1:\,\mu_p\neq \mu_p\] Donde \(\mu_p\) y \(\mu_c\) son las presiones sanguíneas medias de la población a la que seaplica el placebo y la hidroclorotiacida, respectivamente. A la vista de los datos
Placebo=c(211,210,210,203,196,190,191,177,173,170,163)
HCloro=c(181,172,196,191,167,161,178,160,149,119,156)
se trata de muestras pequeñas y tenemos que suponer que las presiones sanguíneas se distribuyen conforme a una normal. En primer lugar hay que decidir si podemsse puede considerar que las variables son o no iguales. Para ello planteamos el contraste \[H_0:\,\sigma^2_p = \sigma^2_c \qquad H_1:\,\sigma^2_p\neq \sigma^2_p\] Se puede usar la plantilla Tut09-Contraste-2Pob-CocienteVarianzas.R
o bien hacer el contraste con la función var.test
, comentada en clase
v = var.test(x = Placebo, y =HCloro)
v$p.value
## [1] 0.5244492
El p-valor no deja duda, y podemos considerar las varianzas iguales. Ahora, o bien la plantilla Tut09-Contraste-2Pob-DifMedias-UsandoT-VarIguales.R
o bien la función t.test
, también vista en clase
t = t.test(x = Placebo, y =HCloro, var.equal = TRUE)
t$p.value
## [1] 0.009188811
obtenemos un p-valor que permite rechazar \(H_0\), y concluimos que, a la vista de la muestra, no hay evidencias para considerar que los efectos sean significativamente diferentes
2.- ¿Podrías cuantificar el tamaño del efecto? En concreto, si conocieras la presión sanguínea media del grupo de control (placebo), entre qué valores esperas que esté la presión media de los pacientes tratados con hidroclorotiacida? Se trata de determinar el intervalo de confianza para la diferencia de medias. Puedes usar o bien la plantilla Tut09-IntConf-2Pob-DifMedias-UsandoT-VarIguales.R
o bien la función t.test
, también vista en clase
t = t.test(x = Placebo, y =HCloro, var.equal = TRUE)
(IC <- t$conf.int)
## [1] 6.637234 41.362766
## attr(,"conf.level")
## [1] 0.95
y lainterpretación es que en promedio, y con un nivel de confianza del 95%, la presión sanguínea será de entre 6.637234 y 41.362766 unidades superior al de los individuos tratados con la hidroclorotiacida.
En un contraste unilateral con hipótesis nula H0: mu > mu0 y nivel de significación \(\alpha\) ¿es posible que el estadístico esté en la región de rechazo, pero que el p-valor sea mayor que \(\alpha\)? En este caso la región de rechazo está en la cola izquierda de la distribución. En concreto, si llamamos $X_m $ y \(\bar X_*\) a lamedia muestral observada y al valor de la media muestral a partir del que se rechaza H0, tenemos que \(p-valor = P(\bar X< \bar X_m)\) y \(\alpha = P(\bar X<\bar X_*)\). Por tanto