Sesión de trabajo:
* Primera hora: * Cómo fabricar a mano una tabla de valores observados y usarla función chisq.test
para hacer el contraste, calcular valores esperados, residuos… * Uso de la función cut
para agrupar valores cuantitativos en intervalos y hacer clases. Trabajamos el ejemplo de los cráteres lunares
La herramienta fundamental es la funcion chisq.test
de R.
En la sección 1.1 se detalla cómo hacer este contraste paso a paso (sin usar la función chisq.test
). En la sección 1.2 está la correspondiente plantilla. Puedes usarlo para practicar con el uso de matrices pero, a nuestro entender, lo importante es usar la función chisq.test
y los gráficos de mosaico. Para ello
chisq.test
. En particular, date cuenta de cómo puedes usar el símbolo $
, como en un data.frame
, para acceder a la información (valores esperados, p-valor,…) que proporciona la función.Sesión de trabajo:
cut
para agrupar valores cuantitativos en intervalos y hacer clases. Trabajamos el ejemplo de los cráteres lunaresTodo el tiempo trabajamos con un conjunto de pares de valores que miden, simultáneamente, dos variables. Como ya sabes, los datos pueden venir en distintos formatos, lo más habitual es una tabla con: una variable en cada columna o fila, o con una columna con los datos y otra de códigos que identifica las variables dependiente e independiente en la otra columna.
Lo fundamental es
lm
de R.Sesión de trabajo: trabajamos con
Cap-11-Anova-avanzado.R
y los datos que hay en la web.Tut11-Anova-Basico.R
que calcula, uno a uno, los elementos de la tabla Anova y explica cómo representar conjuntamente el boxplot de cada nivel del factor.Tut11-Anova-Avanzado.R
. Practica el uso de la plantilla con los datos del fichero Cap11-frailecillos.csv
(pág 2). Debes tener instalados los paquetes multcomp
y multcompView
. Si no sabes a qué me refiero, pregunta, porque la plantilla no funcionará. Con la plantilla, céntrate en
Tut11-Anova-EsquilandoDatos.R
(pág 16) para poder (re)tabular los datos cuando llegan a nosotros en un formato inadecuado. Tras hacer el ejercicio de la sección 6, haz los otros dos que proponemos. Ahí necesitarás usar esta plantilla.csv
. Utiliza la plantilla para determinar si hay diferencias significativas entre las estaciones y, en caso afirmativo, ordenalas. Se trata de datos en tiempo real, y no sabemos qué encontrarás. Si encuentras dificultades inesperadas o resultados que no sabes cómo interpretar, no dudes en acudir al foro: ¡bienenida al mundo real!Sesión de trabajo:
cuestionarios
.contrastesHipotesisParametricos-delaHorra.pdf
que tienes disponible en el aula virtual. En particular, hemos ampliado el ejercicio 7 y calculado el tamaño del efectoa través del intervalo de confianza para la diferencia de proporciones.Sobre el Tutorial 9, todo es importante pero, sobre todo,
length()
, mean()
, sd()
para obtener los valores de los estadísticos (ojo a cómo calcular las proporciones).t.test
, sigma.test
y prop.test
.Sesión de trabajo:
IntervalosConfianza-delaHorra.pdf
y el 6 y 15 del documento ContrateHipotesisParametricos-delaHorra.pdf
, ambos accesibles en el aula virtual. Se recomienda hacer el resto de ejercicios (excepto los relacionados con la variable de Poisson, que no hemos estudiado, y losque se habla de potencia
).Sobre el Tutorial 8: Distribuciones relacionadas con la binomial. De momento sólo tienes que centrarte en la inferencia sobre la proporción:
prop.test
nos parecerá muy bien.Sesión de trabajo:
t.test
de R
y, con el paquete asbio
, las funciones ci.mu.test
, ci.sigma.test
, ci.prop.test
Sobre los Tutoriales 6 y 7:
Sección 1: importante para fijar ideas. Hay que observar que la expresión de la región de rechazo cambia según usemos el estadístico \(\bar X\) o el estadístico \(\frac{\bar X-\mu_X}{s/\sqrt{n}}\), pero que ambos son equivalentes
En el tutorial, cada concepto se ilustra con varias herramientas (R, GeoGebra, Wolframalpha, Calc,…). En la práctica sólo explicaremos algunos de ellos, los que nos parecemás adecuado para nuestros fines, pero no tenemos inconveniente (de hecho, te animamos) en que explores el resto de opciones y utilicesla que mejor se adapta a tus gustos.
Sección 1: interesante para experimentar el teorema del límite central.
pt
, qt
en la sección 3.2 y con la calculador de probabilidades de GeoGebra en la sección 3.3.1pchisq
, qchisq
sección 5.2 y con la calculador de probabilidades de GeoGebra en la sección 5.1Cálculo de intervalos de confianza para la media y para la varianza. Aprender a utilizar la plantilla adecuada (incrustadas en el tutorial) para calcular cada intervalo en función de las condiciones del problema. Además, debes relacionar la precisión de la estimación con la semianchura del intervalo de confianza y cómo estimar el tamaño que debe tener una muestra para que la precisión sea una dada.
Sesión de trabajo:
Si[codición, acción si condición cierta, acción si condición falsa]
)Sobre el Tutorial 5: variables aleatorias binomial y normal. Variables aleatorias continuas en general.
Sección 1: Matrices (interesante para quien quiera ir más allá) y tablas (data.frame) con R. Las tablas son el soporte natural para los datos,es importante manejarlas mínimamente.
pbinom
, pnorm
y qnorm
de R.
Sesión de trabajo:
Del tutorial 04:
Del tutorial 05:
pbinom
, dbinom
, qbinom
y rbinom
de R.pnorm
, dnorm
, qnorm
y rnorm
de R.En la práctica hemos trabajado:
Sobre el Tutorial 03:
Antes de la práctica debes haber leído (trabajando a la vez con R) las secciones 1, 2, 3, y 4.1. La sección 4.2 y sucesivas las trabajaremos en el aula (ayudantes: deben haberla trabajado). La sección 3 es especialmente importante, allí se explica cómo leer ficheros de datos.
Al finalizar la práctica, debes conocer
En particular
Una hoja de cálculo no es un programa estadístico profesional, pero se utiliza muy a menudo para hacer ciertas tareas. En cierto modo, esta práctica sirve como aproximación a la estadística, y tiene el la función de familiarizarte con * El uso básido de un hoja de cálculo. * Es un paso intermedio para enlazar una calculadora y un programa como R (que hace operaciones vectoriales).
Antes de la práctica debes completar el tutorial 01 a excepción de la sección 7 (ejercicios adicionales). Es decir, necesitarás tener instalado Calc (ver tutorial 00) y familiarizarte con las técnicas desritas a la vez que avanzas en la lectura del tutorial 01. Si tienes dudas, nodejes de escribir al foro de la asignatura. En la sesión práctica habrá tiempo para resolver algunas dudas y practicar lo que has aprendido con otros ficheros de datos.
El tutorial 00 contiene instrucciones precisas y actualizdas para la instalación de los programas informáticos que usaremos en la asignatura. Aunque el aulas de prácticas tiene equipos, puedes llevar tu portátil si lo prefieres (asegúrate de que tenga conexióna la red de la universidad, podrás usarlo en el exámen). También te será de utilidad tener el software instalado en casa para practicar.
A efectos de las clases prácticas, sin duda, necesitarás instalar Calc y un lector de ficheros pdf (para preparar la la 1ª práctica), R y RStudio (para preparar la 2ª y sucesivas). Se recomienda instlar también GeoGebra, que usaremos tanto en las clases de teoría como en algunas prácticas.