Práctica 11, 19-22/Diciembre: Constrastes Chi cuadrado

Sesión de trabajo:
* Primera hora: * Cómo fabricar a mano una tabla de valores observados y usarla función chisq.testpara hacer el contraste, calcular valores esperados, residuos… * Uso de la función cut para agrupar valores cuantitativos en intervalos y hacer clases. Trabajamos el ejemplo de los cráteres lunares

Tutorial 12: Constrastes Chi cuadrado

La herramienta fundamental es la funcion chisq.test de R.

Contraste de independencia

En la sección 1.1 se detalla cómo hacer este contraste paso a paso (sin usar la función chisq.test). En la sección 1.2 está la correspondiente plantilla. Puedes usarlo para practicar con el uso de matrices pero, a nuestro entender, lo importante es usar la función chisq.test y los gráficos de mosaico. Para ello

  • Crear una matriz y (opcinal, pero recomendable) añadir los nombres de los niveles a filas y columnas (pág 2).
  • En pág 4 se detalla el uso de chisq.test. En particular, date cuenta de cómo puedes usar el símbolo $, como en un data.frame, para acceder a la información (valores esperados, p-valor,…) que proporciona la función.
  • Al final de la página 5 encontrarás la función adecuada para hacer los gráficos de mosaico.
Contraste de homogeneidad
  • Sección 1.3
Resto de secciones
  • La sección 3, contraste Chi cuadrado con otros programas, si te interesa, corre de tu cuenta (aunque no es necesario)
  • La sección 4 no la veremos este curso
  • Puedes hacer el ejercicio opcional.

Práctica 10, 12-16/Diciembre - : la recta de regresión

Sesión de trabajo:

Tutorial 10: la recta de regresión

Todo el tiempo trabajamos con un conjunto de pares de valores que miden, simultáneamente, dos variables. Como ya sabes, los datos pueden venir en distintos formatos, lo más habitual es una tabla con: una variable en cada columna o fila, o con una columna con los datos y otra de códigos que identifica las variables dependiente e independiente en la otra columna.

Lo fundamental es

  • Análisis exploratorio: diagrama dispersión. Secciones 1.2 (básico) y 2.5 (gráficos mejorados)
  • Dada una muestra, obtener la recta de regresión. En la sección 2.3 se explica como hacer los cálculo (explícitos) con R (esta parte puedes trabajarla en casa), en la sección 3 se trabaja con la función lm de R.
  • Obtener los intervalos de confianza para los coeficientes de la recta de regresión. Sección 4.2.
  • Verificar las condiciones del modelo; si los datos no cumplen los requisitos necesarios, las conclusiones carecen de valor. Sección 4.3.
  • Calcular e interpretar las bandas de confianza. Sección 4.5 (no te preocupes por las bandas de predicción; si tienes curiosidad, puedes consultar la sección 10.4.4 del libro).
  • Decidir el contraste \[H_0:\,\beta_1 =0. \]

Práctica 9, 28/Noviembre - 2/Diciembre: Anova unifactorial

Sesión de trabajo: trabajamos con

Tutorial 11: Anova unifactorial

  • Seccion 1: No nos detendremos en ella. Se describe el uso de la plantilla Tut11-Anova-Basico.R que calcula, uno a uno, los elementos de la tabla Anova y explica cómo representar conjuntamente el boxplot de cada nivel del factor.
  • Seccion 2: Se describe el uso de la plantilla Tut11-Anova-Avanzado.R. Practica el uso de la plantilla con los datos del fichero Cap11-frailecillos.csv (pág 2). Debes tener instalados los paquetes multcomp y multcompView. Si no sabes a qué me refiero, pregunta, porque la plantilla no funcionará. Con la plantilla, céntrate en
    • Obtener la tabla Anova y el p-valor del contraste H0: “las medias son iguales”
    • Verificar las condiciones del Anova (normalidad y homocedasticidad)
    • Hacer las comparaciones 2 a 2 con el ajuste de Bonferroni
    • Representar gráficamente la comparación entre grupos
  • Seccion 4: limpieza de datos. Fundamental manejar la plantilla Tut11-Anova-EsquilandoDatos.R (pág 16) para poder (re)tabular los datos cuando llegan a nosotros en un formato inadecuado. Tras hacer el ejercicio de la sección 6, haz los otros dos que proponemos. Ahí necesitarás usar esta plantilla.
  • Sección 5: no lo hemos visto en clase de teoría.
  • Sección 6: se recomienda hacer el ejercicio adicional y se proponen los dos siguientes
    • Esta es la página de Material docente de la Unidad de Bioestadística Clínica del hospital Ramón y Cajal. Resuelve el supuesto práctico que se platea aqui
    • Esta otra es la página del gobierno de la comunidad de Madrid que suministra datos sobre contaminantes atmosféricos. Selecciona datos por contaminante (datos de las últimas 24 horas) y Particulas<2.5(PM2,5) Copia los datos en una tabla de Calc, elimina la columna de las horas y guardalo como un fichero csv. Utiliza la plantilla para determinar si hay diferencias significativas entre las estaciones y, en caso afirmativo, ordenalas. Se trata de datos en tiempo real, y no sabemos qué encontrarás. Si encuentras dificultades inesperadas o resultados que no sabes cómo interpretar, no dudes en acudir al foro: ¡bienenida al mundo real!

Práctica 8, 21-25/Noviembre: inferencia sobre 2 poblaciones

Sesión de trabajo:

Sobre el Tutorial 9, todo es importante pero, sobre todo,

Práctica 7, 7-14/Noviembre: inferencia

Sesión de trabajo:

Sobre el Tutorial 8: Distribuciones relacionadas con la binomial. De momento sólo tienes que centrarte en la inferencia sobre la proporción:

Práctica 6, 31/Octubre-4/Noviembre: inferencia

Sesión de trabajo:

Sobre los Tutoriales 6 y 7:

Tutorial 7: contraste de hipótesis para la media y la varianza

  • Sección 1: importante para fijar ideas. Hay que observar que la expresión de la región de rechazo cambia según usemos el estadístico \(\bar X\) o el estadístico \(\frac{\bar X-\mu_X}{s/\sqrt{n}}\), pero que ambos son equivalentes

    • Sección 1.2: por si prefieres no usar R, estos programas te servirán en algunas situaciones, pero tienen sus limitaciones
    • Sección 1.3. No lo vamos a ver de momento
  • Sección 2: importante
    • Sección 2.1: importante
    • Sección 2.1.1: importante, contraste unilateral y p-valor. Ejercicios 5 y 6
    • Sección 2.1.2: importante, contraste bilateral. Ejercicio 6
    • Sección 2.1.3. No lo vamos a ver de momento
    • Sección 2.2. Importante, trabajo con datos en bruto (pero no la parte opcional de esta sección)
    • Sección 2.3. Importante, trabajo con la media y muestras pequeñas. Ejercicio 7
    • Sección 2.5. Importante, trabajo con la varianza
    • Sección 2.6. Muy útil, plantillas R para contrastes. Ejercicio 9
    • Ejercicios adicionales: Ejercicio 16, todos los apartados

Tutorial 6: intervalos de confianza para la media y la varianza

En el tutorial, cada concepto se ilustra con varias herramientas (R, GeoGebra, Wolframalpha, Calc,…). En la práctica sólo explicaremos algunos de ellos, los que nos parecemás adecuado para nuestros fines, pero no tenemos inconveniente (de hecho, te animamos) en que explores el resto de opciones y utilicesla que mejor se adapta a tus gustos.

  • Sección 1: interesante para experimentar el teorema del límite central.

  • Cálculo de probabilidades, cuantiles y valores críticos con las siguientes funciones de densidad
    • t de Student:
      • Con R pt, qt en la sección 3.2 y con la calculador de probabilidades de GeoGebra en la sección 3.3.1
      • Ejercicios 9: asegurate de saber resolverlo con R y con GeoGebra
    • Chi cuadrado.
      • Con R pchisq, qchisq sección 5.2 y con la calculador de probabilidades de GeoGebra en la sección 5.1
      • Ejercicio 17: asegurate de saber resolverlo con R y con GeoGebra
  • Cálculo de intervalos de confianza para la media y para la varianza. Aprender a utilizar la plantilla adecuada (incrustadas en el tutorial) para calcular cada intervalo en función de las condiciones del problema. Además, debes relacionar la precisión de la estimación con la semianchura del intervalo de confianza y cómo estimar el tamaño que debe tener una muestra para que la precisión sea una dada.

    • Sección 2.1. I.C. media. Z normal estándar, muestras grandes (n>30) de una v.a. cualquiera, o muestras una v.a. normal de cualquier tamaño de la que se conoce la varianza
      • Tut06-IntConf-Media-UsandoZ-Estadisticos.R (pág 12)
      • Tut06-IntConf-Media-UsandoZ-MuestraEnBruto.R (pág 12)
      • Ejercicio 6
    • Sección 4.1. I.C. media. T Student, muestras pequeñas, varianza desconocida, población (aproximadamente) normal
      • Tut06-IntConf-Media-UsandoT-Estadisticos.R (pág 27)
      • Tut06-IntConf-Media-UsandoT-MuestraEnBruto.R (pág 27)
      • Ejercicio 14
    • Sección 6. I.C. varianza. Chi cuadrado, población (aproximadamente) normal
      • Tut06-IntConf-DesvTipica-PoblNormal-Estadisticos.R (pág 37)
      • Tut06-IntConf-DesvTipica-PoblNormal-MuestraEnBruto.R (pág 37)
      • Ejercicio 22

Práctica 5, 24-28/Oct (biología): probabilidad y variable aleatoria

Sesión de trabajo:

Sobre el Tutorial 5: variables aleatorias binomial y normal. Variables aleatorias continuas en general.

Práctica 4, 17-21/Oct (biología) y 17-24/Oct (sanitaria): probabilidad

Sesión de trabajo:

Del tutorial 04:

Del tutorial 05:

Práctica 3, 3-7/Oct: probabilidad

En la práctica hemos trabajado:

Sobre el Tutorial 03:

Práctica 2, 26-30/Sept: estadística descriptiva con R (tutorial 2)

Antes de la práctica debes haber leído (trabajando a la vez con R) las secciones 1, 2, 3, y 4.1. La sección 4.2 y sucesivas las trabajaremos en el aula (ayudantes: deben haberla trabajado). La sección 3 es especialmente importante, allí se explica cómo leer ficheros de datos.

Al finalizar la práctica, debes conocer

En particular

Práctica 1, 19-23/Sept: estadística descriptiva con Calc (hoja de cálculo).

Una hoja de cálculo no es un programa estadístico profesional, pero se utiliza muy a menudo para hacer ciertas tareas. En cierto modo, esta práctica sirve como aproximación a la estadística, y tiene el la función de familiarizarte con * El uso básido de un hoja de cálculo. * Es un paso intermedio para enlazar una calculadora y un programa como R (que hace operaciones vectoriales).

Antes de la práctica debes completar el tutorial 01 a excepción de la sección 7 (ejercicios adicionales). Es decir, necesitarás tener instalado Calc (ver tutorial 00) y familiarizarte con las técnicas desritas a la vez que avanzas en la lectura del tutorial 01. Si tienes dudas, nodejes de escribir al foro de la asignatura. En la sesión práctica habrá tiempo para resolver algunas dudas y practicar lo que has aprendido con otros ficheros de datos.

Sesión 0, Tutorial 0: Instalación del software y primeros pasos

El tutorial 00 contiene instrucciones precisas y actualizdas para la instalación de los programas informáticos que usaremos en la asignatura. Aunque el aulas de prácticas tiene equipos, puedes llevar tu portátil si lo prefieres (asegúrate de que tenga conexióna la red de la universidad, podrás usarlo en el exámen). También te será de utilidad tener el software instalado en casa para practicar.

A efectos de las clases prácticas, sin duda, necesitarás instalar Calc y un lector de ficheros pdf (para preparar la la 1ª práctica), R y RStudio (para preparar la 2ª y sucesivas). Se recomienda instlar también GeoGebra, que usaremos tanto en las clases de teoría como en algunas prácticas.