Se recomienda disponer de los siguientes programas para
practicar.
Aquí tienes instrucciones
para descargar e instalar R
,
RStudio
, Calc
, GeoGebra
(software libre y de calidad).
También está instalado en las aulas de ordenadores de libre
acceso de las facultades de Ciencias, Ciencias Ambientales, Farmacia y
en los portátiles de la biblioteca de Ciencias.
Si no dispones de portátil, la UAH tiene
servicio de préstamo.
Nota: el aula de prácticas hay ordenadores para todos.
1. Exploración de datos I.
Primeros pasos con R. Tablas y diagramas.
- Objetivos: Aprender
- Qué son R y RStudio. Cómo dar órdenes a R. Qué es un script.
- Variable, vector y tabla en R.
- Manejo y operaciones de datos con vectores.
- Resumir datos mediante tablas y gráficos.
- Calcular las medidas de centralización y dispersión.
- Calcular las medidas de posición y boxplots.
- Antes de la práctica
- Visiona los siguientes vídeos, reproduce de forma
consciente lo que veas:
- Material para la práctica
- Después de la práctica
2. Exploración de datos II.
Selección de subconjuntos de datos en vectores y tablas.
- Objetivos:
- Fuentes de ayuda para R.
- Aprender a leer datos de un fichero.
- Aprender a seleccinar subconjuntos de datos de un vector o en una
tabla:
- Por la posición que ocupan
- Por una condición que cumplen
- Analizar una variable atendiendo a los niveles de un factor.
- Antes de la práctica
- Trabaja el script:
selección de elementos de vectores/tablas hasta la linea
63.
- Ver los vídeos
- Trabaja de la linea 64 en adelante del script:
selección de elementos en tablas.
- Material para la práctica
- Material después de la práctica no lo necesitarás
en el examen, pero en tus trabajos estadísticos tarde o temprano
necesiarás localizar/acceder a los datos atípicos.
- Haz el ejercicio 11 de la práctica 2.
- MAS EJERCICIOS: enunciados, DATOS, soluciones
Alguno de los enunciados está repetido en los propuestos en los
materiales adicionales a la práctica 1.
3. Recta de regresión por mínimos cuadrados
- Objetivos:
- Ajustar una recta a una nubes de puntos por el método de mínimos
cuadrado.
- Utilizar la recta de regresión para estimar valores no observados;
interpretar la pendiente de la recta.
- Usar transformaciones, logarítmica, exponencial y doble recíproco
para ajustes no lineales (logarítmicos, exponenciales, potenciales o
hiperbólicos).
- ANTES de la práctica
- Material de la práctica
4. Probabilidad.
- Objetivos:
- Poner en práctica las nociones básicas de probabilidad.
- Distinguir entre muestreo con y sin reemplazamiento, y sus
consecuencias en la independencia de extracción de muestras.
- ANTES de la práctica
- Haz los ejercicios del 1 al 5 de la hoja de problemas (abajo). Usa
R
como calculadora.
- Material de la práctica
5. Variable aleatoria I.
- Objetivos:
- Identificar situaciones en las que hacer cálculos combinatorios.
Elegir y ejecutar correctamente la herramienta combinatoria adecuada en
cada caso.
- Cálculos básicos con variables aleatorias. Uso de las funciones
dbinom()
, pbinom()
, qbinom()
,
dnorm(),
pnorm()y
qnorm()`.
+ Cálculos de probabilidad básicos con las distribuciones binomial y
Normal. Diapositivas, Enunciados con
soluciones.
6. Variables aleatorias II
- Objetivos:
- Calcular probabilidades con v.a. Uso del as funciones
ppois()
, dpois
, pt()
,
qt()
, pchisq()
, qchisq()
.
- Usar v.a. para resolver modelizar supuestos reales y calcular
probabilidades.
- Teoremas de la probabilidad total y de Bayes en el contexto de
v.a.
- ANTES de la práctica
- Completa los ejercicios sobre las variables binomial y normal de la
práctica anterior.
- Haz los ejercicios 5 y 6 de la práctica
(enunciados abajo, las soluciones están al final de ese documento).
- Material de la práctica
7. Inferencia I. Intervalos de confianza 1 población.
- Objetivos:
- Estimar mediante intervalos los parámetros poblacionales media,
varianza, proporción a partir de una muestra (usar las plantillas).
- Cálculo de tamaños muestrales para obtener cierta precisión.
- Determinar el nivel de confianza de un intervalo dado.
- Uso de los qqplots para detectar normalidad.
- Antes de la práctica
- Material de la práctica
8. Inferencia II. Contraste de hipótesis 1 población.
- Objetivos:
- Contrastar hipótesis sobre los parámetros poblacionales media,
varianza, proporción a partir de una muestra.
- Usar de forma simultánea el p-valor y los intervalos de confianza
(aparecen los intervalos unilaterales).
- Antes de la práctica
- Material de la práctica
9. Inferencia III. Intervalos y contrastes 2 poblaciones.
- Objetivos:
- Contrastar hipótesis sobre los parámetros poblacionales media,
varianza, proporción a partir de una y dos muestras.
- Usar de forma simultánea el p-valor y los intervalos de confianza
(aparecen los intervalos unilaterales).
- Introducir los contrastes de normalidad.
- Antes de la práctica
- Material de la práctica
10. ANOVA.
Objetivos:
- Utilizar el contraste ANOVA para la comparación múltiple de
medias.
- Ordenar las medias en caso de que el ANOVA sea significativo.
- Alternativas cuando no se cumplen las condiciones para ANOVA.
ANTES de la práctica:
Material de la práctica:
- Esquema
ANOVA
- Vídeo
para ver en la práctica; aquí está la plantilla ANOVA básica y
estos son los datos.
- Ojo 1, hay un par de bloques de código que no
aparecen en el vídeo:
- En la línea 37 el bloque “###— Graficos normalidad por muestra”;
seguro que entiendes bien los resultados que produce.
- En la línea 87 el bloque “# coeficiente de determinacion r2” que
calcula \(r^2\).
- En la linea 113 se muestran las comparaciones 2 a 2 con el método de
Tuckey. El formato es diferente (pero equivalente) a como se presenta la
tabla de Bonferroni.
- Ojo 2, por algún motivo que estamos tratando de
dilucidar (a 10/12/2024) el código de letras que se genera con el método
de Tuckey aplicado a los datos asociados al vídeo no es el correcto
(aunque al grabar el vídeo hace unos años funcioní bien, como se aprecia
en el vídeo). Hemos añadido ejercicios en los que el código de letras
estábien para que puedas practicar la interpretación.
- Enunciados y
soluciones.
- Ordenar
medias a partir de código de letras
DE REFUERZO:
- Si no te ha quedado claro cómo ordenar las medias cuando el
contraste ANOVA es significativo, visiona este vídeo
en el que se explica cómo ordenar las medias cuando el contraste ANOVA
es significativo (Bonferroni primero, Tuckey a partir del minuto
9:23).
11. Contrastes \(\chi^2\). Modelo
de regresión.
- Objetivos:
- Sobre contrastes Chi cuadrado:
- Distinguir los casos en que se aplica un contraste de homogeneidad y
uno de independencia.
- Aprender a hacer el contraste.
- Computar la tabla de contingencia a partir de datos en bruto.
- Sobre el modelo de regresión lineal:
- Verificar las condiciones del modelo.
- Estimar por IC los parámetros del modelo.
- Constraste sobre la pendiente del modelo.
- Calcular los intervalos de confianza y predicción para un valor
predicho por el modelo.
- Aplicar lo anterior a casos no lineales (exponencial, potencial,
logarítmico e hiperbólico).
- Antes de la práctica:
- Repasa lo que vimos en la práctica 3 sobre regresión lineal y
no lineal.
- Asegúrate de saber descargar y leer datos desde un fichero
.csv
con Import Dataset
- Visiona este vídeo:
- Visiona este vídeo: modelo
de regresión lineal. Aquí está el script y los datos (que puedes leer
con el botón Import Dataset de RStudio). En las diapositivas de teoría
está el código que explica cómo calcular el intervalo de predicción, que
no está en el vídeo.
- Utiliza este script
de regresión lineal avanzada. Es un poco diferente
al del vídeo. para resolver este ejercicio, aquí
están sus soluciones.
- Material de la práctica:
- Contrastes Chi cuadrado:
- Modelo de regresión lineal: