Introducción
Trabajaremos con una tabla de datos procedente de una muestra de 1000
mujeres que participaron en un estudio sobre osteoporosis. El fichero
contiene algunas variables auxiliares en las columnas iniciales, pero
nosotros nos vamos a fijar en estas.
- edad (en años).
- peso (en kg).
- talla (altura en cm).
- imc (índice de masa corporal)
- bua (resultado de la exploración densitométrica)
- clasific (normal / osteopenia / osteoporosis)
- menarqui (edad primera menstruación, en años)
- edad_menop (edad inicio menopausia, en años)
- menopausia (sí, no)
- tipo de menopausia
- nivel educativo
Organiza tu entorno de trabajo
- Para leer los datos, copia, pega en tu script y ejecuta este
código
mi_url = "https://marcos-marva.web.uah.es/CursoSanitaria/practicas/datos/osteoporosis.csv"
osteoporosis = read.table(file = mi_url,
sep = "\t", dec = ",", header = TRUE)
- En la próxima práctica aprenderemos cómo leer datos de
ficheros.
En lo que sigue, recuerda que para acceder a los datos en las
columnas del data.frame que has creado en el paso anterior puedes
utilizar la notación nombre_tabla$nombre_variable
.
Ejercicio 1
Sobre la variable tipo_men
:
- ¿De qué tipo es la variable?
- Usa la función
unique()
para determinar cuántos valores
distintos toma.
- Construye las tablas de frecuencias absolutas y relativas.
- Para esta variable, ¿tienen sentido las tablas de frecuencias
acumuladas? En caso afirmativo, construyelas.
- Representa las frecuencias absolutas con el gráfico adecuado.
- ¿Qué medida de centralización usarías? Calcula su valor.
Ejercicio 2
Sobre la variable nivel_ed
:
- ¿De qué tipo es la variable?
- ¿Cuántos valores distintos toma?
- Construye las tablas de frecuencias absolutas y relativas.
- Construye ahora las tablas de frecuencias absolutas y relativas
acumuladas. ¿Tienen sentido esas tablas?
Ejercicio 3
Sobre la variable menarqui
:
- ¿De qué tipo es la variable?
- ¿Cuántos valores distintos toma?
- Calcula el recorrido.
- Calcula la media y la desviación típica muestral.
- Calcula las tablas de frecuencias absolutas, relativas, acumuladas y
relativas acumuladas. Interprétalas (es decir, asegurate de que
entiendes la información que proporcionan).
- Representa las frecuencias absolutas con un gráfico.
Ejercicio 4
Sobre la variable imc
:
- ¿De qué tipo es la variable?
- ¿Cuántos valores distintos toma?
- Recorrido.
- Calcula el
imc
medio y la desviación típica muestral
del imc
.
- Calcula la tabla de frecuencias absolutas. ¿Te resulta útil?
- Agrupa la variable en cinco clases de la misma longitud.
- Representa esas clases mediante un histograma.
- ¿Qué porcentaje de los datos pertenece a cada clase?
- ¿Entre qué valores se mueve el 80% central de la muestra?
- Calcula los cuartiles y el boxplot de esta variable e interpretalo.