En ciencias aplicadas es habitual medir el efecto que producen sobre una variable cuantitativa la aplicación de distintos tratamientos. Analizar ese efecto permite decidir qué tratamiento es más o menos efectivo, y decidir en consecuencia. Una herramienta para afrontar estas situaciones es el análisis de la varianza. Como cualquier otra herramienta, su uso está prescrito bajo ciertas condiciones y el alcance de los resultados, circunscrito a cierto marco teórico. El objetivo de este trabajo es aplicar la técnica del análisis de la varianza a cierto conjunto de datos.
Una parte importante en estadística consiste en comunicar de forma eficiente los resultados obtenidos. En los últimos años se están imponiendo los documentos reproducibles, que permiten incluir en un mismo documento tanto el procedimiento estadísitico como los resultados. Los documentos escritos con knir
con R-Markdown
son un ejemplo de ello. Así, el análisis es absolutamente diáfano para el lector: puede leer el informe (fichero de salida, html o pdf) y, si lo desea, consultar el procedimiento que lleva a los resultados estadísticos (está en los chunks del documento Rmd).
Los datos y el contexto para el trabajo los proporciona el experimento de Framinham, diseñado para recopilar información longitudinal (a lo largo de un periodo largo de tiempo) sobre enfermedades cardiovasculares. En este trabajo te proporcionamos los datos de una de las variables cuantitativas que se estudiaron agrupada en 5 clases de edad. En concreto:
totchol
(colesterol total), sysbp
(presión sistólica), diabp
(presión diastólica), bmi
(índice de masa corporal), heartrte
(frecuencia cardiaca), glucose
(glucosa en sangre). Recuerda que en el experimento se midió cada variable 3 veces a intervalos de 10 años; en el nombre de la variable aparecerá un 1, 2, o 3 según el momento en que fue medida.Cada grupo trabajará con su propio conjunto de datos. Para generarlos:
La parte que entregarás en la asignatura de Estadística consiste en un fichero comprimido tal que
grupo-2-45-65.zip
(ordenados de menor a mayor).Contiene un documento reproducible .Rmd
con el que has hecho el análisis estadístico a partir de los datos que has generado. Al compilar el documento que entregues (el fichero .Rmd
) se debe generar un fichero .html o .pdf que haga lo siguiente:
Los requisitos que se nombran no tienen porqué completarse en ese orden, es simplemente una sugerencia. En función de las herramientas que decidas usar, puede que
R
(por ejemplo, para comprobar la normalidad de los datos).