Enunciado

Este trabajo se inspira en el tipo de datos que se recogen en la encuesta nacional de salud. En concreto, se quiere analizar la relación entre el índice de masa corporal, IMC, y los los niveles de cierto factor. Los datos son simulados (porque los originales no cumplen directamente las condiciones para aplicar ANOVA).

Así, la variable respuesta es

  • IMC: índice de masa corporal (kg/m^2)

Y la variable explicativa será uno de los siguientes factores:

  • Relación con le tabaco:
    1. Sí fuma, diariamente
    2. Sí fuma, pero no diariamente
    3. No fuma actualmente, pero ha fumado antes
    4. No fuma ni ha fumado nunca de manera habitual
    5. Nunca he fumado nunca nada
  • Frecuencia con la que realiza alguna actividad física en su tiempo libre:
    1. No hago ejercicio. El tiempo libre lo ocupo de forma casi completamente sedentaria (leer, ver la televisión, ir al cine, etc.)
    2. Hago alguna actividad física o deportiva ocasional
    3. Hago actividad física varias veces al mes
    4. Hace entrenamiento deportivo o físico varias veces a la semana
    5. Participo en competiciones habitualmente de forma amateur o (semi)profesional
  • Frecuencia de consumo de aperitivos o comidas saladas de picar (patatas fritas, ganchitos, galletitas saladas):
    1. A diario
    2. Tres o más veces a la semana, pero no a diario
    3. Una o dos veces a la semana
    4. Menos de una vez a la semana
    5. Nunca o casi nunca
  • Frecuencia de consumo de refrescos azucarados:
    1. A diario
    2. Tres o más veces a la semana, pero no a diario
    3. Una o dos veces a la semana
    4. Menos de una vez a la semana
    5. Nunca o casi nunca

En la tabla de datos, los niveles de la variable explicativa están etiquetados de L1 a L5 de acuerdo con la numeración de arriba (que va de 1 a 5 en los niveles de cada factor).

Los datos

Para obtener los datos:

  1. Descarga este fichero que, a su vez, contiene tres ficheros.
  2. Descomprimelo en tu ordenador.
  3. Fija el directorio de trabajo.
  4. Abre el fichero generar-datos-trabajo-2-sanitaria-2017-18.R
  5. Introduce en el vector num los números de los integrantes del grupo, separados por comas
  6. Ejecuta el script.
  7. Se genera un fichero .csv de datos que se guarda en la carpeta de trabajo:
    • El nombre del fichero es grupo-vuestros_numeros-variable_explicativa-datos-.csv. Por ejemplo el fichero grupo-1-2-3-Deporte-datos.csv es para el grupo cuyos miembros tienen los números de lista 1, 2, y 3, y les corresponde estudiar el IMC en función de la cantidad de ejercicio que practican esos individuos.
    • Las columnas se llaman L1,…,L5 y se corresponden con los niveles del factor numerados igual que aparecen en la descripción de más arriba

Qué se pide

El análisis consiste en

  1. Elimina las filas incompletas.
  2. Busca valores atípicos y, si los hay, decide qué hacer con ellos.
  3. Establece las hipótesis nula y alternativa adecuadas.
  4. Comprueba las (tres) condiciones necesarias para realizar el análisis.
  5. Haz el contraste ANOVA.
  6. Si el contraste es significativo, ordena las medias de los niveles del factor.
  7. No olvides escribir un breve párrafo con una pequeña introducción y otro con las conclusiones del contraste.

Se valorará:

  • La concisión.
  • El límite es de 5 páginas

Para que te sirva de referencia del tipo de análisis que esperamos hemos preparado un documento de ejemplo que podéis descargar desde este ejemplo. No pretendemos que hagas un clon con tus datos, claro, pero sí que te ayude a delimitar el trabajo.

Entrega

  • Límite: a las 23:59:59 del 20 de diciembre de 2017.
  • Usa este enlace. Se corregirá sólo el último envío.

Si tienes dificultades:

  • No dudes en preguntar en el foro, concertar una tutoría o escribir a cualquiera de tus profesores.
  • Ayudará que muestres qué fragmento de código (y con qué datos) es el que da problemas y/o expliques claramente qué necesitas.
  • Para los gráficos, te puede ayudar este vídeo