Copia y pega en un script el siguiente código

datos.framingham <- read.table(file = "FraminghamDataSet.csv", header = TRUE, sep = ";")

# numero filas (inscritos) y columnas (variables)
dim(datos.framingham)

# nombre de las vriables estudiadas
colnames(datos.framingham)

# seleccionar columnas 
columnas <- c("stroke", "age1", "sysbp1")

# seleccionar aleatoriamente individuos
set.seed(7)
# hay que fijar REPLACE = TRUE para que la muestra sea aleatoria simple
filas <- sample(1:nrow(datos.framingham), size = 50, replace = TRUE)

datos <- datos.framingham[filas, columnas]

# cabecera de la tabla de datos con la que trabajamos
head(datos)

y ejecútalo. Ahora tienes cargados en memoria una muestra aleatoria simple de tamaño 50 extrauda del pueblo de Framingham, en relación a las variables stroke, age1, sysbp1

Ejercicios

Con el subconjunto de datos obtenidos a partir del código anterior

  1. Para estimar la proporción de habitantes que han sufrido un infarto, determina el intervalo de confianza para la proporción de la variable stroke al nivel de confianza del 99%.

      ## Para contar el número de personas que sufió un infarto, ejecuta el siguiente código 
      sum(datos$stroke == "Yes")
    
      ## si no ves claro como funciona el código, ejecuta en un script (copiandolas) una por una las siguientes lineas 
    
      datos$stroke
      datos$stroke == "Yes"
      TRUE + TRUE
      TRUE + FALSE
      TRUE*FALSE
      sum(datos$stroke == "Yes")
  2. En el condado en el que está Framingham la propoción de habitantes que ha sufrido un infarto es del 12%. A la vista de la muestra, ¿es esa la situación de Framingham?
  3. Para estimar la tensión arterial media de los habitantes, calcula el intervalo de confianza para la media de la variable sysbp1 al nivel de confianza del 95%
  4. En el condado en el que está Framingham la tensión sistólica media es de 132.9. A la vista de los datos, formula una hipótesis razonable respecto a la media y contrástala.