Copia y pega en un script el siguiente código
datos.framingham <- read.table(file = "FraminghamDataSet.csv", header = TRUE, sep = ";")
# numero filas (inscritos) y columnas (variables)
dim(datos.framingham)
# nombre de las vriables estudiadas
colnames(datos.framingham)
# seleccionar columnas
columnas <- c("stroke", "age1", "sysbp1")
# seleccionar aleatoriamente individuos
set.seed(7)
# hay que fijar REPLACE = TRUE para que la muestra sea aleatoria simple
filas <- sample(1:nrow(datos.framingham), size = 50, replace = TRUE)
datos <- datos.framingham[filas, columnas]
# cabecera de la tabla de datos con la que trabajamos
head(datos)
y ejecútalo. Ahora tienes cargados en memoria una muestra aleatoria simple de tamaño 50 extrauda del pueblo de Framingham, en relación a las variables stroke
, age1
, sysbp1
Con el subconjunto de datos obtenidos a partir del código anterior
Para estimar la proporción de habitantes que han sufrido un infarto, determina el intervalo de confianza para la proporción de la variable stroke
al nivel de confianza del 99%.
## Para contar el número de personas que sufió un infarto, ejecuta el siguiente código
sum(datos$stroke == "Yes")
## si no ves claro como funciona el código, ejecuta en un script (copiandolas) una por una las siguientes lineas
datos$stroke
datos$stroke == "Yes"
TRUE + TRUE
TRUE + FALSE
TRUE*FALSE
sum(datos$stroke == "Yes")
sysbp1
al nivel de confianza del 95%En el condado en el que está Framingham la tensión sistólica media es de 132.9. A la vista de los datos, formula una hipótesis razonable respecto a la media y contrástala.