Consideremos de nuevo el fichero de las indias Pima
:
library(MASS)
pima = Pima.tr
Calcula la tabla de frecuencias absolutas del número de embarazos
(npreg
)
table(pima$npreg)
##
## 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14
## 28 45 30 19 16 11 10 12 9 7 3 1 6 1 2
Calcular el número de individuos que reportó 4 embarazos o menos es
sencillo, pere ese tipo de cálculos pueden ser tediosos. Las tablas de
frecuencias acumuladas
resuelven ese problema. Hay
frecuencias acumuladas absolutas
cumsum(table(pima$npreg))
## 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14
## 28 73 103 122 138 149 159 171 180 187 190 191 197 198 200
y tablas de frecuencias acumuladas relativas
cumsum(table(pima$npreg))/nrow(pima)
## 0 1 2 3 4 5 6 7 8 9 10 11 12
## 0.140 0.365 0.515 0.610 0.690 0.745 0.795 0.855 0.900 0.935 0.950 0.955 0.985
## 13 14
## 0.990 1.000
Supón que tenemos la siguiente variable cualitativa
set.seed(2020)
estado = sample(c("grave", "leve", "muy grave", "moderado", "sano"), size = 500, replace = T)
y calculas la tabla de frecuencias
table(estado)
## estado
## grave leve moderado muy grave sano
## 84 98 112 110 96
¿tendría sentido calcular la tabla de frecuencias acumuladas?
La respuesta, claro, es no, porque los niveles del factor están ordenados alfabéticamente, pero no por la gravedad del paciente. Para reordenar los niveles del factor, hay que hacer lo siguiente
estado = factor(estado,
levels = c("sano", "leve", "moderado", "grave", "muy grave")
)
La orden anterior “imprime” el orden que quieres que tengan los niveles del factor
table(estado)
## estado
## sano leve moderado grave muy grave
## 96 98 112 84 110
Considera la variable nivel_ed
del fichero
osteoporosis
que hemos trabajado en la práctica 1. Se
pide:
Ordenar
los valores de la variable de menor a mayor
nivel educativo.