Frecuencias acumuladas.

Consideremos de nuevo el fichero de las indias Pima:

library(MASS)
pima = Pima.tr

Calcula la tabla de frecuencias absolutas del número de embarazos (npreg)

table(pima$npreg)
## 
##  0  1  2  3  4  5  6  7  8  9 10 11 12 13 14 
## 28 45 30 19 16 11 10 12  9  7  3  1  6  1  2

Calcular el número de individuos que reportó 4 embarazos o menos es sencillo, pere ese tipo de cálculos pueden ser tediosos. Las tablas de frecuencias acumuladas resuelven ese problema. Hay frecuencias acumuladas absolutas

cumsum(table(pima$npreg))
##   0   1   2   3   4   5   6   7   8   9  10  11  12  13  14 
##  28  73 103 122 138 149 159 171 180 187 190 191 197 198 200

y tablas de frecuencias acumuladas relativas

cumsum(table(pima$npreg))/nrow(pima)
##     0     1     2     3     4     5     6     7     8     9    10    11    12 
## 0.140 0.365 0.515 0.610 0.690 0.745 0.795 0.855 0.900 0.935 0.950 0.955 0.985 
##    13    14 
## 0.990 1.000

Reordenar los niveles de un factor

Supón que tenemos la siguiente variable cualitativa

set.seed(2020)
estado = sample(c("grave", "leve", "muy grave", "moderado", "sano"), size = 500, replace = T)

y calculas la tabla de frecuencias

table(estado)
## estado
##     grave      leve  moderado muy grave      sano 
##        84        98       112       110        96

¿tendría sentido calcular la tabla de frecuencias acumuladas?

La respuesta, claro, es no, porque los niveles del factor están ordenados alfabéticamente, pero no por la gravedad del paciente. Para reordenar los niveles del factor, hay que hacer lo siguiente

estado = factor(estado, 
                levels = c("sano", "leve", "moderado", "grave", "muy grave")
                )

La orden anterior “imprime” el orden que quieres que tengan los niveles del factor

table(estado)
## estado
##      sano      leve  moderado     grave muy grave 
##        96        98       112        84       110

Ejercicio

Considera la variable nivel_ed del fichero osteoporosis que hemos trabajado en la práctica 1. Se pide:

  1. Ordenar los valores de la variable de menor a mayor nivel educativo.
  2. Calcula e interpreta las correspondientes tablas de frecuencias acumuladas abslutas y relativas.