Esta sesión está dedicada a probabilidad y variable aleatoria.
El trabajo previo para la práctica consiste en aprender a calcular probabilidades con variables aleatorias continuas y discretas.
Hay muchas herramientas para hacer estos cálculos, y aquí explicaremos como hacerlo con R
.
Hemos estudiado dos, la variable binomial
, B(n,p), y la variable de Poisson
, P(\(\lambda\)), que sirven para modelizar dos situaciones diferentes.
Ejemplo: Sea X la variable número de caras obtenidas al lanzar 5 veces una moneda equilibrada. Se trata de una variable binomial de parámetros \(n=5\) (número de repeticiones del experimento) y \(p=0.5\) (probabilidad de éxito en cada experimento).
dbinom(3, size = 5, prob = 0.5)
## [1] 0.3125
donde primero escribimos el valor cuya probabilidad queremos calcular, luego el de “n”, y luego el de “p”.
sum(dbinom(0:3, size = 5, prob = 0.5))
## [1] 0.8125
Si desglosas el comando, tienes
0:3
## [1] 0 1 2 3
que proporciona los números del 0 al 3. Ahora se calcula \(P(X=0)\), \(P(X=1)\), \(P(X=2)\), \(P(X=3)\) con
dbinom(0:3, size = 5, prob = 0.5)
## [1] 0.03125 0.15625 0.31250 0.31250
y, finalmente, \(P(X\leq 3) = P(X=0)+P(X=1)+P(X=2)+P(X=3)\), es decir, sumamos las probabilidades puntuales ya calculadas con dbinom(0:3, size = 5, prob = 0.5))
:
sum(dbinom(0:3, size = 5, prob = 0.5))
## [1] 0.8125
La forma directa de hacer este último cálculo es usar la función ‘pbinom’ para calcular probabilidades acumuladas, como \(P(X\leq 3)\):
pbinom(3, size = 5, prob = 0.5)
## [1] 0.8125
Ejemplo: la variable X = númro de llamadas por hora al 112 sigue una distribución de Poisson con, por ejemplo, parámetro \(\lambda = 2\).
dpois(1, lambda = 2)
## [1] 0.2706706
donde primero escribimos el valor cuya probabilidad queremos calcular, y luego el de \(\lambda\).
sum(dpois(2:5, lambda = 2))
## [1] 0.5774305
ppois(5, lambda = 2)
## [1] 0.9834364
Fíjate en el paralelismo entre los pares de funciones dbinom
, pbinom
y pbinom
, ppois
En este caso conoces la normal
, la uniforme
y, más adelante, aparecerán otras como la t de Student
, la chi cuadrado
, y la F de Snedecor
Con una variable continua los cálculos importantes son los cálculos directos (probabilidades), por ejemplo, dada una variable X, calcular \[
P(X<3)\qquad P(-1\leq X<5)\qquad P(X>0),
\] y los cálculos inversos (percentiles), por ejemplo, calcular, para una cierta variable X, el valor \(a\) tal que \[P(X<a)=0.3,\] o el valor \(b\) tal que \[
P(X>b)=0.6
\]
Por ejemplo Si \(X\sim N(\mu = 10, \sigma = 1.5)\) (normal de media 10, y desviación típica 1.5), para calcular la probabilidad \(P(X<11)\) se usa la función pnorm()
pnorm(11, mean = 10, sd = 1.5)
## [1] 0.7475075
Esta instrucción proporciona el área bajo la curva de densidad, y a la izquierda del valor x=11. Primero escribimos el valor, luego la media de la variable, luego la desviación típica de la variable.
Si para una normal la instrucción es pnorm()
, para una exponencial es pexp()
. Por ejemplo, si \(X\sim exp_{2}\), entonces \(P(-0.5<X<1)=P(X<1) - P(X<-0.5)\)es
pexp(1, rate = 2) - pexp(-0.5, rate = 2)
## [1] 0.8646647
En este caso, lo que hacemos es restar dos áreas, el área a la izquierda de x=1, y el área a la izquierda de x=0.5, ambas bajo la misma curva de densidad, correspondiente a la exponencial de parámetro \(\lambda=2\); observa que en cada caso, primero escribimos el valor de x, y luego el valor de \(\lambda\).
Fíjate en la estructura de la orden
Ahora queremos calcular el valor de la variabe que deja por debajo de sí una determinada probabilidad (repasa el concepto de percentil). Es decir, el valor que deja a su izquierda un cierto área bajo la curva de densidad. Ahora, la instrucción empieza por q
(de quantile, en inglés), seguido de una abreviatura del nombre de la variable (para una variable normal, por ejemplo, será qnorm
, para una exponencial qexp
, etc.) Por ejemplo, podemos querer calcular el valor \(a\) tal que \[P(X<a)=0.3\] para una cierta variable aleatoria X. En general, formularemos el problema de esta forma; si queremos \[P(X>b)=0.6,\] como el área total bajo la curva la densidad es \(1\), utilizamos que ese valor \(b\) cumple también que \[P(X<b)=0.4\]
Ejemplo: resolvemos el problema anterior para una normal, y para una exponencial.
qnorm(0.3, mean = 10, sd = 1.5)
## [1] 9.213399
donde primero escribimos el valor de la probabilidad, luego la media de la variable, y finalmente la desviación típica de la variable.
Por otro lado, para encontrar un valor b tal que \(P(X>b)=0.6\), utilizamos que ese valor también satisface que \(P(X<b)=0.4\), y escribimos
qnorm(0.4, mean = 10, sd = 1.5)
## [1] 9.619979
qexp(0.3, rate = 2)
## [1] 0.1783375
mientras que para \(P(X>b)=0.6\)
qexp(0.4, rate = 2)
## [1] 0.2554128
De nuevo, primero escribimos el valor de la probabilidad, y después el parámetro de la distribución (en este caso, el valor de \(\lambda\)).