PARA TRABAJAR ANTES DE LA PRACTICA

Esta sesión está dedicada a probabilidad y variable aleatoria.

El trabajo previo para la práctica consiste en aprender a calcular probabilidades con variables aleatorias continuas y discretas.

Hay muchas herramientas para hacer estos cálculos, y aquí explicaremos como hacerlo con R.

Variables aleatorias discretas

Hemos estudiado dos, la variable binomial, B(n,p), y la variable de Poisson, P(\(\lambda\)), que sirven para modelizar dos situaciones diferentes.

Variable binomial

Ejemplo: Sea X la variable número de caras obtenidas al lanzar 5 veces una moneda equilibrada. Se trata de una variable binomial de parámetros \(n=5\) (número de repeticiones del experimento) y \(p=0.5\) (probabilidad de éxito en cada experimento).

  • Para calcular la probabilidad de obtener exáctamente 3 caras, es decir, \(P(X=3)\), basta con escribir
dbinom(3, size = 5, prob = 0.5)
## [1] 0.3125

donde primero escribimos el valor cuya probabilidad queremos calcular, luego el de “n”, y luego el de “p”.

  • Para calcular la probabilidad de obtener 3 caras o menos, \(P(X\leq 3)\), puedes hacer lo siguiente
sum(dbinom(0:3, size = 5, prob = 0.5))
## [1] 0.8125

Si desglosas el comando, tienes

0:3
## [1] 0 1 2 3

que proporciona los números del 0 al 3. Ahora se calcula \(P(X=0)\), \(P(X=1)\), \(P(X=2)\), \(P(X=3)\) con

dbinom(0:3, size = 5, prob = 0.5)
## [1] 0.03125 0.15625 0.31250 0.31250

y, finalmente, \(P(X\leq 3) = P(X=0)+P(X=1)+P(X=2)+P(X=3)\), es decir, sumamos las probabilidades puntuales ya calculadas con dbinom(0:3, size = 5, prob = 0.5)):

sum(dbinom(0:3, size = 5, prob = 0.5))
## [1] 0.8125

La forma directa de hacer este último cálculo es usar la función ‘pbinom’ para calcular probabilidades acumuladas, como \(P(X\leq 3)\):

pbinom(3, size = 5, prob = 0.5)
## [1] 0.8125

Variable de Poisson

Ejemplo: la variable X = númro de llamadas por hora al 112 sigue una distribución de Poisson con, por ejemplo, parámetro \(\lambda = 2\).

  • Para calcular la probabilidad de que una llamada dure 1 minuto, \(P(X=1)\)
dpois(1, lambda = 2)
## [1] 0.2706706

donde primero escribimos el valor cuya probabilidad queremos calcular, y luego el de \(\lambda\).

  • Para calcular la probabilidad de que una llamada dure entre 2 y 5 minutos (ambos incluidos), \(P(2\leq X \leq 5)\), hacemos algo parecido a lo de la binomial:
sum(dpois(2:5, lambda = 2))
## [1] 0.5774305
  • Para calcular la probabilidad de que una llamada dure 5 o menos minutos, \(P(X \leq 5)\), hacemos algo parecido a lo de la binomial:
ppois(5, lambda = 2)
## [1] 0.9834364

Fíjate en el paralelismo entre los pares de funciones dbinom, pbinom y pbinom, ppois

Variables aleatorias continuas

En este caso conoces la normal, la uniforme y, más adelante, aparecerán otras como la t de Student, la chi cuadrado, y la F de Snedecor Con una variable continua los cálculos importantes son los cálculos directos (probabilidades), por ejemplo, dada una variable X, calcular \[ P(X<3)\qquad P(-1\leq X<5)\qquad P(X>0), \] y los cálculos inversos (percentiles), por ejemplo, calcular, para una cierta variable X, el valor \(a\) tal que \[P(X<a)=0.3,\] o el valor \(b\) tal que \[ P(X>b)=0.6 \]

Cálculos directos (probabilidades) para una distribución normal:

Por ejemplo Si \(X\sim N(\mu = 10, \sigma = 1.5)\) (normal de media 10, y desviación típica 1.5), para calcular la probabilidad \(P(X<11)\) se usa la función pnorm()

pnorm(11, mean = 10, sd = 1.5)
## [1] 0.7475075

Esta instrucción proporciona el área bajo la curva de densidad, y a la izquierda del valor x=11. Primero escribimos el valor, luego la media de la variable, luego la desviación típica de la variable.

Cálculos directos (probabilidades) para una distribución exponencial:

Si para una normal la instrucción es pnorm(), para una exponencial es pexp(). Por ejemplo, si \(X\sim exp_{2}\), entonces \(P(-0.5<X<1)=P(X<1) - P(X<-0.5)\)es

pexp(1, rate = 2) - pexp(-0.5, rate = 2) 
## [1] 0.8646647

En este caso, lo que hacemos es restar dos áreas, el área a la izquierda de x=1, y el área a la izquierda de x=0.5, ambas bajo la misma curva de densidad, correspondiente a la exponencial de parámetro \(\lambda=2\); observa que en cada caso, primero escribimos el valor de x, y luego el valor de \(\lambda\).

Fíjate en la estructura de la orden

Problema inverso (percentil)

Ahora queremos calcular el valor de la variabe que deja por debajo de sí una determinada probabilidad (repasa el concepto de percentil). Es decir, el valor que deja a su izquierda un cierto área bajo la curva de densidad. Ahora, la instrucción empieza por q (de quantile, en inglés), seguido de una abreviatura del nombre de la variable (para una variable normal, por ejemplo, será qnorm, para una exponencial qexp, etc.) Por ejemplo, podemos querer calcular el valor \(a\) tal que \[P(X<a)=0.3\] para una cierta variable aleatoria X. En general, formularemos el problema de esta forma; si queremos \[P(X>b)=0.6,\] como el área total bajo la curva la densidad es \(1\), utilizamos que ese valor \(b\) cumple también que \[P(X<b)=0.4\]

Ejemplo: resolvemos el problema anterior para una normal, y para una exponencial.

  • Consideramos \(X\sim N(\mu = 10, \sigma = 1.5)\). Si queremos encontrar el valor de “a” tal que \(P(X<a)=0.3\), escribimos
qnorm(0.3, mean = 10, sd = 1.5)
## [1] 9.213399

donde primero escribimos el valor de la probabilidad, luego la media de la variable, y finalmente la desviación típica de la variable.

Por otro lado, para encontrar un valor b tal que \(P(X>b)=0.6\), utilizamos que ese valor también satisface que \(P(X<b)=0.4\), y escribimos

qnorm(0.4, mean = 10, sd = 1.5)
## [1] 9.619979
  • Si \(X\sim exp_{2}\) (exponencial, con \(\lambda=2\)), entonces para encontrar \(P(X<a)=0.3\) escribimos
qexp(0.3, rate = 2)
## [1] 0.1783375

mientras que para \(P(X>b)=0.6\)

qexp(0.4, rate = 2)
## [1] 0.2554128

De nuevo, primero escribimos el valor de la probabilidad, y después el parámetro de la distribución (en este caso, el valor de \(\lambda\)).