T5 - Variable Aleatoria PDF

Title T5 - Variable Aleatoria
Course Estadística I
Institution Universidad de Málaga
Pages 59
File Size 1.4 MB
File Type PDF
Total Downloads 77
Total Views 122

Summary

T5 - Variable Aleatoria...


Description

Estadística I - TEMA 5: Variable Aleatoria GADE - Curso 2016/2017

Estadística I Bloque II GRADO EN ADIMINISTRACIÓN Y DIRECCIÓN DE EMPRESAS

Variable aleatoria y Modelos probabilísticos

Tema 5: VARIABLE ALEATORIA 5.1. Introducción 5.2. Concepto de variable aleatoria. Características 5.3. Distribuciones bidimensionales, marginales y condicionadas 5.4. Independencia estocástica

1

Estadística I - TEMA 5: Variable Aleatoria GADE - Curso 2016/2017

Tema 5 VARIABLE ALEATORIA 5.1. INTRODUCCIÓN La variable aleatoria es la herramienta matemática que permite pasar del estudio de sucesos aislados al estudio de las distribuciones de probabilidad y, por lo tanto, es también la responsable de la aplicación del análisis matemático y de otras herramientas matemáticas a la Estadística. De hecho, el concepto de variable aleatoria constituye una pieza básica para el desarrollo de los métodos y técnicas inferenciales. Trabajar con resultados numéricos permite hacer uso de desarrollos matemáticos. De ahí el interés de buscar reglas que hagan posible pasar de un espacio muestral original, E, de resultados posibles no numéricos, a un nuevo espacio muestral inducido, cuyos resultados o elementos van a ser números. Este paso o transformación se realiza mediante la función llamada variable aleatoria, que representamos por X. 5.2. CONCEPTO DE VARIABLE ALEATORIA. CARACTERÍSTICAS Como punto de partida, consideremos el experimento aleatorio ξ consistente en lanzar dos monedas al aire. Su espacio muestral vendrá dado por:

E = { cc, ck , kc , kk } . Entendemos que sobre ese espacio muestral se ha definido un álgebra de sucesos A y una probabilidad P, de manera que el triple ( E , A , P ) , esto es, el espacio probabilístico, caracteriza de manera completa al experimento aleatorio. Supongamos ahora que lo único que nos interesa de los resultados del experimento ξ es el número de caras obtenido. En tal caso, el conjunto de resultados vendrá dado por {0,1, 2} , un nuevo espacio muestral cuyos elementos son números reales. De esta manera, los resultados cualitativos del experimento se han transformado en números reales por el simple cómputo de caras en los elementos de E. Pues bien, acabamos de definir una variable aleatoria, llamémosla X. Se dice que es aleatoria porque toma sus valores en función del azar que caracteriza al experimento aleatorio ξ . Nuestro interés respecto a los experimentos aleatorios es medir la incertidumbre asociada a sus resultados. Parece lógico pues preguntarse cosas como cuál es la probabilidad de que X tome el valor 0 ó que alcance cómo máximo el valor 1. Pero, no podemos utilizar nuestra medida original de incertidumbre P, ya que ésta fue definida sobre el espacio probabilizable 2

Estadística I - TEMA 5: Variable Aleatoria GADE - Curso 2016/2017

original ( E , A ) . Necesitamos definir un nuevo espacio probabilizable sobre el cuerpo de los

( , B )

y una nueva medida de probabilidad PX que se infiera de P por la propia definición de X. Es decir, debemos pasar del espacio probabilístico ( E , A , P) al espacio probabilístico inducido ( , B, PX ) . Veámoslo con más detalle.

números reales, que llamaremos

5.2.1. Concepto de variable aleatoria Retomemos el experimento consistente en el lanzamiento de dos monedas al aire. Su espacio muestral es E = {e1 , e2 , e3 , e4 } = {cc , ck , kc ,kk } . Supongamos que tenemos caracterizado completamente dicho experimento mediante el triple ( E , A , P ) . Definamos ahora la variable X como “número de caras al lanzar dos monedas al aire”. Lo que hemos generado es una variable aleatoria. Hemos creado una regla que asigna números reales a cada elemento del espacio muestral E. En definitiva, nuestra variable X es, en realidad, una función real que tiene como dominio el conjunto E y como conjunto imagen, . Pero no se trata de una función real de variable real, las que estamos habituados a manejar, puesto que el conjunto origen es E y este conjunto no está incluido en . 1 Es una función de conjunto. Al conjunto de valores de  asignados a los elementos de E se le llama recorrido de la variable aleatoria y lo representamos por X ( E ). En nuestro ejemplo, el recorrido de la variable aleatoria X viene dado por X ( E ) = {x1 , x2 , x3 } = {0,1, 2} ⊂  puesto que X ( kk ) = 0, X ( ck ) = 1, X ( kc) = 1 y X ( cc ) = 2. Gráficamente: Figura 4.1 Variable aleatoria como función real



E e 1 = cc e 2 = ck

2 = x1 1 = x2

e 3 = kc

e 4 = kk

0 = x3

Si recorremos las flechas que aparecen en el anterior diagrama en sentido contrario al indicado podemos obtener las antiimagenes de cada uno de los valores que toma X. Así − − − X 1 (0 ) = {kk } , X 1 (1) = {ck }  {kc} y X 1 ( 2) = { cc} . Al hacer esto observamos que las antiimagenes son sucesos pertenecientes al álgebra original A. Esta propiedad exhibida por la función X recibe el nombre de medibilidad. 1

Se dice que una función es función real si, cualquiera que sea su dominio, el conjunto imagen de la función está contenido en el conjunto de los número reales . Se dice que es función real de variable real si también el dominio de la función está incluido en .

3

Estadística I - TEMA 5: Variable Aleatoria GADE - Curso 2016/2017

Que nuestra función real X sea medible resulta crucial para conseguir el objetivo que perseguimos al definirla, esto es, calcular la probabilidad de que X tome determinados valores (probabilidad inducida). Es precisamente esta propiedad la que lo permite. Así, las probabilidades de que X tome los valores 0, 1 ó 2 vendrán dadas por: 1 PX (0 ) = P ({kk} ) = 4

1 1 1 PX ( 1) = P ( {ck } {kc }) = + = 4 4 2

1 PX (2 ) = P ({cc} ) = . 4

mientras que la probabilidad de que, por ejemplo, X sea menor o igual que 1 será: 3 PX ( X ≤ 1) = P ({ kk}  { ck}  { kc} ) = . 4

Fijémonos bien en las expresiones anteriores. Aparecen dos probabilidades, P y PX . La probabilidad P ya sabemos lo que es. Es la función de conjunto definida sobre el espacio probabilizable ( E , A ) , nuestro espacio probabilizable original. Pero, ¿qué es PX ? Antes de proseguir recapitulemos. Hemos tomado como ejemplo el experimento aleatorio consistente en el lanzamiento de dos monedas y hemos establecido una regla (el cómputo de las caras) que nos permite transformar los elementos del espacio muestral E en elementos del conjunto de los números reales. Vemos, además, que a cada resultado e de E le hemos hecho corresponder uno y sólo un número x de , de manera que nuestra regla cumple los requisitos exigibles a una función real. Por tanto, una variable aleatoria es una función real, que asocia un valor numérico a cada evento del espacio muestral asociado a un cierto experimento aleatorio. La peculiaridad de la variable aleatoria como función radica en el espacio sobre el que está definida, es decir, su dominio. Las funciones matemáticas a las que estamos acostumbrados, del tipo y=f(x), tienen como dominio el conjunto  o un subconjunto del mismo. El conjunto  y sus subconjuntos son espacios métricos en los que existen distancias entre puntos y la propia función consiste en una aplicación que a cada punto del dominio le hace corresponder un número. Las variables aleatorias, sin embargo, no tienen como dominio espacios métricos de este tipo y ésta es una diferencia radical. Su espacio natural es un espacio probabilístico, que recordemos de nuevo que está formado por un conjunto en la acepción más general de la palabra (el espacio muestral), junto con sus elementos y subconjuntos (el álgebra), más una probabilidad definida en su seno. Si hemos definido una variable aleatoria X es porque estamos interesados en conocer la probabilidad de que tome determinados valores. Pero para esto no nos sirve la probabilidad P original, puesto que esta asigna probabilidades a los sucesos del σ − álgebra A, esto es, está definida sobre el espacio probabilizable

( E, A) .

En el ejemplo del lanzamiento de dos

monedas al aire, la variable aleatoria que hemos definido toma los valores reales 0, 1 y 2, que están contenidos en el conjunto de los números reales y no en E. En general, una variable aleatoria podría tomar cualquier valor contenido en . Dicho de otra manera, el espacio muestral inducido por la definición de una variable aleatoria es el conjunto  , o un subconjunto del mismo.

4

Estadística I - TEMA 5: Variable Aleatoria GADE - Curso 2016/2017

Por tanto, ahora necesitaremos definir una σ − álgebra sobre  para poder tener un espacio probabilizable y definir una probabilidad sobre él. Lo único que nos falta para tener el panorama completo es dotar a  de un σ − álgebra. Los conjuntos de números reales más usuales son los intervalos, por ello se define el conjunto B = {(−∞, a ], ∀a ∈ } , y se considera el menor de todos los σ − álgebras que contienen a este conjunto B. A este σ − álgebra se le denomina σ − álgebra de Borel, se denota por B, y a sus elementos se le denominan borelianos. Casi cualquier cosa incluida en  que podamos imaginar es un boreliano: los intervalos lo son, sean abiertos o cerrados, los puntos aislados también lo son y las uniones o intersecciones finitas o infinitas numerables de ellos, que son operaciones permitidas en las σ − álgebras. Ya podemos proporcionar una definición formal de variable aleatoria: Una variable aleatoria es una función medible de un espacio probabilístico

( E, A, P )

en el

espacio probabilizable ( , B ), donde B es el σ − álgebra de Borel definida en . Una función se dice medible cuando se cumple que: 1 1 ∀ B ∈ B : X − ( B ) ∈ A donde X − ( B ) = {e ∈ E / X (e ) ∈ B }.

Esta condición (medibilidad) quiere decir que la antiimagen de todo subconjunto B de  que sea elemento del álgebra de Borel B es un subconjunto de E, que es a su vez elemento de A.

Por tanto, la definición de variable aleatoria implica que todo boreliano tiene un subconjunto medible en el espacio probabilístico original, del cual es imagen. Esto permite trasladar las probabilidades del espacio probabilístico ( E , A , P ) al espacio (, B ). Así, en virtud de la condición de medibilidad de X, podemos considerar ahora una probabilidad inducida en , que llamamos PX . En efecto, si B es un boreliano de , tenemos la probabilidad inducida indicada por la siguiente igualdad: PX ( B ) = P ( X −1 ( B ) )

La probabilidad original es P, y está definida en el espacio probabilístico original

( E , A , P) ;

la probabilidad inducida PX está definida sobre el espacio probabilizable (  , B) y se induce de la probabilidad P. De esta manera, conseguimos un espacio probabilístico inducido ( , B, PX ) , que se deriva de la definición de variable aleatoria, y que, como veremos seguidamente, resulta más agradable de tratar matemáticamente. Téngase en cuenta que a veces las variables aleatorias están ya implícitas en los elementos del espacio muestral original. Esto ocurre así cuando el resultado del experimento aleatorio es numérico. Por ejemplo, si el experimento consiste en observar el tiempo de espera hasta la llegada de un autobús o los ingresos anuales de un trabajador asalariado elegido al azar. En otros casos, en un mismo experimento aleatorio podemos definir diferentes variables aleatorias. Por ejemplo, al lanzar dos monedas al aire podemos asignar a cada suceso la 5

Estadística I - TEMA 5: Variable Aleatoria GADE - Curso 2016/2017

variable “número de caras”, pero también el “número de cruces”. En ningún caso debe confundirse el experimento con la variable aleatoria, ni el espacio muestral del experimento con el conjunto de valores que toma la variable. Tipos de variables aleatorias: Atendiendo a la naturaleza de su recorrido, X(E), suele ser habitual clasificar las variables aleatorias en: a) Discretas: Se dice que X es una variable aleatoria discreta cuando sólo toma un número finito de valores reales o un número infinito, pero numerable. Ejemplos: número de piezas defectuosas que aparecen en un proceso de fabricación, número de llamadas telefónicas que se reciben en una centralita durante un determinado período de tiempo, número de depósitos efectuados al día en una entidad bancaria, etc. b) Continuas: Pueden tomar un número infinito no numerable de valores. Una variable aleatoria es continua cuando puede tomar todos los posibles valores del conjunto  de los números reales ( −∞ < x < ∞ ) o de un subconjunto de él, definido por un intervalo ( l 0 ≤ x ≤ lk ). Ejemplos: tiempo en minutos que dedica un alumno a hacer un examen cuya duración máxima es de dos horas ( 0 ≤ x ≤ 120) , cantidad de agua caída al día en un determinado punto geográfico ( x ≥ 0 ) . Al definir una variable aleatoria lo que perseguimos en última instancia es hacer que el cálculo de probabilidades sea matemáticamente más “agradable”. Pero aún no lo hemos conseguido del todo. Estamos habituados a manejar funciones reales de variable real, del tipo y=f(x), pero nuestra probabilidad inducida PX sigue siendo una función de conjunto, como lo era P ya que su dominio está formado no sólo por números sino también por intervalos. El siguiente paso debe ser definir funciones reales de variable real que proporcionen probabilidades para nuestra variable aleatoria. Estas funciones reciben el nombre de distribución de probabilidad y función de distribución. Veamos, a continuación, como se definen y su utilidad, particularizando para el caso de variables discretas y continuas. 5.2.2. Distribución de probabilidad de variables aleatorias discretas Si X es una variable aleatoria discreta con recorrido X (E ) = { x1 , x2 , , xk } , su distribución de probabilidad puede escribirse como: f ( xi ) = P ( X = xi ) = p i

para i = 1, 2,..., k

Esta ya es una función real de variable real, de esas que estamos acostumbrados a manejar puesto que su dominio está formado por puntos (números singulares) de la recta real. Recibe el nombre específico de función de cuantía, debido a que proporciona la cantidad de probabilidad que corresponde a cada valor de la variable aleatoria discreta X.

6

Estadística I - TEMA 5: Variable Aleatoria GADE - Curso 2016/2017

Las dos propiedades que debe cumplir una función real de variable real para ser función de cuantía son: (1) f ( xi ) ≥ 0 para i = 1, 2,..., k i =k

(2)

∑ f ( x ) = 1. i

i= 1

Como vemos, la primera condición establece simplemente que las probabilidades no pueden ser negativas. La segunda condición nos dice que la suma de toda la masa de probabilidad debe ser igual a la unidad. Una función de cuantía puede expresarse de tres maneras distintas: 1) Mediante una tabla en la que se recojan los pares ( x i, p i). 2) Mediante una expresión matemática del tipo f(x). 3) Mediante una gráfica: La representación gráfica de la función de cuantía se lleva a cabo mediante un diagrama de barras (equivale a la distribución de frecuencias relativas para datos no agrupados) en el que la suma de las alturas de las barras debe ser igual a la unidad. Normalmente se utiliza más la expresión matemática por ofrecer más posibilidades de estudio (mayor manejabilidad) que la simple enumeración de probabilidades o la representación gráfica. Ejemplo 1: La función:

 0,1x x = 1, 2,3, 4 f ( x) =  en el resto 0

es una función de cuantía, puesto que cumple las dos propiedades que le son exigibles. Su representación en forma de tabla y gráfica son las siguientes: Tabla 4.1 Ejemplo 1 de función de cuantía (tabla) xi f ( xi ) 1 2 3 4

Figura 4.2 Ejemplo 1 de función de cuantía (Representación gráfica)

0,1 0,2 0,3 0,4 1,0

7

Estadística I - TEMA 5: Variable Aleatoria GADE - Curso 2016/2017

Ejemplo 2: La variable X definida como el número de caras en el lanzamiento de dos monedas es una variable aleatoria discreta. La representación en forma de tabla de su distribución de probabilidad es: Tabla 4.2 Ejemplo 2 de función de cuantía (tabla) x f(x) 1 0 4 1 1 2 1 2 4 1 Puede comprobarse que su forma funcional es: x

2! 1 1 f ( x) = x !(2 − x )!  2   2 

2 −x

para x = 0,1, 2

Como veremos en la lección siguiente, esta forma funcional recibe el nombre específico de función de cuantía binomial. Su representación gráfica es: Figura 4.3 Ejemplo 2 de función de cuantía (Representación gráfica) f(x) 0.6 0.5 0.4 0.3 0.2 0.1 0 -1

0

1

2 x

8

Estadística I - TEMA 5: Variable Aleatoria GADE - Curso 2016/2017

5.2.3. Distribución de probabilidad de variables aleatorias continuas En el caso de variables aleatorias continuas, la distribución de probabilidad no puede darse para valores puntuales de la variable dado que ésta toma infinitos valores distintos para un subconjunto cualquiera de la recta real. En este caso, resulta necesario agrupar los valores de la variable en intervalos exhaustivos y mutuamente excluyentes. 2 A cada intervalo se le asignará una probabilidad y su representación gráfica será, ahora, un histograma en el que colocaremos las alturas h i en el eje de ordenadas. 3 En ese histograma, el área de cada rectángulo que tiene por base un intervalo específico será la probabilidad de que la variable tome valores en ese intervalo. Al aumentar el número de intervalos y, por tanto, haciendo la amplitud de los mismos cada vez más pequeña, entonces resultará que, en el límite, el perfil de ese histograma será el de una línea continua bajo la cual se encierra toda la masa de probabilidad (figura 4.4). A esa línea continua que nos da las ordenadas del histograma límite se le llama función de densidad de una variable aleatoria continua. Ahora esa función f(x) no proporciona directamente probabilidades, sino densidades de probabilidad, si bien el área bajo esa función es igual a la unidad. Las densidades de probabilidad se interpretan, por tanto, como los límites a los que tienden las densidades de frecuencia (h i ) vistas en Estadística Descriptiva, cuando la amplitud de los intervalos tiende a cero. Figura 4.4 Función de densidad como límite del histograma f(x) 60 50 40 30 20 10 0 0

4

8

12

16

20

24

28

32

36

x 40

La función de densidad de cualquier variable aleatoria continua debe satisfacer las siguientes propiedades o condiciones: 1) f ( x) ≥ 0

- ∞ < x < +∞

+∞

2)

∫ f ( x)dx =1 , lo que implica que el área bajo la curva y por encima del eje de abscisas es

-∞

igual a la unidad.

2 3

Cualquier valor de la variable aleatoria debe estar recogido en un intervalo (intervalos exhaustivos) y sólo uno (intervalos excluyentes). Recordemos que en Estadística Descriptiva, la distribución de frecuencias de variables continuas se representaba mediante un histograma.

9

Estadística I - TEMA 5: Variable Aleatoria GADE - Curso 2016/2017

Si la función de densidad no proporciona probabilidades sino densidades de probabilidad, ¿cómo podemos, a partir de ella, obtener probabilidades? ¿Cómo calcular la probabilidad de que la variable aleatoria X tome valores dentro de un determinado intervalo? Este cálculo se llevará a cabo integrando f(x) para el intervalo de valores considerado. La probabilidad será igual al área S bajo la curva entre los límites de integración (véase también figura 4.5): b

P (a ≤ X ≤ b ) = ∫ f (x )dx a

Figura 4.5 Cálculo de probabilidad sobre una función de densidad P(a ≤ X ≤ b) f(x) 0.35

b 0.3

∫ f (x )dx

S = P (a ≤ X ≤ b ) =

a

0.25

0.2

0.15

S 0.1

0.05

0 3.5

a
...


Similar Free PDFs