Inferencia Estadística (problemas resueltos y teoria) PDF

Title Inferencia Estadística (problemas resueltos y teoria)
Author Nicko V.
Pages 410
File Size 38.4 MB
File Type PDF
Total Downloads 572
Total Views 735

Summary

UNIVERSIDAD NACIONAL DEL CALLAO VICERECTORADO DE INVESTIGACIÓN FACULTAD DE CIENCIAS ECONÓMICAS TEXTO DE PROBLEMAS DE INFERENCIA ESTADÍSTICA AUTOR: JUAN FRANCISCO BAZÁN BACA (Resolución Rectoral 940-2011-R del 22-9-11) 01-09-11 al 31-08-13 CALLAO – PERÚ 2013 1 ÍNDICE Pág. INDICE 2 INTRODUCCIÓN 5 Capí...


Description

Accelerat ing t he world's research.

Inferencia Estadística (problemas resueltos y teoria) Nicko V.

Related papers

Download a PDF Pack of t he best relat ed papers 

Unidad 5: DIST RIBUCIONES MUEST RALES Final Resist ance Est adist ica inferencial Andres Nuñez ESTADÍST ICA BÁSICA PARA EST UDIANT ES DE CIENCIAS - COLECCIÓN GIOYAS Lhuiz Hernandez

UNIVERSIDAD NACIONAL DEL CALLAO VICERECTORADO DE INVESTIGACIÓN FACULTAD DE CIENCIAS ECONÓMICAS

TEXTO DE PROBLEMAS DE INFERENCIA ESTADÍSTICA

AUTOR: JUAN FRANCISCO BAZÁN BACA (Resolución Rectoral 940-2011-R del 22-9-11) 01-09-11 al 31-08-13

CALLAO – PERÚ 2013

1

ÍNDICE Pág. INDICE

2

INTRODUCCIÓN

5

Capítulo 1. LA DISTRIBUCIÓN NORMAL Y EL TEOREMA DEL LÍMITE CENTRAL

6

1.1

Distribución normal

6

1.2

Distribución normal estándar

7

1.3

Propiedad reproductiva de la distribución normal

9

1.4

Teorema del límite central

10

1.5

Ejercicios resueltos

13

1.6

Ejercicios propuestos

29

Capítulo 2. DISTRIBUCIONES MUESTRALES

33

2.1

Distribución muestral de la media

37

2.2

Distribución muestral del total (conocida la media)

39

2.3

Distribución de la diferencia de medias muestrales

40

2.4

Distribución muestral de la proporción

43

2.5

Distribución muestral del total (conocida la proporción)

47

2.6

Distribución muestral de la diferencia de proporciones

48

2.7

Ejercicios resueltos

52

2.8

Ejercicios propuestos

73

Capítulo 3. DISTRIBUCIONES ESPECIALES

77

3.1

Distribución Chi-cuadrado

77

3.2

Distribución t de student

86

3.3

Distribución muestral de la media (n < 30)

92

3.4

Distribución de la diferencia de medias muestrales con varianzas desconocidas pero iguales

93

3.5

Distribución F de Snedecor

94

3.6

Distribución de la razón de dos varianzas muestrales

98

3.7

Ejercicios resueltos

100 2

3.8

Ejercicios propuestos

119

Capítulo 4. ESTIMACIÓN PUNTUAL

122

4.1

Estimadores. Propiedades

123

4.2

Métodos de Estimación Puntual

130

4.3

Método de Máxima Verosimilitud

130

4.4

Método de los Momentos

132

4.5

Método de los mínimos cuadrados

133

4.6

Ejercicios resueltos

135

4.7

Ejercicios propuestos

152

Capítulo 5. ESTIMACIÓN POR INTERVALOS DE CONFIANZA

155

5.1

Intervalo de confianza para la media y tamaño de muestra

160

5.2

Intervalo de confianza para el total (conocida la media)

162

5.3

Intervalo de confianza para la proporción y tamaño de muestra

164

5.4

Intervalo de confianza para el total (conocida la proporción)

167

5.5

Intervalo de confianza para la diferencia de medias

168

5.6

Intervalo de confianza para la diferencia de proporciones

170

5.7

Intervalo de confianza para la media (n < 30)

173

5.8

Intervalo de confianza para la varianza

175

5.9

Intervalo de confianza para la razón de varianzas

177

5.10

Intervalo de confianza para la diferencia de medias (n y m a] = 1 – P[X  a] = 1 - Φ [(a - ) / σ ]

Los valores de la función de distribución acumulativa normal estándar, Φ (z) o F(z), han sido reproducidos en la Tabla 1 del Anexo utilizando la hoja de cálculo Excel. Uso de la Tabla de la distribución normal estándar a) Para calcular probabilidades.- en la tabla 1, conocido el valor de z, hallar Φ (z) = F(z) = P [Z  z]. Por ejemplo, para z = 1.96, tenemos que:

Φ (1.96) = F (1.96) = P [Z  1.96] = 0.97500.

b) Para hallar valores de z.- es un proceso inverso al anterior, ya que conocida la probabilidad Φ (z) = F (z) = P [Z  z] = α , en la tabla 1, se debe hallar el valor de z que acumule en probabilidad α y que denotaremos como z = Zα .

Para el mismo ejemplo, sí Φ (z) = F (z) = P [Z  z] = 0.97500, esto implica que, en la tabla 1, a la probabilidad 0.97500, le corresponde z = Z0.97500 1.96 .

Una característica importante de la distribución normal es que:  Entre

–σy

P( – σ  X 

+ σ se encuentra el 68.27% de las observaciones. Es decir que μ

    X          + σ) = P    P 1  Z  1       = Φ (1) - Φ (-1) = 0.84134 –0.15866 = 0.68268 8

 Entre

– 2σ y

P( – 2σ  X 

 Entre

– 3σ y

– 4σ y

P( – 4σ  X 

  3       3   + 3σ) = P  Z   P 3  Z  3     

+ 4σ se encuentra el 99.9937% de las observaciones. Es decir

  4       4   + 4σ) = P  Z    P  4  Z  4     = Φ (4) - Φ (-4) = 0.999968 – 0.000031 = 0.999937

– 5σ y

que: P( – 5σ  X 

 Entre

+ 3σ se encuentra el λλ.73% de las observaciones. Es decir queμ

= Φ (3) - Φ (-3) = 0.99865 – 0.00135 = 0.9973

que:

 Entre

  2       2   + 2σ) = P  Z   P 2  Z  2      = Φ (2) - Φ (-2) = 0.97725 –0.02275 = 0.9545

P( – 3σ  X 

 Entre

+ 2σ se encuentra el λ5.45% de las observaciones, puesto que:

+ 5σ se encuentra el λλ.999942% de las observaciones. Es decir

  5       5   Z + 5σ) = P    P  5  Z  5     = Φ (5) - Φ (-5) = 0.99999971 – 0.00000029 = 0.99999942

– 6σ y

decir que: P( – 6σ  X 

+ 6σ se encuentra el λλ.9999998% de las observaciones. Es

  6       6   Z  + 6σ) = P    P  6  Z  6    

= Φ (6) - Φ (-6) = 0.999999999 – 0.000000001 = 0.999999998 1.3 PROPIEDAD REPRODUCTIVA DE LA DISTRIBUCIÓN NORMAL Sean X1 , X2 , .... , Xn , n variables aleatorias independientes distribuidas normalmente con media

i

y varianza σi2 .

Es decir: Xi ~ N( i , σi2 ) i = 1, 2, 3,

.... , n . Si Y es una combinación lineal de las v.a. Xi : Y = a0 + a1 X1 + a2 X2 + .... + an Xn . Entonces, la variable aleatoria Y ~ N [a0 +  ai i , n

i 1

9

a  n

i 1

2

i

2 i

]

Puesto que: 

Y

= E(Y) = E (a0 + a1 X1 + a2 X2 + .... + an Xn ) = = E(a0 ) + E (a1 X1 ) + E (a2 X2 ) + .... + E (an Xn ) = = a0 + a1 E(X1 ) + a2 E(X2 ) + .... + an E(Xn ) = = a0 +  ai i n

= a0 + a1

1 + a2

2 + .... + an

n

i 1

2   Y = V(Y) = V (a0 + a1 X1 + a2 X2 + .... + an Xn ) =

= V(a0 ) + V(a1 X1 ) + V(a2 X2 ) + .... + V(an Xn ) = = 0 + a12 V(X1 ) + a22 V(X2 ) + .... + an2 V(Xn ) = = a12 σ12 + a22 σ22 + .... + a2n σn2 =

a  n

i 1

2

i

2 i

1.4 TEOREMA DEL LÍMITE CENTRAL Sean X1 , X2 , .... , Xn , n variables aleatorias independientes con media y varianza finitas dadas por: E(Xi) =

i

y V(Xi ) = σi2 .

X n

Si:

Yn = X1 + X2 + .... + Xn =

i 1

i

, entonces bajo ciertas condiciones generales,

la variable aleatoria Zn definida por:

Y  E (Yn ) Zn  n  V (Yn )

 X   n

i 1

n

i

i 1



i

n

i 1

2

i

tiene aproximadamente una distribución normal estándar N(0, 1). Nota.

E(Yn ) = E (X1 + X2 + .... + Xn ) = E (X1 ) + E (X2 ) + .... + E (Xn ) = 10

=

1 +

2 + .... +

 n

n

=

i 1

i

.

 V(Yn ) = V (X1 + X2 + .... + Xn ) = V(X1 ) + V(X2 ) + .... + V(Xn ) =

 n

= σ12 + σ22 + .... + σn2 =

i 1

2 i

.

Observaciones.-

X n

1. La variable aleatoria Yn =

i 1

i

(suma de v.a. independientes) puede ser

aproximada por una v.a. distribuida normalmente, cualquiera que sea la distribución de las Xi . 2. Las condiciones generales indicadas en el teorema están referidas a que los términos Xi tomados individualmente, contribuyen con una cantidad despreciable a la variación de la suma, y no es probable que un simple término tenga una gran contribución a la suma. Una aplicación importante de estas condiciones generales del teorema central del límite, se da en los modelos de regresión: Yi = β0 + β1 X1i + β2 X2i + .... + βk Xki + ei Donde la variable explicada o dependiente Y es función de un conjunto de variables explicativas o independientes (X1 , X2 , .... , Xk ) más un error e. La aplicación del teorema central del límite se da cuando se asume que los errores ei se distribuyen normalmente, debido a que estos errores recogen la suma de las contribuciones despreciables de todas las variables dejadas de considerar en el modelo. Por ejemplo, en los modelos de demanda Qi = a – b Pi + ei , se asume que las cantidades demandadas (Q) de un bien o servicio dependen fundamentalmente del precio (P) del bien. Efectivamente, pero existen otras variables independientes (gastos de publicidad, precio del bien sustituto, gustos y preferencias, etc.) que también podrían explicar dicha demanda, sin embargo, sus contribuciones a explicar la demanda son despreciables, por lo que la suma de sus contribuciones, reflejadas en los errores ei se aproximan a la distribución normal.

11

3. Una situación especial del teorema central del límite se presenta cuando cada Xi tiene la misma distribución (que es el caso de la definición de muestra aleatoria, como veremos más adelante) y que permita encontrar la distribución de una media muestral. La propuesta es la siguiente: Sean X1 , X2 , .... , Xn , n variables aleatorias independientes, idénticamente distribuidas con media y varianza común y finitas dadas por: E(Xi) = y V(Xi ) = σ2.

X n

Si:

Yn = X1 + X2 + .... + Xn =

Y  E (Yn )  Zn  n V (Yn )

por :

i 1

X n

i 1

i

i

, entonces la variable aleatoria Zn dada

 n

 n



Xn   / n

tiene aproximadamente distribución normal estándar N(0 , 1). Donde X n  es la media muestral de las Xi . Nota.

E(Yn ) = E (X1 + X2 + .... + Xn ) = E (X1 ) + E (X2 ) + .... + E (Xn ) = =

+

+ .... +

= n

.

 V(Yn ) = V (X1 + X2 + .... + Xn ) = V(X1 ) + V(X2 ) + .... + V(Xn ) =

= σ2 + σ2 + .... + σ2 = n σ2

12

1 n  Xi n i 1

1.5 EJERCICIOS RESUELTOS 1.

Sea Z una variable aleatoria con distribución normal estándar [Z ~ N(0, 1)]. Hallar las probabilidades siguientes: a) P(Z > 1.13) ; b) P(1.00 < Z < 1.42) c) P(-1.5 < Z < 0.50) ;

d) P(-1.65 < Z < -1.00) ;

e) P(Z < -1.52) ;

f) P(0 < Z < 1.25) y g)

P(-1.63 < Z < 0). Solución.-Usando la tabla 1 del anexo se tiene: a) P(Z > 1.13) = 1 - P(Z ≤ 1.13) = 1 – Φ(1.13) = 1 – 0.8708 = 0.1292 b) P(1.00 < Z < 1.42) = Φ(1.42) - Φ(1.00) = 0.λ222 – 0.8413 = 0.0809 Para obtener los gráficos en Minitab ver Bazán, Juan (2010)

0.4

0.4

0.6247 0.3

Densidad

Densidad

0.3

0.0809

0.2

0.1

0.1

0.0

0.2

0 Z

0.0

1 1.42

-1.5

0

0.5

P(-1.5  Z < 0.5) Z

En Minitab: P(1.00 < Z < 1.42)

c) P(-1.5  Z < 0.5) = Φ(0.50) - Φ(-1.5) = 0.6915 – 0.0668 = 0.6247 d) P(-1.65  Z  -1.00) = Φ(-1.00) - Φ(-1.65) = 0.1587 – 0.0495 = 0.1092 e) P(Z < -1.52) = Φ(-1.52) = 1 - Φ(1.52) = 1 – 0.9357 = 0.0643 f) P(0  Z  1.25) = Φ(1.25) - Φ(0) = 0.8944 – 0.5000 = 0.3944 g) P(-1.63 < Z  0) = Φ(0) - Φ(-1.63) = 0.5000 – 0.0516 = 0.4484 2.

Sea Z una variable aleatoria normal estándar [Z ~ N(0, 1)]. Hallar el valor de z para los casos siguientes: a) Φ(z) = 0.λ500;

b) Φ(z) = 0.9772;

c) Φ(z) =

0.9987; d) el área entre –z y z es 0.95; e) el área a la izquierda de z es 0.01; y f) el área a la derecha de z es 0.05.

13

Solución a) Sí Φ (z) = F (z) = P [Z  z] = 0.9500, esto implica que, en la tabla 1, a la probabilidad 0.9500, le corresponde z = Z0.9500 = 1.645 aproximadamente. b) Sí Φ (z) = F (z) = P [Z  z] = 0.9772, esto implica que, en la tabla 1, a la probabilidad 0.9772, le corresponde z = Z0.9772 = 2.00 aproximadamente. c) Sí Φ (z) = F (z) = P [Z  z] = 0.9987, esto implica que, en la tabla 1, a la probabilidad 0.9987, le corresponde z = Z0.9987 = 3.00aproximadamente. d) Si 0.95 = P [-z  Z  z] = Φ (z) - Φ (-z) = Φ (z) – [1 - Φ (z)] = 2 Φ (z) – 1. Entonces, Φ (z) = 0.9750 y en la tabla le corresponde a z = Z0.9750 = 1.96. e) Si 0.01 = Φ (z) = P [Z  z], esto implica que, en la tabla 1, a la probabilidad 0.01, le corresponde z = Z0.01 = -2.33 aproximadamente. f) Si 0.05 = P [Z ≥ z] = 1 - Φ (z), entonces Φ (z) = 0.9500 y de acuerdo a lo visto en la parte a) de este problema le corresponde a z = Z0.9500 = 1.645. 3.

El monto de las solicitudes de préstamo de los comerciantes que recibe un Banco, está distribuido aproximadamente en forma normal con

= S/. 10,000 y

σ = S/. 1,000. Calcule e interprete la probabilidad de que el monto del préstamo solicitado: a) Esté entre S/. 8,500 y 12,000; b) Sea menor que S/. 8,000; c) Mayores de que cantidad será el 20 % de los préstamos? Solución Sea X = monto de las solicitudes de préstamo. Se sabe que X ~ N(10000 , 10002),

entonces

Z = (X – 10000)/ 1000 ~ N(0,

1). Luego, las probabilidades solicitadas son:

 8500  10000 X  10000 12000  10000    a) P(8500 ≤ X ≤ 12000) = P   = 1000 1000 1000  = P(-1.5 ≤ Z ≤ 2.0) = Φ(2.00) - Φ(-1.50) = 0.97725 – 0.06681 = 0.91044 Rpta. Interpretación: el 91.04% de los montos de préstamo solicitados por los comerciantes fluctúa entre S/. 8,500 y 12,000. 14

 X  10000 8000  10000   b) P(X ≤ 8000) = P   = 1000  1000 = P(Z ≤ -2.0) = Φ(-2.00) = 0.02275 Rpta. Interpretación: el 2.28% (ó en 228 de cada 10000 solicitudes) de los montos de préstamo solicitados por los comerciantes es menor a S/. 8,000. Distribución del monto de préstamo Normal, Media=10000, Desv.Est.=1000 0.0004

Densidad

0.0003

0.0002

0.0001 0.0228 0.0000

8000

10000 X = monto del préstamo

Resultado gráfico en Minitab c) Sea C la cantidad de préstamo buscada, entonces:

C  10000   0.20 = P(X > C) = 1 - P  Z   1000    C  10000  0.80 =     1000 



C  10000  Z 0 . 8 0 0.84 1000

 C = S/. 10840

Rpta. Interpretación: el 20% de los montos de préstamo solicitados por los comerciantes es mayor a S/. 10,840.

15

Distribución del monto de préstamo Normal, Media=10000, Desv.Est.=1000 0.0004

Densidad

0.0003

0.0002

0.20

0.0001

0.0000

4.

10000 10840 X = monto del préstamo

Para cierto examen la calificación vigesimal tiene distribución normal con media 11 y desviación estándar 2. Se desea desaprobar al 40% de los examinados. ¿Cuál debe ser la calificación máxima desaprobatoria? Interprete el resultado. Solución Sea X = calificación vigesimal de los examinados. Se sabe que X ~ N(11 , 22),

entonces

Z = (X – 11)/ 2 ~ N(0, 1).

Sea M la máxima nota desaprobatoria buscada, entonces:

M  11    M  11  0.40 = P(X < M) = P  Z   =  2  2    



M  11  Z 0.40  0.25  M = 10.5 Rpta. 2

Interpretación: el 40% de los examinados desaprobados tiene nota menor a 10.5. 5.

Los ingresos de los trabajadores tiene distribución normal con media µ= S/. 1000 y desviación estándar σ = S/. 200. Si se selecciona a 2000 de estos trabajadores, calcule e interprete: a) ¿Cuántos trabajadores tienen ingreso menor a S/. 600? b) ¿Cuántos trabajadores tienen ingreso entre S/. 850 y 1300? Solución

16

Si X = ingreso de los trabajadores ~ N(1000, 2002), Z = (X – 1000)/ 200 ~ N(0, 1). Para determinar cuántos de los n = 2000 trabajadores tienen ingresos en los intervalos dados, primero se determina la probabilidad P y después multiplica por n. Se pide:

 X  1000 600  1000  a) P = P(X < 600) = P    = P(Z < -2.0) = Φ(-2.0) = 200  200  0.02275 Luego nP = 0.02275 x 2000 = 45.5 trabajadores Rpta. Interpretación: 46 trabajadores (2.28%) tienen ingreso menor a S/. 600.

 850  1000 X  1000 1300  1000    b) P = P(850 ≤ X ≤ 1300) = P   = 200 200  200

= P(-0.75 ≤ Z ≤ 1.5) = Φ(1.5) - Φ(-0.75) = 0.93319 – 0.22663 = 0.70656 Distribución del ingreso Normal, Media=1000, Desv.Est.=200 0.0020

0.0015

Densidad

0.7066 0.0010

0.0005

0.0000

850

1000 X = ingreso

1300

Luego nP = 0.70656 x 2000 = 1413.12 trabajadores Rpta. Interpretación: alrededor de 1413 trabajadores (70.66%) tienen ingreso entre S/. 850 y 1300. 6.

El volumen de negociaciones diarias (en millones de nuevos soles) para las acciones comercializadas en la bolsa de Lima tiene distribución normal con media µ= 800 y desviación estándar σ = 100. En un período de 60 días, calcule e interprete: a) ¿En cuántos días el volumen de negociaciones es de 600 o menos millones? b) ¿En cuántos días el volumen de negociaciones es mayor de 900 millones? 17

Solución Si X = volumen diario de negociaciones en millones de S/. ~ N(800, 1002)

 Z = (X – 800)/ 100 ~ N(0, 1).

Para determinar en cuántos de los n = 60 días el volumen de las negociaciones está en los intervalos dados, primero se determina la probabilidad P y después multiplica por n. Se pide:

 X  800 600  800  a) P = P(X ≤ 600) = P    = P(Z < -2.0) = Φ(-2.0) = 100   100 0.02275 Luego nP = 0.02275 x 60 = 1.4 días Rpta. Interpretación: en alrededor de 1.4 días (2.28%) el volumen de negociaciones es de 600 o menos millones de nuevos soles.

 X  800 9...


Similar Free PDFs