Soluciones Examen Enero 2021 estadistica Jose Maria Matias PDF

Title Soluciones Examen Enero 2021 estadistica Jose Maria Matias
Course Matemáticas: Álxebra e estatística
Institution Universidade de Vigo
Pages 8
File Size 298.5 KB
File Type PDF
Total Downloads 100
Total Views 143

Summary

Soluciones examen enero 21. Hecho por el profesor Jose Maria Matias de la escuela de igenieros del campus...


Description

Dpto. de Estadística - E. Ing. Industrial - Grados - Universidad de Vigo

1

Estadística 2020-2021. Soluciones examen 22/01/2021 Ejercicio 1. (1.5 puntos) Una empresa del sector TIC trabaja con tres compañías proveedoras de servicios Cloud, de tal forma que el del tiempo utiliza los servicios de la compañía Alfa, el los servicios de la compañía Beta, y el resto del tiempo la infraestructura de la compañía Delta. Se sabe que cuando selecciona la compañía A, la probabilidad de que no se pueda establecer comunicación, por averías o saturación es de : , al seleccionar la compañía B esta probabilidad es de : , y con la compañía D es de : .

30%

60%

0 002 0 005

0 001

(a) (0.5 puntos) Calcule la probabilidad de que no se pueda establecer comunicación. (b) (0.5 puntos) Supongamos que un empleado selecciona al azar una compañía y no se puede realizar la comunicación. ¿Cuál es la probabilidad de que se hubiese seleccionado la compañía Alfa o la Delta? (c) (0.5 puntos) ¿Cuál es la probabilidad del suceso: que se utilicen los servicios de la compañía Alfa o se pueda establecer la comunicación? Nota: Defina con detalle los sucesos empleados para resolver el ejercicio y escriba matemáticamente las probabilidades del enunciado. Soluciones: a) : ; b) : ; c) : . Solución Sean los sucesos A; B; D; correspondientes a las tres compañías. Entonces se sabe que: P A : ; P B : , P D P A[B P A P B

0 0017 0 6471 0 9989

( )=03 ( )=06 ( )=1 ( ) = 1 [ ( ) + ( )] = 109=01 Sea el suceso : "no se puede establecer comunicación", luego ( j ) = 0 002 ( j ) = 0 001 ( j ) = 0 005 :

: :

N

P

N B

:

P

; P

N D

:

N A

:

a. P

( )= ( \ )+ ( \ )+ ( \ ) = ( j ) ( )+ ( j ) ( )+ ( j ) ( ) = 0 002  0 3 + 0 001  0 6 + 0 005  0 1 = 0 0017 N

P

A

N

P

N A

:

P

P

A

:

B

N

P

:

P

D

N B

P

B

:

:

N

P

N D

P

:

:

b. P

( [ j )= ( j )+ ( j ) = ( j () ) ( ) + ( j ( ) ) ( ) + 0 005  0 1 = 0 6471 = 0 002  0030017 A

D N

P

A N

P

N A P

:

P

P

D N

P

A

N D P

N :

:

:

P



A

[ N



D

:

:

c.

P

N

= ( ) +      \  = 0 3 + (1  0 0017)  0 2994 = 0 9989 P

:

A

P

N

:

P

A :

N

:

D

:

;

Dpto. de Estadística - E. Ing. Industrial - Grados - Universidad de Vigo

ya que: P

 \  =   j  A

N

P

= (1

N A



P

(A) = [1





P

(N

j

A)] P

2

( A)

0:002) 0:3 = 0:2994

Ejercicio 2. (1.5 puntos) La función de distribución de una variable aleatoria continua, X; es: 0 se x < 2 3 k x +8 se 2 x 2 F ( x) = 1 se x > 2

j 1

X <

1) =

P

(





P

1

23 + 8 ,

k

< X <

(X

1)

=

F

  

<

1)

k

=

(1)

1 16

 

F

1 3 1 3 16 ( 1) + 8 16 1 + 8 = 1 3 16 (1 + 8)

c. La función de densidad es: f

( x) =

dF dx

(x

8 < 01 )= : 016 3

x

2

   

si x < 2 si 2 x si x > 2

(

F

1)



(1)

= 0:2222

2

Dpto. de Estadística - E. Ing. Industrial - Grados - Universidad de Vigo

3

y 0.6

0.4

0.2

-5

-4

-3

-2

-1

0

1

2

3

4

5

x

que es simétrica, luego su media y su mediana serán cero:

E (X ) =

Z2

2

xf

3 2 = 16 4

4

05= ( :

F

x0:5

Z2 3 16 !2 4

() = x

dx

x

2

x dx

 (42) = 0

 ) = 161

3

x0:5

+ 8 ) 8 =

x

 4 2 = 163 4

3 0:5

x

2

+8)

x0:5

=0

Ejercicio 3. (2 puntos) La cantidad de gas natural consumida anualmente por hogar en determinada región sigue una distribución normal de media m3 y desviación 3 típica de m .

800

100

(a) (0.5 puntos) ¿Qué cantidad de gas, como máximo, debe consumir como máximo un hogar para estar entre el de los que menos consumen?

20%

6 900

(b) (0.5 puntos) Si elegimos aleatoriamente hogares, cuál es la probabilidad de que a lo sumo de ellos consuman más de m3 .

2

(c) (0.5 puntos) Calcule la probabilidad de que haya que elegir al menos hasta encontrar uno que consuma menos de m3 al año.

750

(d) (0.5 puntos) ¿Cuál es la probabilidad de que el consumo total de seleccionados al azar, sea superior a m3 ?

19300

3 hogares

25 hogares,

Nota: Defina con detalle las variables aleatorias que intervienen en cada apartado e indique qué distribución sigue cada una de ellas. Solución Sea X "cantidad (m3 ) de gas consumida por un hogar cualquiera", X ;  con  m3 ,  m3 .

: = 800

= 100

N( )

Dpto. de Estadística - E. Ing. Industrial - Grados - Universidad de Vigo

02= :

P

02= (

 ), luego se trata del cuantil  

   (  )=     = ( 

a. Se pide el valor x tal que

:

P

x0:2

X

X

P

x

X



x0:2

x0:2

:







) ) 0 2 =  0 2 + = 100  (0 84) + 800 = 716 pues según las tablas de la normal, 0 2 =  0 8 = 0 84 Sea : "número de hogares en 6, que consumen másde 900900m3800 ". Entonces  B ( ) con = 6 = ( 900) = = 1 100 (  1) = 1  0 84134 = 0 15866: X2 60 15866 (1  0 15866)6 = 0 945 18 (  2) = =

P

x0:2

Z



P



x :



z :

Z



z0:2 :

z :

b.

4

z :

:

:

Y

Y

P

n; p

Z

n

; p

:

P

P

X >

P

Z >

:

Y

y

=0

y

:

y

y

:

:

m3 ".  = (  750 0 5) = = ( 750) =   ( 0 5) = 1  (  0 5) = 1  (0 5) = 1  0 69146 = 0 30854 (  3) = 1  ( 3) = 1  (  2)  = 1  [ ( = 1) + ( = 2)] = 1  0 +  = 1  (0 30854 + (1  0 30854) 0 30854) = 0 47812 P con = 25 Sea : "consumo total de 25 hogares". Entonces = =1 satisface p = 100  pN25(= 500 ) con = = 25  800 = 20000 m3 y =  19300  20000 ( 19300) = = ( 1 4) 500 = (  1 4) = (1 4) = 0 91924

:

c. Sea M "número de hogares a elegir hasta que uno consuma menos de 750800 P Z M G p con p P X < P Z 100

 ()

P

Z >

P

:

P

M

Z

:

P

F

:

P

M

M <

P

P

M

:

d.

:

M

q p

:

:

U



U ; U

U

qp

:

n

U

U

:

:

i

Xi

n

n

U

n

P

U >

P

P

Z >

Z

P

:

F

:

Z >

:

:

Ejercicio 4. (1.5 puntos) Un vendedor de bandas elásticas afirma que éstas resisten un estiramiento producido por un peso promedio de kg. Se realiza una prueba con de estas bandas observándose un valor promedio de la resistencia al estiramiento de : kg. con una cuasidesviación típica de : kg. Suponiendo normalidad en la variable:

5 170 4

180

57

(a) (0.5 puntos) Construya un intervalo de confianza para el verdadero valor de la resistencia media al estiramiento con un nivel de confianza del :

95%

(b) (0.5 puntos) ¿Existen evidencias significativas para afirmar que el valor promedio es inferior al afirmado por el vendedor? Nivel de significación: : (especifique las hipótesis nula y alternativa, el estadístico de contraste, la regla de decisión y el resultado del contraste).

0 05

Dpto. de Estadística - E. Ing. Industrial - Grados - Universidad de Vigo

5

6

(c) (0.5 puntos) En base a estudios anteriores se ha asignado un valor de kg a la desviación típica poblacional. ¿Cuántas bandas deberíamos al menos analizar si queremos que, con un nivel de confianza del , la longitud del intervalo de confianza sea inferior a kg?

90%

4

Solución X "peso (kg) soportado por una banda al azar", X ;  con  y sconocidas. Una muestra aleatoria de tamaño n produce una media de x kg y una cuasidesviación típica de S : kg. Se tiene que:

:

=57 

X

a.

p  

S=

 N( )

=5

n

tn



de-

 = 170 4 :

1

1  = 0 95 ) = 0 05 ) 2 = 0 025 ) 1  2 = 1  0 025 = 0 975 

:



I E;1

:





I E;0:95

=

=  x

tn

:

1 1  ;

2

=

:

:

p

S n

=   4 0 975 p = 170 4  2 776  p5 75 = 170 4  7 0764 = (163 32 177 48) S

x

t ; :

:



b. Hipótesis del test:

= 180

H0 H1

:

:

n

:

(a) Suponemos 

=

:

: :



:

:

;

:

 180

 <

180

Al ser  desconocida, el estadístico del test es:



X

S=

p = 5 7p1805  X



n

: =

t4

cuyo valor en la muestra es: t

= 1705 47 p180 5 = 3 766 :

:

: =

(b) Decisión:



-value= ( 4 3 766) ( 3 747) = ( 3 747) = 1  0 99 = 0 01 = 0 05 ) Se rechaza 0 : la resistencia media es inferior a 180 kg.  La región crítica es = f 4 0 05g = f  4 0 95g = (1 2 132) Como = 3 766 2 se rechaza 0 Ahora se supone que = 6 kg conocida. Luego el estadísto a utilizar es normal p 4 2 = 2 = max kg, se tiene para estándar. Dado que  = 1 2 1  2 = 1  0 1 2 = 0 95:   2  = 1max2  = 1 6452  6 = 24 35 ! = 25 p

P

:

t

<

:

:

< 

< P

R

t

c.

:

t <

:

P

:

t < t ; :

R ;

t <

t ; :

H :



z

=

: =

z

n

=  =

n <

=

:

=



t >

:

H

:

:

n

;

:

:

Dpto. de Estadística - E. Ing. Industrial - Grados - Universidad de Vigo

6

Ejercicio 5. (1.5 puntos). Con objeto de conocer las diferencias salariales entre hombres y mujeres en España, se recogieron muestras representativas de salarios en las distintas comunidades autónomas, para diferentes tramos de edad, obteniéndose un conjunto de n = 72 observaciones de las variables X , "edad media (años) del tramo de edad al que pertenecen los trabajadores", e Y; "diferencia media de salarios (miles de e) entre hombres y mujeres", que produjeron los siguientes resultados (Fuente: INE, encuesta estructura salarial, serie 2008-2016):

Xn = 262 88  = 44;  = 5 59; 2x = 145 81; 2y = 4 81; 1 i i

x

y

:

s

:

s

:

n

i=1

x y

:

donde sx2 e s2y son las varianzas muestrales respectivas de X e Y: (a) (0.5 puntos) Calcula la recta de regresión de Y sobre X , indicando las fórmulas utilizadas. Interprete los coeficientes obtenidos indicando sus unidades. ¿Cuál es la diferencia salarial media entre hombres y mujeres a la edad de 30 años? (b) (0.5 puntos) Calcule el coeficiente de correlación lineal entre ambas variables. Analice la bondad del ajuste e interprétela en lo que respecta a la influencia de la edad sobre la diferencia salarial media entre hombres y mujeres. (c) (0.5 puntos) ¿Podemos afirmar, a nivel de significación  = 0:05, que existe una relación lineal positiva significativa entre la edad y la diferencia salarial entre sexos? Suponiendo normalidad, media cero y varianza constante de los errores de la regresión lineal, realice el contraste de hipótesis adecuado. Especifique las hipótesis, el estadístico de contraste, la regla de decisión, y el resultado del contraste. Solución.

 = n1 PPin=1 i = 5 59  = n1 PPni=1 i = 44 n n 1 2 = 1  2 = 4 81 X n p i=1 2ip 2 = 145 81 Y2 = n p i=1 i2 p 2 2 X = + X = 145 81 = 12 075 Y = + Y = 4 81 = 2 1932 Xn    = 262 88  44  5 59 = 16 92 =1

a. Los valores muestrales son: x

x s

s

:

:

s

S

y

y

x

x

XY

n

i=1

s

:

i i

x y

s

xy

:

y

:

= 0+ 

:

:

S

La estimación de los coeficientes de la recta y

1 x

:

:

son:

^ = XY2 = 16 92 = 0 116 miles e/año de edad 145 81 X ^0 =   ^1  = 5 59  0 116  44 = 0 486 miles e Intepretación de ^1 : Es la pendiente de la recta. Al ser su signo positivo, 1



(a)

:

y

S

:

S

y

:

:

 x

:

:

:



la relación entre ambas variables es positiva. Por cada año adicional de edad en los asalariados, la diferencia salarial entre hombres y mujeres se incrementa por término medio en ^1 = 0:116 miles e.

Dpto. de Estadística - E. Ing. Industrial - Grados - Universidad de Vigo

^:

7

(b) Interpretación de 0 Es la ordenada del punto de corte entre la recta y el eje Y; es decir, el valor de y cuando x : En nuestro caso sería la diferencia salarial entre asalariados de años, lo que no tiene significado real.

=0

0

La media pedida es:

j = ^ + ^ ) j = 30 = 0 486 + 0 116  30 = 3 966 miles e

y x

0

1 x

y x

:

b. El coeficiente de correlación es: r

XY

=

XY X SY

:

= p145168192p4 81 = 0 6389 :

S S

:

:

:

:

La bondad de ajuste se determina mediante el coeficiente de determinación: R

40 82%

2

=

r

= 0 63892 = 0 4082

2

XY

:

:

es decir, el : de la variabilidad de Y está explicada linealmente por X: El ajuste no puede considerarse bueno lo que puede indicar que, o la relación no es realmente lineal, o que hay otros factores además de la edad que explican las diferencias salariales entre hombres y mujeres, o ambas cosas en alguna medida.



c. Realizamos el siguiente contraste: H0 H1

: :

1

0

1 >

0

Al ser los errores normales de media cero y varianza constante, utilizamos el estadístico:

  n  p = p e = p 2p9279 = 0 0167 72 145 81 X ^

1

1

t

S^

2

1

donde

1

S^

ya que

S

:

:

nS

:

Xn i = 1  





= 1  2 Y2 i=1 = (1  0 4082)  72  4 81 = 204 95 n 95 ) e2 = 1 2 i2 = 204 72  2 = 2 9279

SSe =

e

2

R

X

:

S

i=1

n

(a) Suponemos cierto H0

2

SSY :

R

nS

:

:

e

:

: 1 = 0 con lo que el estadístico es: ^1  1 ^1 = 0 0167  70 ^1 





S



:

t

Dpto. de Estadística - E. Ing. Industrial - Grados - Universidad de Vigo

8

(b) El valor del estadístico en la muestra es: t

=

y la región crítica es R

2

^ 0:116 1 = = 6:9461 0:0167 0:0167 =

f

g f g 1 por lo que se rechaza

t > t70;0:95

=

t >

1:667

(c) Decisión: t = 6:9461 R = (1:667; ) H0 , con lo que 1 > 0; lo que significa que existe relación lineal positiva entre X e Y a nivel poblacional. El p-valor es P (t70 > 6:9461) 0 <  = 0:05; con lo que también se rechaza H0 :

...


Similar Free PDFs