Inferencia paramétrica: estimación de parámetros- Parte 2 PDF

Title Inferencia paramétrica: estimación de parámetros- Parte 2
Course Estadística
Institution Universitat Politècnica de València
Pages 10
File Size 453.4 KB
File Type PDF
Total Downloads 95
Total Views 146

Summary

Download Inferencia paramétrica: estimación de parámetros- Parte 2 PDF


Description

Nieves Martínez-Alzamora

2. Intervalos de confianza en poblaciones normales

Las técnicas de Inferencia estadística permiten obtener conclusiones acerca de una población en base a muestras aleatoriamente seleccionadas. Las conclusiones obtenidas tendrán siempre un margen de error controlado directamente relacionado con el tamaño de la muestra. Si F(x) es la función de distribución de la v.a. en estudio puede ocurrir que F(x) pertenezca a una familia conocida cuyos parámetros se ignoran. En este caso, es posible estimar estos parámetros desconocidos con un margen de error que vendrá determinado por la amplitud del intervalo de confianza.

Ejercicio 4: Obtención de intervalos de confianza partiendo de observaciones De un lote grande de barras de acero para las armaduras del hormigón armado se ha procedido a extraer una muestra aleatoria de 100 barras. Las barras fueron sometidas a carga de tracción hasta su rotura y los resultados obtenidos están almacenados en la variable CARGAS. ( ( ( ( ( ( ( ( ( ( ( ( ( ( ( ( ( (

1) 2) 3) 4) 5) 6) 7) 8) 9) 10) 11) 12) 13) 14) 15) 16) 17) 18)

4004.03 3950.35 3937.13 4068.57 4068.61 4009.14 4086.46 3944.58 4003.55 3901.58 4035.64 4144.37 3929.48 3963.12 4055.39 4036.33 3976.66 4111.01

( ( ( ( ( ( ( ( ( ( ( ( ( ( ( ( ( (

19) 20) 21) 22) 23) 24) 25) 26) 27) 28) 29) 30) 31) 32) 33) 34) 35) 36)

4138.77 4019.5 3909.88 3962.88 3981.32 4056.29 4086.27 4004 3977.15 4069.92 4019.07 4027.45 3903.28 3999.94 4057.59 3927.89 3857.55 3959.24

( ( ( ( ( ( ( ( ( ( ( ( ( ( ( ( ( (

37) 38) 39) 40) 41) 42) 43) 44) 45) 46) 47) 48) 49) 50) 51) 52) 53) 54)

3930.92 4053.6 4035.63 3952.98 3922.28 3871.57 4153.18 3998.25 4055.4 4091.27 4019.5 3975.54 3970.48 4043.43 4067.22 3941.72 3944.47 3982.94

( ( ( ( ( ( ( ( ( ( ( ( ( ( ( ( ( (

55) 56) 57) 58) 59) 60) 61) 62) 63) 64) 65) 66) 67) 68) 69) 70) 71) 72)

4049.85 3979.03 4023.75 4030.04 4174.64 4102.09 4085.67 4004.11 4101.21 4003.45 3919.27 4002.66 4035.08 3998.33 4012.05 3894.06 3953.96 3884.71

( ( ( ( ( ( ( ( ( ( ( ( ( ( ( ( ( (

73) 74) 75) 76) 77) 78) 79) 80) 81) 82) 83) 84) 85) 86) 87) 88) 89) 90)

3888.93 4060.71 4041.14 4030.17 3988.13 4042.99 4020.26 4103.15 4093.22 3978.52 3940.63 3907.46 3989.19 4041.85 4035.26 3976.64 3996.27 3991.01

( 91) ( 92) ( 93) ( 94) ( 95) ( 96) ( 97) ( 98) ( 99) (100)

4084.23 4032.49 3920.3 3963.96 3938.89 4130.96 4023.4 4021.4 4000.9 3908.46

a) Representar los datos sobre papel probabilístico normal ¿Es adecuado el modelo normal para describir la distribución de la variable CARGA? ¿Por qué? Statgraphics: Desplegar el menú Describir, el submenú Datos Numéricos y elegir la opción Análisis de una variable. Activar en la barra de herramientas del Statfolio la opción gráfica Gráfico de Probabilidad normal . Sí que es adecuado el modelo normal puesto que, a pesar de que los valores extremos se desvían de la recta del papel probabilístico normal, la mayoría de los valores se amoldan correctamente a la forma de la recta.

10

Nieves Martínez-Alzamora

Gráfico de Probabilidad Normal

99,9 n:100 99

Mediana:4 Sigma:70,4

95

W:0,981658 P:0,6153

porcentaje

80 50 20 5 1 0,1 3800

3900

4000

4100

4200

CARGAS

b) Obtener mediante estadísticos una estimación puntual de los parámetros del modelo normal. Statgraphics: Activar en la barra de herramientas del Statfolio la opción de Tablas Resumen Estadístico Resumen Estadístico para CARGAS Recuento 100 Promedio 4005,98 Desviación Estándar 67,3077 Coeficiente de Variación 1,68018% Mínimo 3857,55 Máximo 4174,64 Rango 317,09 Sesgo Estandarizado 0,406733 Curtosis Estandarizada -0,703187

c) Calcular un intervalo de confianza al 95% para cada uno de los parámetros del modelo normal ¿Qué propiedad tienen estos intervalos? Statgraphics: Activar en la barra de herramientas del Statfolio la opción de Tablas Intervalos de confianza Intervalos de confianza del 95,0% para la media: 4005,98 +/- 13,3553 [3992,63; 4019,34] Intervalos de confianza del 95,0% para la desviación estándar: [59,0966; 78,1896] Estos intervalos contendrán la media verdadera o la desviación estándar verdadera de la población de la que fueron extraídas las muestras, el 95,0% de las veces. En términos prácticos, puede establecerse con 95,0% de confianza, que la media verdadera de CARGAS se encuentra en algún lugar entre 3992,63 y 4019,34, en tanto que la desviación estándar verdadera está en algún lugar entre 59,0966 y 78,1896.

11

Nieves Martínez-Alzamora

d) Calcular un intervalo de confianza al 99% para cada uno de los parámetros del modelo normal ¿Qué variación experimentan los intervalos al aumentar el nivel de confianza?¿Por qué? Statgraphics: Pulsar el botón derecho del ratón, elegir Opciones de ventana y cambiar el nivel de confianza del intervalo Intervalos de confianza del 99,0% para la media: 4005,98 +/- 17,6778 [3988,31; 4023,66] Intervalos de confianza del 99,0% para la desviación estándar: [56,8061; 82,118]

Al aumentar el nivel de confianza, los intervalos de confianza amplían su rango. Esto es debido a que queremos que la probabilidad de que los valores poblacionales se encuentren dentro del intervalo, por lo que al aumentar la confianza aumenta consecuentemente la amplitud del intervalo.

Ejercicio 5: Obtención de intervalos de confianza partiendo de estadísticos Los pesos de unas piezas siguen una distribución normal de parámetros desconocidos. En el último muestreo se han pesado 20 unidades. El promedio de los valores obtenidos ha sido 3’8g y la desviación típica (cuasi-desviación típica) 0’4g. Obtener un intervalo de confianza al 95% para la media poblacional y un intervalo de confianza al 90% para la desviación típica poblacional. Statgraphics: Desplegar el menú Describir, el submenú Datos Numéricos y elegir la opción Pruebas de hipótesis. Indicar el parámetro a estimar, el valor del tamaño muestral y los estadísticos obtenidos. Seleccionar en Opciones como hipótesis alternativa No igual y elegir el valor de α. Intervalos de confianza del 95,0 % para la media: 3,8 +/- 0,187206 [3,61279;3,98721] Intervalos de confianza del 90,0 % para sigma: [0,31757;0,548164]

Si nos dicen intervalo confianza 90%, alpha=10%.

Ejercicio 6: Obtención de intervalos de confianza partiendo de estadísticos Los pesos de unas piezas siguen una distribución normal con desviación típica 0’2gr. Se realiza periódicamente un control de calidad para controlar el peso medio que debe ser igual a 10gr. En la última revisión se han pesado 15 unidades y el peso medio ha sido 10’23g. Obtener un intervalo de confianza al 95% para la media poblacional ¿Entra el valor 10 dentro del rango de posibles valores para la media poblacional? Statgraphics: Seleccionar en Opciones usar la prueba z, ya que la varianza poblacional es conocida Intervalos de confianza del 90,0 % para la media: 10,23 +/- 0,08494 [10,1451;10,3149] El valor 10 no se encuentra dentro del intervalo.

12

Nieves Martínez-Alzamora

Usar prueba z si la sigma establecida es la poblacional.

Ejercicio 7: Intervalos de confianza para comparar dos poblaciones Las técnicas de Inferencia Paramétrica bipoblacional permiten comparar la distribución de una v.a. en dos poblaciones normales diferentes. Para ello se calculan intervalos de confianza para la diferencia de medias o para la razón de varianzas. Vamos a verlo en el siguiente ejemplo, Dos analistas tomaron repetidas lecturas de la acidez de un aceite de oliva. El primer analista realizó 50 mediciones y el segundo analista realizó 70 mediciones. Los resultados han sido almacenados en las variables ANALISTAX y ANALISTAY. Variable: PRACT8.ANALISTAX (length = 50) ------------------------------------------------( 1) 0.415942 (19) 0.486297 (37) 0.338429 ( 2) 0.430043 (20) 0.37825 (38) 0.368791 ( 3) 0.392257 (21) 0.431882 (39) 0.386985 ( 4) 0.419737 (22) 0.426071 (40) 0.540184 ( 5) 0.349368 (23) 0.358652 (41) 0.460913 ( 6) 0.363757 (24) 0.508973 (42) 0.336355 ( 7) 0.408806 (25) 0.335527 (43) 0.464432 ( 8) 0.477429 (26) 0.393374 (44) 0.446144 ( 9) 0.410736 (27) 0.45831 (45) 0.441902 (10) 0.438751 (28) 0.431555 (46) 0.42399 (11) 0.385815 (29) 0.389214 (47) 0.318204 (12) 0.421143 (30) 0.498298 (48) 0.415651 (13) 0.408184 (31) 0.301041 (49) 0.416599 (14) 0.373737 (32) 0.394056 (50) 0.348097 (15) 0.398694 (33) 0.37022 (16) 0.456946 (34) 0.397015 (17) 0.452244 (35) 0.431382 (18) 0.41428 (36) 0.448401 ---------------------------------------------------Variable: PRACT8.ANALISTAY (length = 70) -------------------------------------------------------------------( 1) 0.373542 (19) 0.376635 (37) 0.331057 (55) 0.460377 ( 2) 0.518475 (20) 0.380869 (38) 0.61179 (56) 0.402066 ( 3) 0.274026 (21) 0.530678 (39) 0.668322 (57) 0.612417 ( 4) 0.206693 (22) 0.37918 (40) 0.373004 (58) 0.237602 ( 5) 0.587053 (23) 0.535576 (41) 0.298427 (59) 0.518622 ( 6) 0.630162 (24) 0.426845 (42) 0.573217 (60) 0.360339 ( 7) 0.52047 (25) 0.373677 (43) 0.396045 (61) 0.462657 ( 8) 0.214426 (26) 0.325883 (44) 0.24866 (62) 0.466397 ( 9) 0.448428 (27) 0.523589 (45) 0.442488 (63) 0.557935 (10) 0.219481 (28) 0.319792 (46) 0.306797 (64) 0.479189 (11) 0.445016 (29) 0.465053 (47) 0.407068 (65) 0.25928 (12) 0.405472 (30) 0.49688 (48) 0.466313 (66) 0.0835959 (13) 0.40832 (31) 0.196322 (49) 0.443844 (67) 0.544292 (14) 0.494349 (32) 0.596051 (50) 0.323225 (68) 0.588097 (15) 0.385543 (33) 0.544554 (51) 0.513505 (69) 0.484344 (16) 0.575627 (34) 0.330967 (52) 0.442292 (70) 0.266896 (17) 0.174346 (35) 0.447862 (53) 0.494317 (18) 0.401938 (36) 0.43785 (54) 0.459489 --------------------------------------------------------------------

a) Si comparamos los histogramas de las dos muestras ¿Es razonable admitir la hipótesis de normalidad en ambas poblaciones? ¿Qué conclusiones se pueden obtener, a partir del gráfico, si comparamos las medias muestrales y las desviaciones típicas muestrales de las dos poblaciones?

13

Nieves Martínez-Alzamora

Statgraphics: Desplegar el menú Comparar, el submenú Dos Muestras y elegir la opción Muestras independientes. Activar las opciones Histograma, Comparar medias y Comparar Desviaciones típicas. Comparación de Medias Intervalos de confianza del 95,0% para la media de ANALISTAX: 0,411261 +/- 0,0141172 [0,397144; 0,425378] Intervalos de confianza del 95,0% para la media de ANALISTAY: 0,422223 +/- 0,0294603 [0,392762; 0,451683] Intervalos de confianza del 95,0% intervalo de confianza para la diferencia de medias suponiendo varianzas iguales: -0,010962 +/- 0,0365777 [-0,0475396; 0,0256157] Comparación de Desviaciones Estándar ANALISTAX ANALISTAY Desviación Estándar 0,0496738 0,123553 Varianza 0,00246748 0,0152654 Gl 49 69 Razón de Varianzas= 0,161639 Intervalos de confianza del 95,0% Desviación Estándar de ANALISTAX: [0,0414942; 0,0619001] Desviación Estándar de ANALISTAY: [0,105937; 0,148252] Razones de Varianzas: [0,0969272; 0,275944] ANALISTAX

20

frecuencia

10

0

10

20 0

0,2

0,4

0,6

0,8

ANALISTAY

se puede aceptar la normalidad en ambos.

14

Nieves Martínez-Alzamora

Gráfico Caja y Bigotes

ANALISTAX

ANALISTAY

0

0,2

0,4

0,6

0,8

La dispersión (desviación típica) en el analista Y es mayor, mientras que el promedio(a nivel muestral todo) es similar en ambos analistas.

15

Nieves Martínez-Alzamora

Supuesta normalidad en los datos, b) Calcular el intervalo de confianza para el cociente de varianzas al 90% ¿Esta el valor 1 incluido en el intervalo? ¿Cómo interpretamos el intervalo obtenido? Comparación de Desviaciones Estándar ANALISTAX ANALISTAY Desviación 0,0496738 0,123553 Estándar Varianza 0,00246748 0,0152654 Gl 49 69 Razón de Varianzas= 0,161639 Intervalos de confianza del 90,0% Desviación Estándar de ANALISTAX: [0,0426915; 0,0596941] Desviación Estándar de ANALISTAY: [0,10855; 0,143883] Razones de Varianzas: [0,105267; 0,252917] El valor 1 no está incluido en el intervalo. Por ello, descartamos la igualdad de varianzas con una probabilidad de error del 10%.

c) Calcular el intervalo de confianza para la diferencia de medias al 95% ¿Esta el valor 0 incluido en el intervalo?¿Cómo interpretamos el intervalo obtenido? Statgraphics: En Opciones de Ventana, activas o desactivar la casilla Asumir sigmas iguales en función del apartado anterior Comparación de Medias Intervalos de confianza del 95,0% para la media de ANALISTAX: 0,411261 +/- 0,0141172 [0,397144; 0,425378] Intervalos de confianza del 95,0% para la media de ANALISTAY: 0,422223 +/- 0,0294603 [0,392762; 0,451683] Intervalos de confianza del 95,0% intervalo de confianza para la diferencia de medias suponiendo varianzas iguales: -0,010962 +/- 0,0365777 [-0,0475396; 0,0256157] Comparación de Medias (ya que no podemos asumir varianzas iguales) Intervalos de confianza del 95,0% para la media de ANALISTAX: 0,411261 +/- 0,0141172 [0,397144; 0,425378] Intervalos de confianza del 95,0% para la media de ANALISTAY: 0,422223 +/- 0,0294603 [0,392762; 0,451683] Intervalos de confianza del 95,0% intervalo de confianza para la diferencia de medias sin suponer varianzas iguales: -0,010962 +/- 0,0324576 [-0,0434195; 0,0214956]

El valor 0 sí que se encuentra incluido en el intervalo. No puedo descartar la igualdad de medias con probabilidad de error inferior al 5%.

16

Nieves Martínez-Alzamora

3. Intervalos de confianza en poblaciones binomiales.

Ejercicio 8: Intervalos de confianza para la proporción en una población binomial Un fabricante asegura que de las piezas que fabrica el porcentaje de unidades que esta fuera de los límites de tolerancia es del 3%. En un control de calidad, se seleccionan al azar 85 piezas de un lote comprado a este fabricante y 10 de ellas están fuera de los límites de tolerancia. a) Calcular un intervalo de confianza para la proporción de unidades defectuosas del lote. b) ¿Esta el valor 0.03 incluido en el intervalo de confianza?¿Como interpretamos el intervalo obtenido?

Statgraphics: Desplegar el menú Describir, el submenú Datos Numéricos y elegir la opción Pruebas de hipótesis. Indicar el parámetro a estimar, el valor del tamaño muestral y los estadísticos obtenidos. Seleccionar en Opciones como hipótesis alternativa No igual y elegir el valor de α. Proporción de muestra = 0,117646 Tamaño de muestra = 85 Intervalo aproximado del intervalos de confianza del 95,0% para p: [0,0578811;0,205732]

(si no nos dicen nada, por defecto se deja 95 %) El 3% establecido por el fabricante no está incluido en el intervalo. Como todos son superiores al 3%, la proporción de defectuosas supera el 3%.

Ejercicio 9: Intervalos de confianza para comparar proporciones en dos poblaciones binomiales Si a la vista de los resultados del aparado anterior, se decide comprar las piezas a otro fabricante y al tomar una muestra de 85 piezas de un lote y medirlas, el número de piezas fuera de los límites de tolerancia es 8 a) Calcular un intervalo de confianza para la diferencia en la proporción de defectuosos de ambos fabricantes Statgraphics: Desplegar el menú Comparar, el submenú Dos Muestras y elegir la opción Prueba de hipótesis. Proporciones muestrales = 0,117646 y 0,0941176 Tamaños de muestra = 85 y 85 Intervalo aproximado del intervalos de confianza del 95,0% para la diferencia entre proporciones: [0,0689085;0,115965] Hipótesis Nula: diferencia entre proporciones = 0,0 Alternativa: no igual Estadístico z calculado = 0,498515 Valor-P = 0,618118 No rechazar la hipótesis nula para alfa = 0,05.

17

Nieves Martínez-Alzamora

c) ¿Esta el valor 0 incluido en el intervalo de confianza?¿Como interpretamos el intervalo obtenido? El valor 0 está incluido. Por ello, no podemos afirmar con probabilidad de error inferior al 5% que haya diferencia significativa entre los 2 prob.

4. Tamaño muestral. Las estimaciones de los parámetros obtenidas a partir de una muestra tendrán siempre un margen de error directamente relacionado con el tamaño de la muestra. En este apartado veremos como determinar el tamaño muestral necesario para conseguir estimar los parámetros con la precisión deseada. Ejercicio 10 .- Determinación del tamaño muestral en una población binomial Determinar el tamaño muestral necesario para garantizar con una probabilidad del 95% que la desviación entre la proporción de unidades defectuosas de un lote y la proporción de unidades defectuosas de una muestra obtenida de ese lote sea inferior a 0’05. Statgraphics: Desplegar el menú Herramientas y el submenú Determinación del Tamaño Muestral y seleccionar Una Muestra. Con el botón derecho del ratón especificar en Opciones de Análisis la precisión deseada en la estimación (error absoluto) Considerar como proporción hipotética p=0’5 Parámetro a estimar: parámetro binomial Tolerancia deseada: +- 0,05 cuando la proporción = 0,5 Nivel de confianza: 95,0% El tamaño de muestra requerido es n=402 observaciones.

Ejercicio 11 .- Determinación del tamaño muestral en una población normal Se desea estimar el valor medio de la longitud de las piezas de un lote con una precisión de 0’05mm. Para obtener un valor aproximado de la dispersión se realiza un muestreo previo en el cual se miden 5 piezas obteniéndose los siguientes valores, 3’12, 3’18, 3’07, 3’22, 2’98 Determinar cuantas piezas adicionales deben ser medidas para completar la muestra.

18

Nieves Martínez-Alzamora

Statgraphics: Obtener previamente una estimación de la desviación típica, calculando la cuasidesviación típica de los datos que se proporcionan e introducirla como valor hipotético de sigma. Indicar que sigma esta por estimar. Desviación Estándar = 0,0942338 Error absoluto= +-0.05 Sigma por determinar (hemos puesto una aproximación) Parámetro a estimar: media normal Tolerancia deseada: +- 0,05 Nivel de confianza: 95,0% Sigma: 0,09 (por estimar) El tamaño de muestra requerido es n=15 observaciones.

19...


Similar Free PDFs