Prueba DE Hipotesis - Com 42 PDF

Title Prueba DE Hipotesis - Com 42
Course Estadística
Institution Universidad de Buenos Aires
Pages 20
File Size 742.7 KB
File Type PDF
Total Downloads 40
Total Views 142

Summary

Prueba DE Hipotesis - Com 42Prueba DE Hipotesis - Com 42...


Description

rPRUEBA DE HIPÓTESIS Muchos problemas de ingeniería, ciencia, y administración, requieren que se tome una decisión entre rechazar o no rechazar una proposición sobre algún parámetro. Esta proposición recibe el nombre de hipótesis.

Una hipótesis estadística es una proposición o supuesto sobre los parámetros de una o más poblaciones. Es importante recordar que las hipótesis siempre son proposiciones sobre la población o distribución bajo estudio, no proposiciones sobre la muestra. Un procedimiento que conduce a una decisión sobre una hipótesis en particular recibe el nombre de prueba de hipótesis. La hipótesis nula, representada por Ho, es la afirmación sobre una o más características de poblaciones que al inicio se supone cierta (es decir, la "creencia a priori"). La hipótesis alternativa, representada por H1, es la afirmación contradictoria a la Ho, y ésta es la hipótesis del investigador. La hipótesis nula se rechaza en favor de la hipótesis alternativa, sólo si la evidencia muestral sugiere que la Ho es falsa. Entonces, las dos conclusiones posibles de un análisis por prueba de hipótesis son rechazar Ho o no rechazar Ho. Paso 1: Establecer las hipótesis nula y alternativa • Ejemplo 1: El 90% de los jóvenes que pasan el mayor tiempo conectados a una computadora padecen de problemas musculares. • H0 : π = 0.90 • H1 : π ≠ 0.90 • Ejemplo 2: El tiempo promedio de vida de una persona que fuma es de 55 años. • H0 : μ = 55 años • H1 : μ ≠ 55 años La igualdad siempre aparece vinculada a la hipótesis nula

Puesto que la hipótesis alternativa especifica valores de que pueden ser mayores o menores que 55 años, también se conoce como hipótesis alternativa bilateral. En algunas situaciones, lo que se desea es formular una hipótesis alternativa unilateral, como en Ho:

=< 55 años

H1:

> 55 años

Ho:

=> 55 años

H1:

< 55 años

Paso 2: Seleccionar el nivel de significancia Debemos definir el valor de

, también conocido como nivel de significancia.

Si tuviéramos el nivel de significancia sería del 95%

del 5% entonces el nivel de confianza

Análogamente si se tiene un nivel de significancia de confianza sería del 90%

del 10% entonces el nivel

Las zonas de rechazo son llamadas región crítica de la prueba, mientras que el resto es la región de no rechazo. Las fronteras entre las regiones crítica y de no rechazo reciben el nombre de valores críticos.

Se establece la conclusión con respecto a la hipótesis nula Ho. Por tanto, se rechaza Ho en favor de H1 si el estadístico de prueba cae en la región crítica, de lo contrario, no se rechaza Ho. Este procedimiento de decisión puede conducir a una de dos conclusiones erróneas. Error de tipo I y error de tipo II

Decisión Hipótesis H0

No rechazar

Rechazar

Verdadera

Correcta

Incorrecta Error de tipo I

Falsa

Incorrecta Error de tipo II

Correcta

El error tipo I se define como el rechazo de la hipótesis nula Ho cuando ésta es verdadera. El error tipo II se define como el no rechazo de la hipótesis nula cuando ésta es falsa. La probabilidad de cometer un error de tipo I es significancia.

o el nivel de

La probabilidad de cometer un error de tipo II es • El complemento de la probabilidad de un error tipo II (1 – β), se conoce como potencia de una prueba estadística porque es la probabilidad de rechazar la hipótesis nula cuando es falsa.

Los errores tipo I y tipo II están relacionados. Una disminución en la probabilidad de uno por lo general tiene como resultado un aumento en la probabilidad del otro. Paso 3: Identificar el estadístico prueba Cuando se plantean hipótesis para la media poblacional y la varianza poblacional es conocida, el estadístico de prueba está dado por:

El cual se distribuye normalmente con media 0 y desvío estándar 1. • Cuando se plantean hipótesis para la media poblacional y la varianza poblacional es desconocida, el estadístico de prueba está dado por:

• El cual se distribuye como una t de Student con n-1 grados de libertad. Paso 4: Formular la regla de decisión H0: μ = 55 años H1: μ ≠ 55 años Regla de decisión: Si | n | > | c | entonces Rechazo H0

Ho:

=< 55 años

H1:

> 55 años

Regla de decisión: Si

Ho:

=> 55 años

H1:

< 55 años

Regla de decisión: Si

n > c entonces Rechazo H0

n < c entonces Rechazo H0

Pasos a seguir en una prueba de hipótesis Paso 1: Establecer las hipótesis nula y alternativa Paso 2: Seleccionar el nivel de significancia Paso 3: Identificar el estadístico prueba Paso 4: Formular la regla de decisión Paso 5: Calcular el valor numérico del estadístico de prueba y tomar a una decisión

No rechazar la Hipótesis nula

o

Rechazar la Hipótesis nula

Ejemplos: 1. Una muestra aleatoria de 100 muertes registradas en Estados Unidos el año pasado muestra una vida promedio de 71.8 años. Suponga una desviación estándar poblacional de 8.9 años, ¿esto parece indicar que la vida media hoy en día es mayor que 70 años? Utilice un nivel de significancia de 0.05.

Solución: Se trata de una distribución muestral de medias con desviación estándar conocida. Datos: =70 años = 8.9 años = 71.8 años n = 100

1. Ensayo de hipótesis Ho ;

= < 70 años.

H1;

> 70 años.

2. Nivel de significancia = 0.05

Error = 1,96*8,9/10 = 1,7444 71,8 - 1,7444 < mu < 71,8 + 1,7444 70,05 < mu < 73,54 como el parámetro mu = 70, no pertenece al intervalo, se rechaza la Ho 3. Estadístico de prueba: Zn

Zn = 2,02 4. Regla de decisión: Zcrítico = 1.645 Si zn> 1.645 se rechaza Ho. 5. Justificación y decisión. Como 2.02 >1.645 se rechaza Ho por lo tanto, con un nivel de significancia del 0.05, se concluye que la vida media hoy en día es mayor a 70 años.

¿Qué tipo de error se puede estar cometiendo? Defínalo en términos del problema Se puede estar cometiendo un error de tipo I, concluir que la vida media hoy en día es mayor a 70 años, cuando, en realidad, no ha aumentado.

2. Una empresa eléctrica fabrica focos que tienen una duración que se distribuye de forma aproximadamente normal con una media de 800 horas y una desviación estándar de 40 horas. Si una muestra aleatoria de 30 focos tiene una duración promedio de 788 horas, ¿muestran los datos suficiente evidencia para decir que la duración media ha cambiado? Utilice un nivel de significancia del 0.04. Datos: = 800 hs = 40 hs = 788 hs n = 30 focos

Solución:Ensayo de hipótesis Ho ;

= 800 hs

H1;

=/ 800 horas

3. Nivel de significancia = 0.04

6. Estadístico de prueba: Zn Zn = (788-800)/(40/raiz de 30) = - 1,643 p.valor = p(z< - 1,64) = 0,0505 0,05 > 0,04, por lo tanto NO rechazo la Ho 7. Regla de decisión: Zcrítico = 2,054 Si | n | > | c | entonces Rechaza Si |

|= 5.5 onzas

H1;

< 5.5 onzas

2. Nivel de significancia = 0.05 3.

tn(5.23-5.5)/(0.24/8) = -9 4. tc= -1.669 5. Si

n < c entonces Rechazo H0

SI -9 < -1.669 entonces RECHAZO Ho. Con un nivel de significancia de 0.05 el peso promedio de las bolsas de palomitas de maiz es menor a 5.5 onzas.

¿Qué tipo de error se puede estar cometiendo? Defínalo en términos del problema. Error de tipo I. Rechazar la Ho siendo que el peso promedio de las bolsas de palomitas de maíz no ha sufrido variación, o no ha disminuido .

Prueba de hipótesis para una proporción 4. Un constructor afirma que se instalan bombas de calor en 70% de todas las casas que se construyen hoy en día en la ciudad de Richmond. ¿Estaría de acuerdo con esta afirmación si una investigación de casas nuevas en esta ciudad muestra que 8 de 15 tienen instaladas bombas de calor? Utilice un nivel de significancia de 0.10. Solución: p = 8/15 = 0.53 1. Establecer las hipótesis nula y alternativa Ho; π = 0.70 H1; π

0.70

2. Seleccionar el nivel de significancia = 0.10 3. Identificar el estadístico prueba Z=

p - π √ π*(1-π) / n

= 0.53 – 0.70

=

√ 0.70 * 0.30 / 15

- 0.17

= - 1.437 = - 1.44

0.1183

p.valor = p(z< - 1,44) = 0,07493 2 p,valor < alfa

0,14987 > 0,10 NO rechazo Ho

4. Formular la regla de decisión: Zc = 1.645 Si |𝑍n | > |𝑍c | entonces Rechazo H0

5. Calcular el valor numérico del estadístico de prueba y tomar a una decisión Como | - 1.44 | < |1.645 | entonces NO se rechaza la H0, por lo tanto, al

nivel de significancia de 0.10, se concluye que la afirmación del constructor es correcta.

¿Qué tipo de error se puede estar cometiendo? Defínalo en términos del problema Error de tipo II. No rechazar la afirmación del constructor cuando, en realidad, la proporción de bombas de calor instalada ha variado. 4. Un fabricante de semiconductores produce controladores que se emplean en aplicaciones de motores automovilísticos. El cliente requiere que la fracción de controladores defectuosos en uno de los pasos de manufactura críticos no sea mayor que 0.05, y que el fabricante demuestre esta característica del proceso de fabricación con este nivel de calidad, utilizando = 0.05. El fabricante de semiconductores toma una muestra aleatoria de 200 dispositivos y encuentra que cuatro de ellos son defectuosos. ¿El fabricante puede demostrar al cliente la calidad del proceso? Solución: P= 4/200= 0.02 n= 200 1)Establecer las hipótesis nula y alternativa Ho; π >= 0.05 H1; π < 0.05 2)Seleccionar el nivel de significancia = 0.05 3) Identificar el estadístico prueba Zn =

p - π

√ π*(1-π) / n

= 0.02 – 0.05

=

√ 0.05 * 0.95 / 200

4) Formular la regla de decisión: Zc= -1.645 Si 𝑍n < 𝑍c entonces Rechazo H0 Si -1.946 < -1.645 entonces Rechazo H0

- 0.03 0.001062

= - 1.946

5) Calcular el valor numérico del estadístico de prueba y tomar a una decisión Como -1.946 < -1.645 entonces se rechaza la H0, por lo tanto, al nivel de significancia de 0.05, se concluye que el fabricante puede demostrar la calidad del proceso xq la proporción de defectuoso es < a 0.05

6)¿Qué tipo de error se puede estar cometiendo? Defínalo en términos del problema error tipo I, rechazando la Ho se concluye que el fabricante puede demostrar la calidad del proceso xq la proporción de defectuoso es < a 0.05, cuando en realidad la proporción de defectuosos es >

VALOR

p

Es el valor de probabilidad de obtener un resultado de la muestra que sea al menos tan improbable como lo que se observa. Este valor corresponde al valor de la probabilidad asignada al zn calculado a partir del valor numérico sometido a la prueba de hipótesis Si p es menor al nivel de significancia predefinido se debe rechazar H0

Uso de valores p para la toma de decisiones

Zn

Zc

Valor p > α No se rechaza la Ho

Zc Valor p < α

Zn Se rechaza la Ho

Ensayo Bilateral: 1. Calcular el valor de P para el primer ejemplo de ensayo de hipótesis en donde se quería probar que la edad media de los habitantes de Estados Unidos es superior a 70 años. Solución: 1. Ensayo de hipótesis Ho;

= 70 años.

H1;

> 70 años.

2. Nivel de significancia = 0.05

3. Estadístico de prueba: Zn

4. Regla de decisión:

Si el valor p

0.05 se rechaza Ho.

Si el valor p > 0.05 No se rechaza Ho. 5. Justificación y decisión: Valor p: P (z > 2.02) = 1 – P (z < 2.02) = 1 – 0.97831 =0.02169 = 0.0217

Como el valor de P es 0.0217 y es menor al valor del nivel de significancia de 0.05 por lo tanto se rechaza H0, y se concluye que la edad media de los habitantes es mayor a 70 años. Calcular el valor p en los ejemplos 2, 3, 4 y 5 Ejemplo 6 El Instituto Eléctrico Edison publica cifras del número anual de Kilowatt-hora que gastan varios aparatos electrodomésticos. Se afirma que una aspiradora gasta un promedio de 46 kilowatt-hora al año. Si una muestra aleatoria de 12 hogares que se incluye en un estudio planeado indica que las aspiradoras gastan un promedio de 42 kilowatt-hora al año con una desviación estándar de11.9 kilowatt-hora, ¿esto sugiere con un nivel de significancia de 0.05 que las aspiradoras gastan, en promedio, menos de 46 kilowatt-hora anualmente? Suponga que la población de kilowatt-hora es normal. Solución: ¿Qué tipo de error se puede estar cometiendo? Defínalo en términos del problema

5. Un artículo publicado en la revista Materials Engineering describe los resultados de pruebas de resistencia a la adhesión de 22 especímenes de aleación U-700. La carga para la que cada espécimen falla es la siguiente en MPa: 19.8

18.5

17.6

16.7

15.8

15.4

14.1

13.6

11.9

11.4

11.4

8.8

7.5

15.4

15.4

19.5

14.9

12.7

11.9

11.4

10.1

7.9

¿Sugieren los datos que la carga promedio de falla es mayor que 10Mpa? Supóngase que la carga donde se presenta la falla tiene una distribución normal, y utilícese = 0.05. Calcule el valor de P. Solución: ¿Qué tipo de error se puede estar cometiendo? Defínalo en términos del problema 6. Los pesos en libras de una muestra aleatoria de bebés de seis meses son: 14.6, 12.5, 15.3, 16.1, 14.4, 12.9, 13.7 y 14.9. Haga una prueba con nivel de 5% de significancia para determinar si el peso promedio de todos los bebés de seis meses es distinto a 14 libras, suponga que sus pesos se distribuyen normalmente y calcule el valor de P. Solución: ¿Qué tipo de error se puede estar cometiendo? Defínalo en términos del problema Relación entre estimación por intervalo y prueba de hipótesis

• •



En la determinación del intervalo de confianza para medias se empleó un coeficiente definido por 1-α , como una forma de definir si nuestros promedios muestrales contenían al parámetro poblacional Ahora para una prueba de hipótesis se puede rechazar H0 si el intervalo de confianza para la media de la población no abarca el parámetro poblacional Verificar en los ejemplos si el intervalo de confianza para 1-α abarca el parámetro poblacional.

Prueba de independencia • • •

• •

Nos interesa ahora la relación entre dos variables diferentes de una sola población. El número de categorías de la primer variable estará representada por I(filas) y el de la segunda variable por J (columnas). El interés recae en probar la hipótesis de que los dos métodos de clasificación fila-columna son independientes. Si se rechaza esta hipótesis, entonces se concluye que existe alguna interacción entre los dos criterios de clasificación. Para una muestra de n individuos, nombramos nij el número entre los n individuos que cae tanto en la categoría i como en la j. Sea pij la probabilidad de que un elemento seleccionado al azar caiga en la ij-ésima celda, dado que las dos clasificaciones son independientes.

Estadístico de prueba:

χ2

Propiedades de las distribuciones ji-cuadrada 1. Los valores de χ 2 son mayores o iguales que 0. 2. El área bajo una curva ji-cuadrada y sobre el eje horizontal es 1. 3. Las distribuciones χ 2 no son simétricas. Tienen colas estrechas que se extienden a la derecha; esto es, están sesgadas a la derecha. 4. Grados de libertad: (f -1)*(c -1) para pruebas de independencia La siguiente figura ilustra tres distribuciones χ 2.

Al ser una distribución asimétrica la zona de rechazo debe tomarse siempre a derecha.

• Hipótesis nula: H0: pij = pi.*p.j i = 1……..I; j= 1………..J • Hipótesis alternativa: H1: H0 no es verdadera • Seleccionar el nivel de significancia α • Valor del estadístico de prueba χ 2 = ∑ ( observadas – esperadas )2 = ∑ ∑ (nij - eij )2 i=1j=1 esperadas eij • Región de rechazo: χ 2 ≥ χ 2α, (I – 1)(J – 1) • • En una escuela primaria se tomó una muestra de 100 alumnos y se los clasificó según la edad y la preferencia por matemática, lengua y biología. Los datos se presentan en la siguiente tabla de contingencia de 3 x 3:



• La hipótesis que interesa probar es: si la preferencia por determinada materia es independiente de la edad

1. Establecer las hipótesis nula y alternativa • H0: pij = pi.*p.j i ; j= 1, 2, 3 (La preferencia por determinada materia es independiente de la edad) • H1: H0 no es verdadera (la preferencia por determinada materia depende de la edad) 2. Seleccionar el nivel de significancia Nivel de significancia del 5% (α = 0.05) 3. Identificar el estadístico prueba χ 2 = ∑ ( observadas – esperadas )2 = esperadas • El estadístico de prueba exige calcular las frecuencias esperadas estimadas mediante la relación npij = n pi.*p.j

Valor esperado de (7; Matemática) = 100*33/100*44/100 = 14.52 Valor esperado de (8; Lengua) = 100*25/100*20/100 = 5 Valor esperado de (9; Biología) = 100*42/100*36/100 = 15.12 Edad

Lengua

Biología

7

Matemátic a 14,5

6,6

11,9

8

11

5

9

9

18,5

8,4

15,1

• Por lo tanto χ 2 = (10 – 14.5)2/14.5 + (8 – 6.6)2/6.6 +…+ (12 – 15.1)2/15.1 = 4.466

4. Formular la regla de decisión Región de rechazo: Χ2n ≥ Χ2 c (0.05, 4) Grados de libertad: (f -1)(c -1) = (3-1)*(3-1) = 2*2 = 4

Χ2 c (0.05, 4)= 9.488 5. Calcular el valor numérico del estadístico de prueba y tomar a una decisión Como 4.466 < 9.488 NO se rechaza Ho por lo tanto, con un nivel de significancia del 0.05, se concluye que la preferencia por determinada materia es independiente de la edad.

0,4353 < 7,779 NO se rechaza la Ho, son independientes-...


Similar Free PDFs