412664621 Ejercicio 22 Diseno Factorial PDF

Title 412664621 Ejercicio 22 Diseno Factorial
Author eduardo jose contreras valencia
Course Estadistica II
Institution Universidad del Magdalena
Pages 15
File Size 511.3 KB
File Type PDF
Total Downloads 28
Total Views 131

Summary

Diseño Factorial apuntes ...


Description

DISEÑOS FACTORIALES 1.- ¿Qué es un experimento factorial completo?

Un diseño factorial es un método de selección de tratamientos (es decir, combinaciones factor-nivel) que se incluirán en un experimento. Un experimento factorial completo es uno en el que los tratamientos consisten en todas las combinaciones factor- nivel. 2.- ¿Cuántos efectos se pueden estudiar con un factorial 4 x 3 x 2? Bosqueje su tabla de análisis de varianza. Se pueden estudiar 7 efectos en este modelo y son A, B, C, AB, AC, BC y ABC.

F V Efecto A

S C SCA

G L a-1

C M CMA

F 0 CMA/ CME

Efecto B

SCB

b-1

CMB

CMB/ CME

Efecto C

SCC

c-1

CMC

CMC/ CME

Efecto AB

SCAB

(a-1)(b1)

CMAB

CMAB/ CME

Efecto AC

SCAC

(a-1)(c1)

CMAC

CMAC/ CME

Efecto BC

SCBC

(b-1)(c1)

CMBC

CMBC/ CME

Efecto ABC

SCABC

CMABC

CMABC/ CME

Error

SCE

Total

SCT

(a-1)(b-1) (c1) abc(n1) abcn-1

Valor-p

CME

3.- Mencione al menos tres ventajas de la experimentación factorial sobre la estrategia de mover un factor a la vez. 1. Permiten estudiar el efecto individual y de interacción de los distintos factores. 2. Son diseños que se pueden aumentar para formar diseños compuestos en caso de que se requiera una exploración más completa. 3. La interacción y el cálculo de los efectos en los experimentos factoriales se puede hacer con aritmética elemental, en particular cuando cada factor se prueba en dos niveles. 4.- ¿Cuál es la implicación practica de utilizar tres niveles de prueba en lugar de dos en un factor dado?

Si un factor se prueba en dos niveles, todo su efecto marginal (individual) es lineal, o sea que su efecto individual no se puede descomponer; pero, si tuviera tres niveles su efecto marginal se puede descomponer en una parte lineal y otra cuadrática pura.

5 ¿Por qué no tiene sentido utilizar el modelo de regresión cuando los factores son cualitativos? Si fueran cuantitativos, ¿Qué se gana con el modelo de regresión en relación al modelo de efectos? Porque cuando son cualitativos no se puede hacer un análisis minucioso sobre el comportamiento de la variable de respuesta alno tener datos numéricos. Con el modelo de regresión podemos obtener una predicción más acertada del comportamiento de cierta variable en cambio con el modelo de efectos solo nos sirve para determinar qué tan significativos son los factores involucrados. 6 ¿Cómo se construye la gráfica de un efecto de interacción doble? ¿Cómo se interpreta?

En el eje de las abscisas se coloca el factor A denotando los niveles que tenga, en el eje de las ordenadas la variable de respuesta del experimento y en el plano aparecerán tantas líneas como niveles tenga el factor B. Según el problema debe seleccionarse la combinación de niveles donde se obtenga el resultado óptimo. 7.- ¿Cuáles son los supuestos del modelo en un diseño factorial y con cuales graficas de residuos se puede verificar cada uno de estos supuestos? Los supuestos del modelo son normalidad, varianza constante e independencia de los residuos y se pueden verificar graficando los residuos contra los predichos en las graficas de normalidad en la que se cumple el supuesto del modelo si caen todos los residuos alineados en la línea recta de la grafica y la varianza constante al caer todos los puntos distribuidos dentro de una banda horizontal. 8.-En la pregunta anterior, ¿Cómo se vería en las graficas un punto muy alejado o aberrante?

Gráficas de residuos par para a RESPUEST RESPUESTA A Gráfica de probabilidad normalvs. ajustes

99. 9

Residuo estandarizado

5.0

Porcentaje

99 90 50 10 1 0.1

-4

-2

2.5 0.0

0 2 4 Residuo estandarizadoV estandarizadoValor alor ajustado

88

Histograma

90

92

94

vs. orden

15 2.5 Frecuencia

10 5 0

-2-1012345 Residuo estandarizado

Residuo estandarizado

205.0

0.0

1 5 10 15 20 25 30 35 40 45 50 55 60 Orden de observación

96

9. De los tres supuestos del modelo, ¿Cuál puede afectar más el análisis en caso de no cumplirse? Los supuestos de normalidad y varianza constante

10. En caso de no cumplirse los supuestos de normalidad y varianza constante ¿Qué se puede hacer para evitar problemas con el análisis y los resultados obtenidos? Existen al menos tres maneras de solucionar o minimizar el problema por falta de normalidad y varianza heterogénea en los residuos: 1. Utilizar métodos de análisis no parametritos, que no requieren las suposiciones de normalidad y varianza constante 2. Hacer el análisis mediante modelos lineales generalizados(GLM), en los que se ajusta un modelo lineal usando otras distribuciones diferentes a la normal, donde la varianza no tiene por qué ser constante 3. Hacer el análisis sobre la respuesta transformada a una escala en la que los supuestos se cumplan.

11 ¿Con base en que se puede encontrar una transformación adecuada de la respuesta cuando no se cumpla los supuestos? Para corregir o minimizar los problemas de falta de normalidad y de varianza constante depende del tipo de relación que existe entre la media y la varianza de y. Esta relación se puede visualizar en la gráfica de residuos vs. Predichos. Según lo pronunciado que sea la “forma de corneta” de los puntos en dicha gráfica, se determina la transformación más adecuada. 12.- ¿Qué significa que el modelo estadístico sea de efectos aleatorios? ¿En que cambian las hipótesis de interés en factor aleatorio con respecto a uno fijo? Cuando los niveles de prueba utilizados en un factor son una muestra aleatoria de la población de niveles para ese factor. La diferencia entre las hipótesis aleatorias y fijas son: en las fijas se basa en el efecto sobre la variabilidad de respuesta y en las aleatorias se basa en la varianza. H0:σ2α = 0, H0: σ2 β = 0 Y H0 : σ2α β = 0

13. Represente en el plano cartesiano un diseño factorial 4x4.

Representación del diseño factorial 4x4 14.- a continuación se muestra parte del ANOVA para un diseño factorial 3x5 con dos replicas, el factor A con tres niveles y el B con cinco. Grados de liberta d 2

Factores de variació n A

Suma de cuadra dos 800

B AB ERR OR TOT AL

900 300 400

4 8 15

2400

29

Cuadr ado medi o 400 225 37.5 26.66

Razó nf 15.00 3 8.439 1.406

a) Suponga efectos fijos, anote el modelo estadístico apropiado y formule las hipótesis a probar para este experimento. Modelo estadístico Yijk = I = 1,2,…., ; j =1,2,….,b ; k = 1,2,…,n Hipótesis

HO =: Efecto A = HA =: Efecto A HO =: Efecto B = HA =: Efecto B HO =: Efecto AB = HA =: Efecto AB

b) Agregue en esta tabla los grados de libertad, el cuadrado medio y la razón F para cada una de las fuentes de variación. c) Explique de manera esquemática como calcular el valor-p para A, por ejemplo. Con la formula P (F>FAO) que dando valores quedaría P (F>F30), quiere decir que se calcula la probabilidad de que Fo sea mayor que valor critico de F con 3 en el numerador y 0 en denominador. d) Con la información disponible ¿se pueden hacer conjeturas sobre cuáles de las fuentes de variación son significativas estadísticamente? Argumente su respuesta. Si se tiene la suficiente información para afirmar: Conclusiones A = 15.003 > 3.682 el efecto A es significativo. B = 8.429 > 3.056 el efecto B es significativo. AB = 1.406 < 2.641 el efecto AB no es significativo.

15.- conteste todo el ejercicio anterior, pero ahora suponiendo que ambos factores son aleatorios. Cuadr Grados Suma Factores Razó ado de de de nf medi liberta cuadra variació o d dos n A 800 2 400 10.66 B 900 4 225 6 AB 300 8 37.5 1.406 400 15 26.66 ERR OR 2400 29 TOT AL a) Supongo efectos fijos, anote el modelo estadístico apropiado y formule las hipótesis a probar para este experimento. Modelo estadístico Yijk = I = 1,2,…., ; j =1,2,….,b ; k = 1,2,…,n Hipótesis HO =: 2 A = HA =: 2A

HO =: 2 B = HA =: 2 B HO =: AB = HA =: 2 AB

2

b) Agregue en esta tabla los grados de libertad, el cuadrado medio y la razón f para cada una de las fuentes de variación. c) Explique de manera esquemática como calcular el valor-p para A, por ejemplo. Con la formula P (F>FAO) que dando valores quedaría P (F>F30), quiere decir que se calcula la probabilidad de que Fo sea mayor que valor critico de F con 3 en el numerador y 0 en denominador. d) Con la información disponible ¿se pueden hacer conjeturas sobre cuáles de las fuentes de variación son significativas estadísticamente? Argumente su respuesta. Si, se tiene la suficiente información para afirmar: Conclusiones A = 10.66 > 3.682 el efecto A es significativo. B = 6 > 3.056 el efecto B es significativo. AB = 1.406 < 2.641 el efecto AB no es significativo.

2. En una fábrica de aceites vegetales comestibles la calidad resulta afectada por la cantidad de impurezas dentro del aceite, ya que éstas causan oxidación, y ello repercute a su vez en las características de sabor y color del producto final. El proceso de “blanqueo” es el responsable de eliminar tales impurezas, y una forma de medir su eficacia es midiendo el color del aceite. Para generar una primera aproximación a la solución del problema se decide estudiar el efecto de la temperatura y el porcentaje de arcilla en el color del aceite inicialmente a nivel laboratorio. El diseño y los datos de las pruebas experimentales se muestran a continuación. Temperatura

Porcentaje de Arcilla 0.8

0.9

1.0

1.1

90

5.8 5.9

5.4 5.5

4.9 5.1

4.5 4.4

100

5.0 4.9

4.8 4.7

4.6 4.4

4.1 4.3

110

4.7 4.6

4.4 4.4

4.1 4.0

3.7 3.6

a) Construya el modelo estadístico y formule hipótesis pertinentes

Modelo Estadístico y ijk =μ+α i + β j + ( αβ )ij+ε ijk Para i=1,... , a , j =1,... , b , k=1,. .. , n

donde:

μ =Media global α i = efecto de la temperatura causado por el nivel i β j = efecto del %Arcilla causado por el nivel j ( αβ )ij = el efecto de la interacción entre el nivel i de la temperatura y el nivel j del %Arcilla ε ijk = error aleatorio Hipótesis H 0=Efecto dela temperatura ( A )=0 (El factor temperatura no influye en el color del aceite) H A =Efecto dela temperatura ( A ) ≠0 (El factor temperatura influye en el color del aceite) H 0=Efecto de%Arcilla ( B )=0 (El factor %Arcilla no influye en el color del aceite) H A =Efecto de %Arcilla ( B )≠ 0 (El factor %Arcilla influye en el color del aceite) H 0=Efecto temperatura x%Arcilla ( AB ) =0 (No hay interacción entre los factores) H A =Efectotemperatura x%Arcilla ( AB )≠ 0 (Hay interacción entre los factores) b) ¿Cuál es el nombre del diseño utilizado? Diseño factorial completo 4x3 con 2 réplicas c) Por lo general, a condiciones reales se utiliza 1.1% de arcilla y 100 grados de temperatura. ¿Por qué cree que se eligieron precisamente esos niveles de prueba para el experimento? Porque tal vez estos niveles de prueba son los que mejor funcionan para este caso en particular y proporcionan mayor calidad de datos. d) Realice un análisis de varianza para probar las hipótesis y obtenga conclusiones. Sumatoria de las observaciones B A

1

2

3

4

1 2 3

11,7 9,9 9,3

10,9 9,5 8,8

10 9 8,1

8,9 8,4 7,3

TotalY j

30,9

29,2

27,1

24,6

TotalY i 41,5 36,8 33,5 Y … 111, 800

Entonces, Y j = total en el nivel j del factor B Y … = suma de todas las observaciones

a=3 b=4 n= 2 N= a*b*n= 24 Y i = total en el nivel i del factor A

2 2 Y i y … 3 41,52 +36,82 +33,52 111,800 2 4.198,74 12.499,24 SC A =∑ − =∑ − = − 24 8 24 N i=1 4∗2 i=1 bn a

SC A =524,843−520.802= 4,04083 b

SC B =∑ j=1

2 2 Y j y … 4 30,92 +29,22 +27,12+ 24,62 111,800 2 3.147,02 12.499,24 − =∑ − = − an N i=1 24 6 24 3∗2

SC B =524,503−520.802 =3,70166

b

2

2

Y ij y … − −¿ SC A −SC B ∑ N j=1 n a

SC AB=∑ ¿ i=1

b

2

2

2

5

2

2

2

2

2

2

11,7 + 9,9 + 9,3 + 10,9 + 9,5 + 8,8 + 10 + 9 + 8,1 + 8,9 + 8,4 ∑ 2 j=1

2

+ 7,32 111,8002 −¿ 4,040 −3,701 − 24

a

SC AB =∑ ¿ i=1

b

2

111,800 − ∑ 1.057,56 2 24

−¿ 4,040−3,701=528,78 −520.802− 4,040−3,701

j=1

a

SC AB =∑ ¿ i=1

SC AB=0,23583 b

2

n

y 111,8002 Y −¿ … =528,88− =528,88−520.802 =8,07833 ∑ ∑ N 24 j=1 k=1 2 ijk

a

SC T =∑ ¿ i=1

SC E=SCT − SC A − SC B− SC AB SC E=8,078 −4,040 −3,701−0,237 =0,1 Tabla de análisis de varianza (ANOVA) Fuente de Suma de Grados de variabilida cuadrados libertad d (efecto) (S.C) (G.L) (F.V) Temperatu ra (A)

% Arcilla (B)

Interacció n (AB)

Error

4,04083

3,70166

0,23583

0,1

a-1 = 3-1 =2

b-1 = 4-1 =3

(a-1)(b-1) =2*3 =6

ab(n-1) =3*4(2-1) =12

Cuadrado medio (CM) 4.04083 2 =2,0204 3,70166 3 =1,2338 0,23583 6 =0,039305

Estadístico de prueba (F 0) 2,0204 0.008333 =245,45 1,2338 0.008333

significanci a observada (Valor –p)

F0.05,2,12 0,000 =3,89 F0.05,3,12 0,000 =3,49

=148,066 0,039305 0,008333 =4,716

Valor crítico para F0

F0.05,6,12 0,011 =3,00

0,1 12 =0,0083

abn1=(3*4*2)-1 =23 El análisis de varianza permite concluir que, tanto para el factor A como el factor B, temperatura y porcentaje de arcilla respectivamente, se rechaza H 0 debido a que en ambos caso F0 es muy grande, mucho mayor al F α , de igual forma, el Valor −p< α es menor que la significancia prefijada α=0,05 por lo cual se contradice la hipótesis de que no hay efectos.. Total

8,07833

Para el caso de la interacción, se evidencia una interacción entre los factores. Por tanto rechaza H0 , el F0 es mayor al F α , y el Valor −p< α es menor que la significancia prefijada α =0,05 . e) Apoyándose en las gráficas de efectos, ¿cuál es la relación general entre el color y los factores controlados en su rango de experimentación?

De acuerdo con las gráficas de efectos, en el cual se ve que a mayor temperatura y mayor porcentaje de arcilla se minimiza el color del aceite, y a menor temperatura y menor porcentaje de arcilla el color es mas alto. f) A partir de la gráfica de interacciones, ¿cree que haya un efecto no lineal? En la grafica de lineas con pendientes diferentes, pero evidencia un efecto

interacciones se ven relativamente claramete se lineal.

g) Considerando mínimo blancura es de tratamiento

que el aceptable 4.8, utilizaría?

nivel de ¿qué

El tratamiento cumplir con ese Factor A en nivel 3 y Factor B en nivel 1. h) ¿Vale la pena plantear el estudio en condiciones reales?

más óptimo para requerimiento sería

Dado que el diseño factorial ha permitido investigar todas las posibles combinaciones de los niveles de los factores, permitiendo conocer qué factores son más importantes y cuál es el tratamiento que más conviene, plantear el estudio en condiciones reales permitiría ver resultados más explícitamente, por tanto, si valdría la pena plantearlo. i) ¿Qué cambio le haría al experimento si lo corre en condiciones reales? Disminuiría un nivel del porcentaje de Arcilla y aumentaría la cantidad de réplicas que permitiera la obtención de un resultado más robusto y confiable.

3.Con el objetivo de estudiar la producción de huitlacoche (hongo comestible del maíz) se decide correr un experimento con tres variedades de maíz en dos localidades maiceras. Las variables de interés fueron: el porcentaje de cobertura de la mazorca por el hongo, el peso total de la mazorca y el peso del huitlacoche. Se hicieron cuatro réplicas. Los datos obtenidos que representan promedios de 20 mazorcas infectadas se muestran en la siguiente tabla:

a) Escriba el nombre y modelo estadístico del diseño que se está empleando. Se usa un modelo de tres factores de diseño factorial general b) ¿Hay un efecto significativo de los factores variedad y localidad en las tres variables de respuesta? como se puede notar en la tabla la variedad de A,B y C hay una mayor media en la localidad A en comparación con la localidad B donde se puede denotar una menor media. c) ¿Existe claramente una localidad y variedad de maíz donde se produce más huitlacoche?

Si existe claramente una localidad donde se produzca más que sería la localidad B, sin embargo, no se muestra una variedad de maíz que produzca más ya que las medias de los tres tipos están casi al mismo nivel....


Similar Free PDFs