Title | Ejercicios Anova |
---|---|
Author | Isabel Millan Diaz |
Course | Química Analítica y Bioquímica |
Institution | Universidad de Huelva |
Pages | 11 |
File Size | 242.1 KB |
File Type | |
Total Downloads | 72 |
Total Views | 133 |
ejercicios anova con solución...
Estadístic a ANOVA Ampliación de Química Analítica Fco Javier Franco Carmona
1. Se tienen los resultados correspondientes a la normalización de una disolución de hidróxido sódico por 5 alumnos (volumen en ml de reactivo gastado), cada uno de los cuales valora con dicho hidróxido sódico y por quintuplicado una misma disolución patrón preparada con ftalato ácido de potasio tipo primario. A la vista de los resultados indique si alguno de los alumnos origina resultados significativamente diferentes del resto, y en caso afirmativo identifíquele. Alumnos/Análisis 1
1 10,2
2 9,8
3 9,7
4 9,6
5 9,5
2
10,5
9,6
9,2
9,6
9,4
3 4
10,8
9,7
9,2
9,6
9,6
10,1
9,7
9,3
9,6
9,5
5
10,9
9,7
9,8
9,7
9,5
El test t no sería factible ya que tendríamos que hacer muchos más cálculos, por ello lo haremos con ANOVA. En este caso se trata de un test de Análisis de un factor o ANOVA de un factor, donde el factor es el alumno.
Análisis de la varianza de un factor RESUMEN Grupos
Cuent a
Sum a
Promedi o
Varianz a
10,5
0,125
1
5
52,5
2
5
48,5
9,7
0,005
3
5
47,2
9,44
0,083
4
5
48,1
9,62
0,002
5
5
47,5
9,5
0,005
ANÁLISIS DE VARIANZA
Origen de las variaciones Entre grupos Dentro de los grupos Total
Suma de cuadrado Grados de s libertad 3,7024 4 0,88
20
4,5824
24
Promedio de los cuadrados F 0,9256 21,0363636
Probabilidad 6,1939E-07
Valor crítico para F 2,8660814
0,044
Si observamos, vemos como Fcalculado (21,0363)>Fcrítico (2,866) podemos decir que hay una diferencia con nivel de significación y es cierto de que hay influencia del factor controlado en las medias por lo tanto las diferencias si las hay son no aleatorias, y por tanto es un sesgo sistemático.
Ahora bien, si observamos el promedio de cada grupo de análisis, observamos algún dato dispar comparado con los demás, por lo que realizamos un cálculo del LSD (Mínima Diferencia Significativa) de la muestra para ver si realmente alguno de los alumnos origina datos significativamente diferente del resto.
L. S . D=t ( 0.05|20)∗
√
√
M SR∗2 ; L . S . D =2.0595∗ 0,044∗2 ; L . S . D=0 . 27322 nj 5 1
2
3
4
5
1
10,5
9,7
9,44
9,62
9,5
2 3
9,7
9,44
9,62
9,5
9,44
9,62
9,5
4
9,62
9,5
5
9,5 1
2
3
0,8 1,06
0,26
0,88
0,08
0,18
1
0,2
0,06
4
5
1 2 3 4 5
Para no repetir los datos me he limitado a poner los relevantes dentro de la resta que se hace entre el Promedio de todos los análisis, de manera que podemos observar como el alumno cuyo promedio de 10,5 es el que provoca el sesgo sistemático aumentando el valor medio si lo comparamos con las demás muestras, por lo que ciertamente si eliminamos los datos de este alumno muy posiblemente nos encontremos con una mejora de las medidas y no habría que eliminar ningún dato más ya que todos los demás valores se encuentran por debajo de 0,27 dado por el valor de L.S.D.
4. En nuestro laboratorio llevamos a cabo el análisis de las cuatro disoluciones mediante tres métodos diferentes (factor controlado), con el fin de eliminar en lo posible alguna interferencia que pudiera producirse como consecuencia del procedimiento seguido para su puesta en disolución. Se trata de saber por tanto: a) Si las cuatro disoluciones son del mismo problema (nos piden su concentración en cobre). b) Comparar si las variaciones entre los resultados de los distintos métodos son significativamente mayores que las debidas a los errores aleatorios. c) Separar la contribución de cada factor y la de los errores aleatorios a la precisión de los resultados. METODO/MUESTRA UV-V POLAROGRAFIA AAS
1 3 2 2
2 6 4 6
3 9 9 11
4 20 19 20
En este caso se trata de un test de Análisis de dos factores con una sola muestra por grupo, donde el factor 1 son las 4 muestras y el factor 2 son los distintos análisis:
Análisis de varianza de dos factores con una sola muestra por grupo RESUMEN
Cuenta
Suma
UV-V
4
38
POLAROGRAFIA
4
AAS
4 1
Promedio
Varianza 9,5
55
34
8,5
57,6666667
39
9,75
60,25
3
7
2,33333333
0,33333333
2
3
16
5,33333333
1,33333333
3
3
29
9,66666667
1,33333333
4
3
59
19,6666667
0,33333333
ANÁLISIS DE VARIANZA Origen de las variaciones
Suma de cuadrados
Grados de libertad
Promedio de los cuadrados
F
Probabilidad
Valor crítico para F
Métodos
3,5
2
1,75
3,31578947
0,10717188
5,14325285
Muestras
515,583333
3
171,861111
325,631579
4,9646E-07
4,75706266
Error
3,16666667
6
0,52777778
Total
522,25
11
a) Si las cuatro disoluciones son del mismo problema (nos piden su concentración en cobre). En este caso se puede observar que las cuatro muestras proceden de distinto lugar o son totalmente distintas entre ellas sin guardar ninguna relación, por lo que no se tratarían de muestras del mismo problema. En cualquier caso podremos decir que la concentración de Cobre en las distintas muestras es: Muestra Concentración promedio (ppm)
1
2
3
4
2,333
5,333
9,667
19,667
b) Comparar si las variaciones entre los resultados de los distintos métodos son significativamente mayores que las debidas a los errores aleatorios. Si observamos la tabla de ANOVA de dos factores con una sola muestra por grupo en el caso de los métodos la FcalculadaFcrítica, bastante mayor, por lo que podemos concretar que hay una diferencia con nivel de significación y es cierto de que hay influencia del factor controlado, en este caso las muestras. En las medias por lo tanto las diferencias si las hay son no aleatorias, y por tanto es un sesgo sistemático. La muestra en este caso no es homogénea, considerándose heterogénea. Se puede concretar que las muestras son totalmente distintas unas de otras y que con respecto al error aleatorio son significativamente mayores. c) Separar la contribución de cada factor y la de los errores aleatorios a la precisión de los resultados.
Como se ha comentado anteriormente, los errores asociados al análisis vienen del ámbito de las muestras, las cuales son totalmente distintas unas de otras por lo que el error introducido se debe a este factor, siendo el factor de los métodos totalmente homogéneo al encontrarse por debajo de los límites sopesados. Debemos decir por tanto, que la precisión de los resultados en los métodos es buena pudiéndose usar cualquiera de ellos atendiendo a otros factores que no influyen en este problema, pero no podemos decir lo mismo de las muestras, que aunque tratadas individualmente con los métodos utilizados nos dan datos parejos, si las tratamos individualmente con cada equipo no podríamos hablar de precisión debido a las mismas.
5. Se estudia la posible contaminación de una zona de varios Km2 por parte de las emisiones de una industria. Para ello, se cuadricula la zona y se toman 128 muestras de suelo, numeradas apropiadamente. Se llevan al laboratorio y se secan. A partir de ellas se obtienen 8 “muestras sintéticas” por mezcla aleatoria de 16 muestras originales cada una. Estas 8 muestras sintéticas se someten a un adecuado proceso de extracción (con ácido acético), se filtra, etc. etc. y se determinan Zn, Pb, Cd y Cu por quintuplicado, obteniendo los resultados que se muestran en las tablas. ¿Qué podemos afirmar respecto de los resultados obtenidos?
Muestra/Extracción A B C D E Muestra/Extracción A B C D E Muestra/Extracción A B C D E Muestra/Extracción A B
1 5,07 7 5,84 2 4,55 9 4,00 5 4,00 0
2 8,29 4 7,40 0 8,06 8 8,94 7 4,65 1
1 0,62 1 0,65 8 0,78 8 0,40 9 0,44 4
2 2,31 4 0,44 4 1,94 5 2,80 5 1,41
3 0,29 7 0,30 5 0,37 1 0,49 2 0,57 5
1 0,06 8 0,08 2 0,02 1 0,21 3 0,05 3
2 0,05 7 0,13 7 0,11 5 0,08 7 0,05 2
3 0,16 1 0,25 6 0,04 6 0,00 8 0,04 6
1 0,11 3 0,04
2
3 0,01 3 0,02
0,11 0,23
3 1,41 1,07 6 2,15 2 0,97 9 1,24 9
Zn (ppm) 4 5 6 7 8 2,02 1,55 2,21 1,32 8 8 62,307 9 2 2,41 1,59 0,99 2,30 3 8 49,517 7 6 1,53 1,31 2,65 1,64 1 0 67,31 1 4 1,83 2,25 2,65 1,11 7 1 50,514 4 9 1,41 1,86 2,24 1,52 3 9 58,57 8 0 Pb (ppm) 4 5 6 7 8 1,53 0,53 0,46 0,63 1 5 1,586 8 1 2,07 0,35 0,45 0,44 5 9 1,479 6 5 1,37 0,27 0,49 0,58 2 1 1,526 2 7 1,60 0,59 0,54 0,55 1 5 1,236 5 5 0,42 1,04 0,60 1,06 6 1,328 1 7 Cd (ppm) 4 5 6 7 8 0,11 0,10 0,05 0,11 9 0,298 6 8 0,08 0,03 0,14 0,14 5 7 0,108 9 1 0,22 0,05 0,04 0,07 3 5 0,244 2 5 0,15 0,01 0,01 0,05 9 5 0,241 9 6 0,34 0,03 0,10 0,13 1 2 0,104 7 6 Cu (ppm) 4 5 6 7 8 0,02 0,06 0,03 0,03 0 0,071 8 8 0,04 0,00 0,05 0,04 0,02
7 0,11 1 0,09 3 0,03 3
C D E
6 0,25 6 0,29 8 0,24 8
8 0,00 8 0,05 4 0,02 9
4 0,03 0,04 1 0,01 2
0 0,02 3 0,00 9 0,00 2
0,062 0,052 0,039
4 0,08 5 0,08 2 0,09 1
0,02 2 0,03 4 0,02 3
En el caso del Zn:
Análisis de varianza de un factor RESUMEN Grupos
Cuenta
Suma
13481,7322
Varianza
1
5
23,483
4,6966
0,6097853
2
5
37,36
7,472
2,7924375
3
5
6,866
1,3732
0,2167577
4
5
9,222
1,8444
0,1603488
5
5
8,586
1,7172
0,1283377
6
5
288,218
57,6436
58,2294073
7
5
10,769
2,1538
0,4621797
8
5
7,911
1,5822
0,2034582
ANÁLISIS DE VARIANZA Origen de las Suma de Grados de variaciones cuadrados libertad Entre grupos 13230,5214 7 Dentro de los grupos 251,210849 32 Total
Promedio
Promedio de los cuadrados 1890,07448
F 240,763421
Probabilidad 8,0564E-26
Valor crítico para F 2,31274119
7,85033903
39
En el caso del Zn y tras haber tomado las muestras, podemos decir que debido a que Fcalculada > Fcrítica, se puede decir que las muestras no pertenecen a una misma población por lo que las diferencias son no aleatorias, por lo que el sesgo es sistemático. Si observamos el promedio de las muestras, se puede ver que de todas las muestras analizadas, la 3, 4, 5 y 8 si que pertenecen a una misma población, mientras que la 1, 2, 6 y 7
son de poblaciones distintas incluso entre ellas. Tan solo habría que hacer otro análisis de un factor para comprobar que el lugar de donde se recogen las muestras sí que afectan al resultado final. ANÁLISIS DE VARIANZA Origen de las Suma de variaciones cuadrados Entre grupos 0,60900015 Dentro de los grupos 2,8356096 Total
3,44460975
Grados de libertad 3
Promedio de los cuadrados 0,20300005
16
0,1772256
F 1,145433
Probabilida d 0,36092603
Valor crítico para F 3,23887152
19
Como podemos ver y tras varias pruebas se comprueba que realmente las muestras de la zona 3, 4, 5 y 8 son de una misma población y no hay factores que alteren el lugar de muestreo.
En el caso del Pb:
Análisis de varianza de un factor RESUMEN Grupos
ANÁLISIS DE VARIANZA Origen de las Suma de variaciones cuadrados Entre grupos 11,0629284 Dentro de los grupos 4,411324 Total
15,4742524
Cuenta 1
5
Suma 2,92
2
5
8,918
3
5
2,04
0,408
0,014811
4
5
7,639
1,5278
0,1369767
5
5
2,186
0,4372
0,0170822
6
5
7,155
1,431
0,020997
7
5
3,002
0,6004
0,0618323
8
5
2,825
0,565
0,005276
Grados de libertad 7
Promedio de los cuadrados 1,58041834
32
0,13785388
Promedio 0,584
Varianza 0,0246715
1,7836
0,8211843
F 11,4644462
Valor crítico Probabilidad para F 3,4771E-07 2,31274119
39
En el caso del Pb y tras haber tomado las muestras, podemos decir que debido a que Fcalculada > Fcrítica, aunque en este caso la diferencia entre las F es mucho menor que el anterior, se puede decir que las muestras no pertenecen a una misma población por lo que las diferencias son no aleatorias, por lo que el sesgo es sistemático. Si observamos el promedio de las muestras, se puede ver que de todas las muestras analizadas, la 1, 3, 5, 7 y 8 si que pertenecen a una misma población, mientras que la 2, 4 y 6 son de poblaciones distintas aunque en este caso es posible que la alteración según el lugar de recogida es bastante menor que la de Zn. Tan solo habría que hacer otro análisis de un factor para comprobarlo, aunque en este caso sabemos que no es necesario.
En el caso del Cd:
Análisis de varianza de un factor RESUMEN Grupos
Cuenta 1
5
Suma 0,437
2
5
0,448
0,0896
0,0013438
3
5
0,517
0,1034
0,0105738
4
5
0,918
0,1836
0,0105178
5
5
0,258
0,0516
0,0016228
6
5
0,995
0,199
0,007724
7
5
0,423
0,0846
0,0028063
8
5
0,466
0,0932
0,0017677
ANÁLISIS DE VARIANZA Origen de las Suma de Grados de variaciones cuadrados libertad Entre grupos 0,0931359 7 Dentro de los grupos 0,167198 32 Total
0,2603339
Promedio de los cuadrados 0,01330513
Promedio 0,0874
Varianza 0,0054433
F
Probabilidad
2,54646655
0,03338432
Valor crítico para F 2,31274119
0,00522494
39
En el caso del Cd y tras haber tomado las muestras, podemos decir que debido a que Fcalculada > Fcrítica, aunque la distancia entre F es mucho menor que incluso el anterior, casi inapreciable, se puede decir que las muestras no pertenecen a una misma población por lo que las diferencias son no aleatorias, por lo que el sesgo es sistemático. Si observamos el promedio de las muestras, se puede ver que de todas las muestras analizadas, la 1, 2, 5, 7 y 8 si que pertenecen a una misma población, mientras que la 3, 4 y 6 son de poblaciones distintas aunque en este caso es posible que la alteración según el lugar de recogida es bastante menor que la de Pb. Tan solo habría que hacer otro análisis de un factor para comprobarlo, aunque en este caso sabemos que no es necesario.
En el caso del Cu:
Análisis de varianza de un factor RESUMEN Grupos
Cuenta 1
5
Suma 0,397
2
5
1,148
0,2296
0,0050148
3
5
0,132
0,0264
0,0003223
4
5
0,157
0,0314
0,0001578
5
5
0,054
0,0108
0,0001077
6
5
0,274
0,0548
0,0001487
7
5
0,37
0,074
0,0003525
8
5
0,137
0,0274
6,48E-05
ANÁLISIS DE VARIANZA Origen de las Suma de Grados de variaciones cuadrados libertad Entre grupos 0,17216038 7 Dentro de los grupos 0,0301896 32 Total
0,20234998
Promedio 0,0794
Varianza 0,0013788
Promedio de los F cuadrados 0,02459434 26,0692045
Probabilida d 1,6464E-11
Valor crítico para F 2,31274119
0,00094343
39
En el caso del Cu y tras haber tomado las muestras, podemos decir que debido a que Fcalculada > Fcrítica, aunque la distancia entre F es algo mayor que la de Pb y Cd, se puede decir que las muestras no pertenecen a una misma población por lo que las diferencias son no aleatorias, por lo que el sesgo es sistemático. Si observamos el promedio de las muestras, se puede ver que de todas las muestras analizadas, la 3, 4, 5 y 8 si que pertenecen a una misma población, mientras que la 2 es una muestra aislada, y la 1 y 7 son muestras que son de una misma población, aunque en este caso es posible que la alteración según el lugar de recogida es bastante menor que la de Zn, pero mayor que la de Cd y Pb. Tan solo habría que hacer otro análisis de un factor para comprobarlo, aunque en este caso sabemos que no es necesario. CONCLUSIÓN: Observando todos los casos dentro de una misma zona de contaminación las muestras correspondientes a Zn y Cu contienen mayores alteraciones poblaciones que las analizadas de Pb y Cd. De esta forma podemos decir que en un orden lógico de menor a mayor alteración poblacional las muestras se encuentran del siguiente modo: Cd...