Ejercicios Anova PDF

Title Ejercicios Anova
Author Isabel Millan Diaz
Course Química Analítica y Bioquímica
Institution Universidad de Huelva
Pages 11
File Size 242.1 KB
File Type PDF
Total Downloads 72
Total Views 133

Summary

ejercicios anova con solución...


Description

Estadístic a ANOVA Ampliación de Química Analítica Fco Javier Franco Carmona

1. Se tienen los resultados correspondientes a la normalización de una disolución de hidróxido sódico por 5 alumnos (volumen en ml de reactivo gastado), cada uno de los cuales valora con dicho hidróxido sódico y por quintuplicado una misma disolución patrón preparada con ftalato ácido de potasio tipo primario. A la vista de los resultados indique si alguno de los alumnos origina resultados significativamente diferentes del resto, y en caso afirmativo identifíquele. Alumnos/Análisis 1

1 10,2

2 9,8

3 9,7

4 9,6

5 9,5

2

10,5

9,6

9,2

9,6

9,4

3 4

10,8

9,7

9,2

9,6

9,6

10,1

9,7

9,3

9,6

9,5

5

10,9

9,7

9,8

9,7

9,5

El test t no sería factible ya que tendríamos que hacer muchos más cálculos, por ello lo haremos con ANOVA. En este caso se trata de un test de Análisis de un factor o ANOVA de un factor, donde el factor es el alumno.

Análisis de la varianza de un factor RESUMEN Grupos

Cuent a

Sum a

Promedi o

Varianz a

10,5

0,125

1

5

52,5

2

5

48,5

9,7

0,005

3

5

47,2

9,44

0,083

4

5

48,1

9,62

0,002

5

5

47,5

9,5

0,005

ANÁLISIS DE VARIANZA

Origen de las variaciones Entre grupos Dentro de los grupos Total

Suma de cuadrado Grados de s libertad 3,7024 4 0,88

20

4,5824

24

Promedio de los cuadrados F 0,9256 21,0363636

Probabilidad 6,1939E-07

Valor crítico para F 2,8660814

0,044

Si observamos, vemos como Fcalculado (21,0363)>Fcrítico (2,866) podemos decir que hay una diferencia con nivel de significación y es cierto de que hay influencia del factor controlado en las medias por lo tanto las diferencias si las hay son no aleatorias, y por tanto es un sesgo sistemático.

Ahora bien, si observamos el promedio de cada grupo de análisis, observamos algún dato dispar comparado con los demás, por lo que realizamos un cálculo del LSD (Mínima Diferencia Significativa) de la muestra para ver si realmente alguno de los alumnos origina datos significativamente diferente del resto.

L. S . D=t ( 0.05|20)∗





M SR∗2 ; L . S . D =2.0595∗ 0,044∗2 ; L . S . D=0 . 27322 nj 5 1

2

3

4

5

1

10,5

9,7

9,44

9,62

9,5

2 3

9,7

9,44

9,62

9,5

9,44

9,62

9,5

4

9,62

9,5

5

9,5 1

2

3

0,8 1,06

0,26

0,88

0,08

0,18

1

0,2

0,06

4

5

1 2 3 4 5

Para no repetir los datos me he limitado a poner los relevantes dentro de la resta que se hace entre el Promedio de todos los análisis, de manera que podemos observar como el alumno cuyo promedio de 10,5 es el que provoca el sesgo sistemático aumentando el valor medio si lo comparamos con las demás muestras, por lo que ciertamente si eliminamos los datos de este alumno muy posiblemente nos encontremos con una mejora de las medidas y no habría que eliminar ningún dato más ya que todos los demás valores se encuentran por debajo de 0,27 dado por el valor de L.S.D.

4. En nuestro laboratorio llevamos a cabo el análisis de las cuatro disoluciones mediante tres métodos diferentes (factor controlado), con el fin de eliminar en lo posible alguna interferencia que pudiera producirse como consecuencia del procedimiento seguido para su puesta en disolución. Se trata de saber por tanto: a) Si las cuatro disoluciones son del mismo problema (nos piden su concentración en cobre). b) Comparar si las variaciones entre los resultados de los distintos métodos son significativamente mayores que las debidas a los errores aleatorios. c) Separar la contribución de cada factor y la de los errores aleatorios a la precisión de los resultados. METODO/MUESTRA UV-V POLAROGRAFIA AAS

1 3 2 2

2 6 4 6

3 9 9 11

4 20 19 20

En este caso se trata de un test de Análisis de dos factores con una sola muestra por grupo, donde el factor 1 son las 4 muestras y el factor 2 son los distintos análisis:

Análisis de varianza de dos factores con una sola muestra por grupo RESUMEN

Cuenta

Suma

UV-V

4

38

POLAROGRAFIA

4

AAS

4 1

Promedio

Varianza 9,5

55

34

8,5

57,6666667

39

9,75

60,25

3

7

2,33333333

0,33333333

2

3

16

5,33333333

1,33333333

3

3

29

9,66666667

1,33333333

4

3

59

19,6666667

0,33333333

ANÁLISIS DE VARIANZA Origen de las variaciones

Suma de cuadrados

Grados de libertad

Promedio de los cuadrados

F

Probabilidad

Valor crítico para F

Métodos

3,5

2

1,75

3,31578947

0,10717188

5,14325285

Muestras

515,583333

3

171,861111

325,631579

4,9646E-07

4,75706266

Error

3,16666667

6

0,52777778

Total

522,25

11

a) Si las cuatro disoluciones son del mismo problema (nos piden su concentración en cobre). En este caso se puede observar que las cuatro muestras proceden de distinto lugar o son totalmente distintas entre ellas sin guardar ninguna relación, por lo que no se tratarían de muestras del mismo problema. En cualquier caso podremos decir que la concentración de Cobre en las distintas muestras es: Muestra Concentración promedio (ppm)

1

2

3

4

2,333

5,333

9,667

19,667

b) Comparar si las variaciones entre los resultados de los distintos métodos son significativamente mayores que las debidas a los errores aleatorios. Si observamos la tabla de ANOVA de dos factores con una sola muestra por grupo en el caso de los métodos la FcalculadaFcrítica, bastante mayor, por lo que podemos concretar que hay una diferencia con nivel de significación y es cierto de que hay influencia del factor controlado, en este caso las muestras. En las medias por lo tanto las diferencias si las hay son no aleatorias, y por tanto es un sesgo sistemático. La muestra en este caso no es homogénea, considerándose heterogénea. Se puede concretar que las muestras son totalmente distintas unas de otras y que con respecto al error aleatorio son significativamente mayores. c) Separar la contribución de cada factor y la de los errores aleatorios a la precisión de los resultados.

Como se ha comentado anteriormente, los errores asociados al análisis vienen del ámbito de las muestras, las cuales son totalmente distintas unas de otras por lo que el error introducido se debe a este factor, siendo el factor de los métodos totalmente homogéneo al encontrarse por debajo de los límites sopesados. Debemos decir por tanto, que la precisión de los resultados en los métodos es buena pudiéndose usar cualquiera de ellos atendiendo a otros factores que no influyen en este problema, pero no podemos decir lo mismo de las muestras, que aunque tratadas individualmente con los métodos utilizados nos dan datos parejos, si las tratamos individualmente con cada equipo no podríamos hablar de precisión debido a las mismas.

5. Se estudia la posible contaminación de una zona de varios Km2 por parte de las emisiones de una industria. Para ello, se cuadricula la zona y se toman 128 muestras de suelo, numeradas apropiadamente. Se llevan al laboratorio y se secan. A partir de ellas se obtienen 8 “muestras sintéticas” por mezcla aleatoria de 16 muestras originales cada una. Estas 8 muestras sintéticas se someten a un adecuado proceso de extracción (con ácido acético), se filtra, etc. etc. y se determinan Zn, Pb, Cd y Cu por quintuplicado, obteniendo los resultados que se muestran en las tablas. ¿Qué podemos afirmar respecto de los resultados obtenidos?

Muestra/Extracción A B C D E Muestra/Extracción A B C D E Muestra/Extracción A B C D E Muestra/Extracción A B

1 5,07 7 5,84 2 4,55 9 4,00 5 4,00 0

2 8,29 4 7,40 0 8,06 8 8,94 7 4,65 1

1 0,62 1 0,65 8 0,78 8 0,40 9 0,44 4

2 2,31 4 0,44 4 1,94 5 2,80 5 1,41

3 0,29 7 0,30 5 0,37 1 0,49 2 0,57 5

1 0,06 8 0,08 2 0,02 1 0,21 3 0,05 3

2 0,05 7 0,13 7 0,11 5 0,08 7 0,05 2

3 0,16 1 0,25 6 0,04 6 0,00 8 0,04 6

1 0,11 3 0,04

2

3 0,01 3 0,02

0,11 0,23

3 1,41 1,07 6 2,15 2 0,97 9 1,24 9

Zn (ppm) 4 5 6 7 8 2,02 1,55 2,21 1,32 8 8 62,307 9 2 2,41 1,59 0,99 2,30 3 8 49,517 7 6 1,53 1,31 2,65 1,64 1 0 67,31 1 4 1,83 2,25 2,65 1,11 7 1 50,514 4 9 1,41 1,86 2,24 1,52 3 9 58,57 8 0 Pb (ppm) 4 5 6 7 8 1,53 0,53 0,46 0,63 1 5 1,586 8 1 2,07 0,35 0,45 0,44 5 9 1,479 6 5 1,37 0,27 0,49 0,58 2 1 1,526 2 7 1,60 0,59 0,54 0,55 1 5 1,236 5 5 0,42 1,04 0,60 1,06 6 1,328 1 7 Cd (ppm) 4 5 6 7 8 0,11 0,10 0,05 0,11 9 0,298 6 8 0,08 0,03 0,14 0,14 5 7 0,108 9 1 0,22 0,05 0,04 0,07 3 5 0,244 2 5 0,15 0,01 0,01 0,05 9 5 0,241 9 6 0,34 0,03 0,10 0,13 1 2 0,104 7 6 Cu (ppm) 4 5 6 7 8 0,02 0,06 0,03 0,03 0 0,071 8 8 0,04 0,00 0,05 0,04 0,02

7 0,11 1 0,09 3 0,03 3

C D E

6 0,25 6 0,29 8 0,24 8

8 0,00 8 0,05 4 0,02 9

4 0,03 0,04 1 0,01 2

0 0,02 3 0,00 9 0,00 2

0,062 0,052 0,039

4 0,08 5 0,08 2 0,09 1

0,02 2 0,03 4 0,02 3

En el caso del Zn:

Análisis de varianza de un factor RESUMEN Grupos

Cuenta

Suma

13481,7322

Varianza

1

5

23,483

4,6966

0,6097853

2

5

37,36

7,472

2,7924375

3

5

6,866

1,3732

0,2167577

4

5

9,222

1,8444

0,1603488

5

5

8,586

1,7172

0,1283377

6

5

288,218

57,6436

58,2294073

7

5

10,769

2,1538

0,4621797

8

5

7,911

1,5822

0,2034582

ANÁLISIS DE VARIANZA Origen de las Suma de Grados de variaciones cuadrados libertad Entre grupos 13230,5214 7 Dentro de los grupos 251,210849 32 Total

Promedio

Promedio de los cuadrados 1890,07448

F 240,763421

Probabilidad 8,0564E-26

Valor crítico para F 2,31274119

7,85033903

39

En el caso del Zn y tras haber tomado las muestras, podemos decir que debido a que Fcalculada > Fcrítica, se puede decir que las muestras no pertenecen a una misma población por lo que las diferencias son no aleatorias, por lo que el sesgo es sistemático. Si observamos el promedio de las muestras, se puede ver que de todas las muestras analizadas, la 3, 4, 5 y 8 si que pertenecen a una misma población, mientras que la 1, 2, 6 y 7

son de poblaciones distintas incluso entre ellas. Tan solo habría que hacer otro análisis de un factor para comprobar que el lugar de donde se recogen las muestras sí que afectan al resultado final. ANÁLISIS DE VARIANZA Origen de las Suma de variaciones cuadrados Entre grupos 0,60900015 Dentro de los grupos 2,8356096 Total

3,44460975

Grados de libertad 3

Promedio de los cuadrados 0,20300005

16

0,1772256

F 1,145433

Probabilida d 0,36092603

Valor crítico para F 3,23887152

19

Como podemos ver y tras varias pruebas se comprueba que realmente las muestras de la zona 3, 4, 5 y 8 son de una misma población y no hay factores que alteren el lugar de muestreo.

En el caso del Pb:

Análisis de varianza de un factor RESUMEN Grupos

ANÁLISIS DE VARIANZA Origen de las Suma de variaciones cuadrados Entre grupos 11,0629284 Dentro de los grupos 4,411324 Total

15,4742524

Cuenta 1

5

Suma 2,92

2

5

8,918

3

5

2,04

0,408

0,014811

4

5

7,639

1,5278

0,1369767

5

5

2,186

0,4372

0,0170822

6

5

7,155

1,431

0,020997

7

5

3,002

0,6004

0,0618323

8

5

2,825

0,565

0,005276

Grados de libertad 7

Promedio de los cuadrados 1,58041834

32

0,13785388

Promedio 0,584

Varianza 0,0246715

1,7836

0,8211843

F 11,4644462

Valor crítico Probabilidad para F 3,4771E-07 2,31274119

39

En el caso del Pb y tras haber tomado las muestras, podemos decir que debido a que Fcalculada > Fcrítica, aunque en este caso la diferencia entre las F es mucho menor que el anterior, se puede decir que las muestras no pertenecen a una misma población por lo que las diferencias son no aleatorias, por lo que el sesgo es sistemático. Si observamos el promedio de las muestras, se puede ver que de todas las muestras analizadas, la 1, 3, 5, 7 y 8 si que pertenecen a una misma población, mientras que la 2, 4 y 6 son de poblaciones distintas aunque en este caso es posible que la alteración según el lugar de recogida es bastante menor que la de Zn. Tan solo habría que hacer otro análisis de un factor para comprobarlo, aunque en este caso sabemos que no es necesario.

En el caso del Cd:

Análisis de varianza de un factor RESUMEN Grupos

Cuenta 1

5

Suma 0,437

2

5

0,448

0,0896

0,0013438

3

5

0,517

0,1034

0,0105738

4

5

0,918

0,1836

0,0105178

5

5

0,258

0,0516

0,0016228

6

5

0,995

0,199

0,007724

7

5

0,423

0,0846

0,0028063

8

5

0,466

0,0932

0,0017677

ANÁLISIS DE VARIANZA Origen de las Suma de Grados de variaciones cuadrados libertad Entre grupos 0,0931359 7 Dentro de los grupos 0,167198 32 Total

0,2603339

Promedio de los cuadrados 0,01330513

Promedio 0,0874

Varianza 0,0054433

F

Probabilidad

2,54646655

0,03338432

Valor crítico para F 2,31274119

0,00522494

39

En el caso del Cd y tras haber tomado las muestras, podemos decir que debido a que Fcalculada > Fcrítica, aunque la distancia entre F es mucho menor que incluso el anterior, casi inapreciable, se puede decir que las muestras no pertenecen a una misma población por lo que las diferencias son no aleatorias, por lo que el sesgo es sistemático. Si observamos el promedio de las muestras, se puede ver que de todas las muestras analizadas, la 1, 2, 5, 7 y 8 si que pertenecen a una misma población, mientras que la 3, 4 y 6 son de poblaciones distintas aunque en este caso es posible que la alteración según el lugar de recogida es bastante menor que la de Pb. Tan solo habría que hacer otro análisis de un factor para comprobarlo, aunque en este caso sabemos que no es necesario.

En el caso del Cu:

Análisis de varianza de un factor RESUMEN Grupos

Cuenta 1

5

Suma 0,397

2

5

1,148

0,2296

0,0050148

3

5

0,132

0,0264

0,0003223

4

5

0,157

0,0314

0,0001578

5

5

0,054

0,0108

0,0001077

6

5

0,274

0,0548

0,0001487

7

5

0,37

0,074

0,0003525

8

5

0,137

0,0274

6,48E-05

ANÁLISIS DE VARIANZA Origen de las Suma de Grados de variaciones cuadrados libertad Entre grupos 0,17216038 7 Dentro de los grupos 0,0301896 32 Total

0,20234998

Promedio 0,0794

Varianza 0,0013788

Promedio de los F cuadrados 0,02459434 26,0692045

Probabilida d 1,6464E-11

Valor crítico para F 2,31274119

0,00094343

39

En el caso del Cu y tras haber tomado las muestras, podemos decir que debido a que Fcalculada > Fcrítica, aunque la distancia entre F es algo mayor que la de Pb y Cd, se puede decir que las muestras no pertenecen a una misma población por lo que las diferencias son no aleatorias, por lo que el sesgo es sistemático. Si observamos el promedio de las muestras, se puede ver que de todas las muestras analizadas, la 3, 4, 5 y 8 si que pertenecen a una misma población, mientras que la 2 es una muestra aislada, y la 1 y 7 son muestras que son de una misma población, aunque en este caso es posible que la alteración según el lugar de recogida es bastante menor que la de Zn, pero mayor que la de Cd y Pb. Tan solo habría que hacer otro análisis de un factor para comprobarlo, aunque en este caso sabemos que no es necesario. CONCLUSIÓN: Observando todos los casos dentro de una misma zona de contaminación las muestras correspondientes a Zn y Cu contienen mayores alteraciones poblaciones que las analizadas de Pb y Cd. De esta forma podemos decir que en un orden lógico de menor a mayor alteración poblacional las muestras se encuentran del siguiente modo: Cd...


Similar Free PDFs