S TAT - T11 - tema 11 segundo parcial de estadistica PDF

Title S TAT - T11 - tema 11 segundo parcial de estadistica
Course Estadística
Institution Universidad Católica San Antonio de Murcia
Pages 2
File Size 253.2 KB
File Type PDF
Total Downloads 14
Total Views 164

Summary

tema 11 segundo parcial de estadistica...


Description

Intro Al trabajar simultáneamente con dos variables cualitativas nos interesa: • Describir el comportamiento conjunto de ambas variables • Comprobar si existe algún tipo de relación o asociación Tablas de contingencia Una tabla de contingencia es una tabla de frecuencias conjuntas que combina las categorías de ambas variables.

Aunque esto si lo es

Entonces esto no es una tabla de contingencia

En la tabla de contengencia los porcentajes por fila indican el porcentaje de cada frecuencia conjunta respecto a la frecuencia marginal de su fila. Es una distribucion condicionada, condicionada quiere decir: “La probabilidad de que sea fumador, CUANDO SÉ que es un hombre, es de 19.1%” La variable tabaquismo ESTÁ CONDICIONADA a la variable sexo. Los porcentajes por columna indican el porcentaje de cada frecuencia conjunta respecto a la frecuencia marginal de su columna, es tambien una distribucion condicionada. Ahora es la probabilidad de que sea hombre, CUANDO SÉ que es fumador La variable sexo ESTÁ CONDICIONADA a la variable tabaquismo. Los porcentajes del total indican el porcentaje de cada frecuencia conjunta respecto al numero total de casos de la tabla. Cada porcentaje es la PROBABILIDAD CONJUNTA de que sea hombre y fumador → La finalidad de las tablas de contingencia;: • Es averiguar si dos (o más) variables tienen o no que ver algo entre sí, si están o no relacionadas. • Con dos variables categóricas sólo caben dos posibilidades: independencia o relación. • Dos variables son independientes cuando el comportamiento de una de ellas no se ve alterado por la otra. Entonces podemos decir que si las variables tabaquismo y sexo fuesen independientes, los porcentajes de tabaco dentro de sexo deberían ser iguales a los totales. Es lo mismo que decir que dos variables son independientes cuando las distribuciones condicionales son iguales sus respectivas distribuciones marginales.

O que dos variables son independientes si las frecuencias observadas son parecidas al producto de las frecuencias marginales/esperada (en este caso se calcula haciendoZ: número de mujeres (106) por el número de fumadores (60) partido por el número total de sujetos en el estudio (200)) → aqui podemos pensar que hay una dependencia entre el sexo y el tabaquismo El χ2 de Pearson Ahora si queremos ser más exactos y saber si esas diferencias son “grandes” o “pequeñas” debemos recurrir a una prueba estadística denominada χ2 de Pearson (se lee ji-cuadrado). Por eso se hace un promedio de las diferencias al cuadrado entre las frecuencias observadas y las esperadas. El resultado se comprueba en la tablas para la distribución χ2 que nos permite comprobar si esas diferencias son lo suficientemente grandes para considerar la dependencia. Despues calculos con el ordenador, suponiendo que fuesen independiente, obtenemos que la probabilidad encontrar un valor de 9,95 es 0,007 (0,7%), por tanto, pensamos que no son independientes => están RELACIONADAS. Al final cuanto mayor es el valor del resultado de X^2, MENOS probabilidad de que estén relacionadas

Aplicacion ejercicio: Hipotesis de partida H0Z: las 2 variables en estudios son independientes hipotesis alternativa Ha/H1Z: Las 2 variables en estudios estan relacionadas 1° etapa calculamos la frecuencia marginales fila: trat 1Z: 7 + 28 + 115 = 150 trat 2Z: 15 + 20 + 85 = 120 trat 3Z: 10 + 30 + 90 = 130 trat 4Z: 5 + 40 + 115 = 160 2° etapa igual pero con la frecuencia marginal columna: peorZ: 7 + 15 + 10 + 5 = 37 igualZ: 28 + 20 + 30 + 40 = 118 mejorZ: 115 + 85 + 90 + 115 = 405 3° etapa, para saber si rechazamos o no H0 tenemos que calcular las frecuencias esperadas: Se calcula haciendo (total de la fila* total de la columa)/total global aqui → 150*37/560 = 9.91 etc.. 4° etapa tenemos que medir las discrepancias: Por calcularla → Si la hipotesis nula (H0) es cierta X² sigue una distribucion Chi cuadrado con (I-1)(J-1) grados de libertad o (numero de columna -1) * (numero de fila -1). rechazamos H0 cuando X² experimental > X² critico (= obtenido en la tabla del Ji-Cuadrado teniendo en cuenta los grados de libertad que se leen en la columna IZQ/ordonée) → 13.87 > 12.59 = la repuesta depende del tratamiento...


Similar Free PDFs