Relación Entre DOS Variables Numéricas PDF

Title Relación Entre DOS Variables Numéricas
Author NOE HANAFI ALCOLEA
Course Análisis de Datos
Institution Universitat Pompeu Fabra
Pages 13
File Size 904.3 KB
File Type PDF
Total Downloads 80
Total Views 127

Summary

Walter...


Description

RELACIÓN ENTRE DOS VARIABLES NUMÉRICAS Introducción: Muchos estudios estadísticos buscan relaciones entre dos variables. Se buscan tendencias generales. A veces creemos que una de las variables puede explicar o influir sobre la otra. O sea, tenemos una pregunta causal 

¡Difícil de responder con datos observacionales!

Variable explicativa y respuesta: Una variable respuesta mide el resultado de un estudio  variable dependiente Una variable explicativa influye o explica cambios en la variable respuesta  variable independiente Una variable puede ser el resultado de una fuerza o es puede ser una fuerza que causa un cambio en otra variable. Herramientas de análisis: Dependerán del tipo de variables (numéricas o categóricas). Si las dos son numéricas, el procedimiento será: 1. 2. 3. 4.

Gráfico Aspecto general y desviaciones Resúmenes numéricos Si el aspecto general es regular, podemos describirlo con un modelo matemático

1. DIAGRAMA DE DEPRESIÓN Muestra la relación entre dos variables numéricas medidas para los mismos individuos. La variable explicativa (x) suele ir en el eje de las abscisas y la variable respuesta (y) en el eje de las ordenadas Cada individuo aparece como un punto del diagrama. En las distribuciones bidimensionales a cada individuo le corresponden los valores de dos variables, las representamos por el par (xi, yi). EJEMPLO: Considere los siguientes datos referidos al consumo de gas de una familia durante 16 meses. La variable respuesta y es la media de los consumos de gas diarios durante el mes, en m3 y la variable x es la media de los grados (unidad grados - día de calefacción diarios durante el mes -1 ºC equivale a 17,5ºC día de calefacción)

Si representamos cada par de valores como las coordenadas de un punto, el conjunto de todos ellos se llama nube de puntos o diagrama de dispersión. Diagrama de dispersión; Interpretación: a) Aspecto general y desviaciones b) Forma, dirección y fuerza de la relación c) Observaciones atípicas FORMA DE LA RELACION     

¿Forma lineal? ¿De U? ¿U invertida? Dos grupos Relación lineal

DIRECCIÓN 

 

Asociación positiva: valores superiores a la media de una de ellas tienden a ir acompañados de valores también superiores a la media de la otra variable y a su vez valores inferiores a la media también tienden a ocurrir con valores inferiores a la media de la otra variable) Asociación negativa: valores superiores a la media de una de las variables tiende a ir acompañado de valores inferiores a la media de la otra variable, y viceversa) No siempre hay una dirección clara

FUERZA 

Distancia de los puntos a una curva imaginaria

EJEMPLO: Ejemplo del consumo de gas y los grados

  

Relación fuerte Relación lineal Relación positiva fuerte

Inclusión de variables categóricas: Se pueden incluir variables categóricas en un diagrama de dispersión  utilizamos diferentes símbolos o colores para puntos con distintos valores de la variable categórica De esta forma podemos incluir 2 variables numéricas, más 1 categórica EJEMPLO: Los investigadores creen que el peso magro tiene una importante influencia en el nivel metabólico.

En las observaciones de hombres la relación tiene menos fuerza. Mayor dispersión. En general los valores de las dos variables son mayores entre los hombres  Observamos dos variables numéricas y una categórica. Nos permite visualizar la existencia o no de grupos, de diferentes comportamientos 2. CORRELACIÓN El diagrama de dispersión muestra la forma, dirección y fuerza de la relación entre dos variables cuantitativas. Decimos que una relación lineal es fuerte si los puntos del diagrama de dispersión se sitúan cerca de la recta, y débil si los puntos se hayan muy esparcidos respecto de la recta. Es nula si están muy esparcidos. EJEMPLOS: La correlación será fuerte cuanto más cerca estén los puntos de la recta.

PERO en los gráficos con datos reales a simple vista es muy difícil determinar la fuerza de una relación lineal, pues puede marearnos la escala

Ambos diagramas representan los mismos datos, pero con diferentes escalas, por lo que el diagrama B da la sensación de presentar una relación más fuerte entre ambas variables que el diagrama A Por esto es mejor usar medida numérica: la correlación Fórmula: La correlación es un resumen numérico para medir la fuerza de una relación lineal entre dos variables numéricas

Usaremos esta medida para complementar el gráfico Interpretación Primero: estandarizamos las observaciones (se interpreta como a cuántas desviaciones típicas se halla la observación de un individuo con respecto a la media) Segundo: multiplicamos cada x e y estandarizadas y hacemos la media.  

Una asociación positiva implica r>0 Una asociación negativa implica r...


Similar Free PDFs