Tabla de fórmulas Int. a la Estadística PDF

Title Tabla de fórmulas Int. a la Estadística
Course Introducción a la Estadística (ADE)
Institution UNED
Pages 8
File Size 440.9 KB
File Type PDF
Total Downloads 73
Total Views 138

Summary

Fórmulas para introducción a la estadística...


Description

Fórmulas de Estadística Descriptiva

RBM

MEDIDAS EN DISTRIBUCIONES UNIDIMENSIONALES Definiciones generales Concepto Frecuencia absoluta Frecuencia total Frecuencia absoluta acumulada

Fórmula

Aclaraciones, interpretación y propiedades

ni

Número de veces que se presenta un valor

N

Suma de todas las frecuencias absolutas

Ni

Suma de la frecuencia absoluta de un valor más la suma de las frecuencias absolutas anteriores

Fi

Suma de las frecuencias relativas fi de un valor más los valores anteriores a él

Momentos

Frecuencia relativa Frecuencia relativa acumulada

Es la diferencia entre los dos extremos de un intervalo

Amplitud de intervalo

Marca de clase

Punto medio de cada intervalo

MEDIDAS DE POSICIÓN DE TENDENCIA CENTRAL Concepto

Fórmula

Aclaraciones, interpretación y propiedades   

Media aritmética

 

Momentos

Es muy sensible a los valores extremos No vale para valores cualitativos Problemas de cálculo en distribuciones tipo III con intervalos abiertos Cambio de origen: queda aumentada en la constante sumada Cambio de escala: queda multiplicada por la constante

Para distribuciones tipo I

Media aritmética ponderada por coeficientes

Para distribuciones tipo II y III

Distribuciones tipo I

 

Media geométrica

  Distribuciones tipo II y III



 Distribuciones tipo I 

Media armónica

 Distribuciones tipo II y III

Propiedad general para las medias aritmética, geométrica y armónica

Estadística Descriptiva

H ≤G ≤



Menos sensible que la media aritmética Para distribuciones acumulativas y multiplicativas (porcentajes, números índice…) No puede haber valores nulos Puede no tener sentido con valores negativos Indicado para promedios de crecimiento Sólo para unidades relativas (km/h, rendimientos, productividades…) Menor influencia de valores extremos Sólo se puede calcular si NO hay datos iguales a 0 Valores muy pequeños pueden carecer de significado

Siempre se cumple

Ramiro Bermúdez Martínez

1

Fórmulas de Estadística Descriptiva

RBM

Para N impar

Mediana para distribuciones tipo I Para N par

Cuando

existe

un

Mediana para tipo II Cuando

Primer

Límite superior del intervalo en el que

no

existe

un

Es la medida más representativa en el caso de variables cualitativas o atributos ordenables  No es sensible a valores extremos Puede ser adecuado en el caso de intervalos abiertos



Si existe

Mediana para tipo III Si NO existe un

En este caso también sería válido como Me la marca de clase o la aproximación mediante una regla de tres.

En las distribuciones tipo III podemos aproximarnos con la siguiente fórmula:

Valor que presenta mayor frecuencia absoluta

Moda

Si los intervalos tienen distinta amplitud y teniendo en cuenta que:

MEDIDAS DE POSICIÓN ROBUSTAS DE TENDENCIA CENTRAL Media K-recortada

Centrimedia

Media K-Winsorizada

Es la media de los datos que quedan después de eliminar el k por ciento de los datos más grandes y el k por ciento de los datos más pequeños

Media recortada al 20% de: 1 2 3 4 5 6 7 8 9 10 Quedaría: 3 4 5 6 7 8

Media recortada al 25% Se sustituyen el k % de los datos más grandes y más pequeños por el valor mayor y menor de los datos restantes

Media winsorizada al 20% de: 1 2 3 4 5 6 7 8 9 10 Quedaría: 3 3 3 4 5 6 7 8 8 8

Trimedia

2

Ramiro Bermúdez Martínez

Estadística Descriptiva

Fórmulas de Estadística Descriptiva

RBM

MEDIDAS DE POSICIÓN NO CENTRAL Donde: r = cuantil correspondiente q = número de intervalos

Los principales son: Cuartiles

Cuantiles

Para distribuciones agrupadas en intervalos:

Deciles

q=4

r=1,2,3.

q = 10

r=1,2…9.

Percentiles q = 100 r = 1,2…99

MOMENTOS DE UNA DISTRIBUCIÓN UNIDIMENSIONAL Momentos origen

respecto

al

Momentos centrales respecto a la media

o

Si h = 0 entonces a0 = 1 Si h = 1 entonces a1 =

MEDIDAS DE DISPERSIÓN 

Muy sensible a los valores extremos Puede dar valores poco representativos Muy sensible a los valores extremos Puede dar valores poco representativos

Rango, Recorrido o Amplitud total de la distribución

Cuanto mayor sea su valor, mayor será la dispersión

Coeficiente de apertura

Cuanto mayor sea su valor, mayor será la dispersión

Recorrido o Rango intercuartílico

Cuanto mayor sea su valor, mayor será la dispersión



Es mucho menos sensible a los valores extremos

Rango entre percentiles

Cuanto mayor sea su valor, mayor será la dispersión



Menos sensible a los valores extremos



Menos sensible a los valores extremos



Menos sensible a los valores extremos

Expresa el número de veces que el recorrido contiene a la media.

Recorrido relativo

  

Cuanto mayor sea su valor, mayor será la dispersión

Recorrido semiintercuartílico

Cuanto mayor sea su valor, mayor será la dispersión

Desviación media

Cuanto mayor sea su valor, mayor será la dispersión

Desviación mediana

Cuanto mayor sea su valor, mayor será la dispersión La varianza siempre es mayor o igual que 0

Varianza

Estadística Descriptiva

Cuanto mayor sea la varianza mayor dispersión existirá y menor representatividad tendrá la media aritmética

Ramiro Bermúdez Martínez





Al estar elevado al cuadrado puede tener difícil interpretación (segundos al cuadrado…) Se utiliza cuando se trata a toda la población

3

Fórmulas de Estadística Descriptiva

RBM 

Una desviación típica pequeña significa que los valores de la distribución están próximos a la media Una desviación típica grande indica que hay valores muy alejados de la media



Desviación típica



  

Es la medida de dispersión más empleada Siempre es ≥ 0 No está afectada por cambios de origen Sí está afectada por cambios de escala (queda multiplicada por el factor de escala)

Se utiliza cuando se trata a toda la población

Cuasivarianza

Ídem a varianza

Se utiliza cuando se trata de una muestra

Cuasidesviación típica

Ídem a desviación típica

Se utiliza cuando se trata de una muestra



Coeficiente de variación de Pearson

  

Se utiliza para eliminar la influencia de la unidad de medida y poder comparar la dispersión de dos distribuciones entre sí Si γ = 0 la representatividad de la media es máxima Si γ > 0,5 la media tiene poca representatividad Si γ > 0,75 hay que rechazar la media como parámetro representativo



El coeficiente NO varía ante cambios de escala



El coeficiente SI varía ante cambios de origen

MEDIDAS DE CONCENTRACIÓN

 Mide si existe un reparto equitativo o poco o nada equitativo

Índice de Gini



Vale 0 cuando la variable está repartida de forma muy homogénea Vale 1 cuando está muy concentrada

Es la medida de concentración más utilizada

  Curva de Lorenz



Es una forma gráfica de mostrar la dispersión o concentración de una distribución Si la variable está distribuida de forma equitativa la curva coincide con la línea de 45 grados que pasa por el origen Cuanta más concentración exista más pronunciada será la curva hacia abajo.

Se usan los datos de la tabla del Índice de Gini para su confección

4

Ramiro Bermúdez Martínez

Estadística Descriptiva

Fórmulas de Estadística Descriptiva

RBM

MEDIDAS DE FORMA 

Coeficiente de asimetría de Fisher

 

Si g1 = 0 la distribución puede ser simétrica o no, pero si es simétrica siempre dará 0 Si g1 < 0 la distribución es asimétrica a la izquierda (negativa) Si g1 > 0 la distribución es asimétrica a la derecha (positiva)

Coeficiente de asimetría de Pearson

Ídem a coeficiente de asimetría de Fisher

Coeficiente de asimetría de Bowley

Ídem a coeficiente de asimetría de Fisher



Coeficiente de Curtosis

 



Aplicable a todo tipo de distribución

Es el más empleado

Aplicable sólo a las distribuciones unimodales y con forma de campana

Si g2 = 0 distribución mesocúrtica o normal Si g2 < 0 platicúrtica o menos apuntada que la normal Si g2 > 0 leptocúrtica o más apuntada

MEDIDAS EN DISTRIBUCIONES BIDIMENSIONALES Definiciones generales Frecuencia relativa La suma de todas las frecuencias relativas es igual a 1.

MEDIDAS DE POSICIÓN CENTRAL Medias aritméticas marginales

MEDIDAS DE DISPERSIÓN Varianzas marginales

COVARIACIÓN    

Covarianza

    

Estadística Descriptiva

Si da 0, X e Y no están relacionadas linealmente Si X e Y son independientes siempre da 0 ¡Ojo! no siempre que da 0 las variables son independientes Si es positiva, la correlación es positiva directa (a medida que crece una variable la otra también) Si es negativa, la correlación es negativa o inversa (a medida que crece una variable la otra decrece) Si es positiva, también es positivo Si es negativa, también es negatio Los cambios de origen NO afectan a la covarianza Los cambios de escala SI afectan a la covarianza

Ramiro Bermúdez Martínez

5

Fórmulas de Estadística Descriptiva

RBM

MOMENTOS DE UNA DISTRIBUCIÓN BIDIMENSIONAL Momentos origen

respecto

al

Fórmula general

a través de los momentos a través de los momentos

Momentos respecto al origen de segundo orden

Momento producto

Momentos respecto a la media

Fórmula general

Momentos respecto a la media puestos en relación con los momentos respecto al origen

CORRELACIÓN O GRADO DE DEPENDENCIA LINEAL ENTRE DOS VARIABLES Mide la correlación entre dos variables cuantitativas

Coeficiente de correlación lineal de Pearson

El valor de este parámetro está entre -1 y +1  Cuando la relación lineal es perfecta  Cuando no existe ninguna relación lineal  Cuando existe dependencia estadística o o o o

6

Ramiro Bermúdez Martínez

de 0 a ± 0,25 no existe correlación suficiente de ± 0,25 a ± 0,50 baja correlación de ± 0,50 a ± 0,75 buena correlación ± 0,75 o mayor, excelente correlación

Estadística Descriptiva

Fórmulas de Estadística Descriptiva

RBM

REGRESIÓN LINEAL SIMPLE Tendrá la forma Recta de regresión de Y sobre X

Que dan lugar a:

La anterior fórmula es el resultado del siguiente sistema de ecuaciones:

Que dan lugar a:

y su fórmula es:

Tendrá la forma Recta de regresión de X sobre Y

La anterior fórmula es el resultado del siguiente sistema de ecuaciones:

y su fórmula es:

RECTAS DE REGRESIÓN A TRAVÉS DE LOS MOMENTOS Recta de regresión de Y sobre X a través de los momentos

Recta de regresión de X sobre Y a través de los momentos

BONDAD DEL AJUSTE Y PREDICCIONES Error de predicción

Cuando esta medida es alta los residuos son grandes y la función estimada es poco representativa Cuando es baja existe bastante representatividad

Varianza residual

Donde: Coeficiente de

2

determinación R . Fórmula general para cualquier tipo de regresión. Modelo utilizado en los exámenes

Coeficiente de

2

determinación R para el caso concreto de regresión lineal

Coeficiente de 2 determinación R según fórmulas del libro de texto

Estadística Descriptiva

Donde:

Si

0 entonces

Si

0 entonces

En este caso R2 coincide con el Coeficiente de correlación lineal de Pearson elevado al cuadrado.

   

Tiene un valor comprendido entre 0 y 1 Si es 0 entonces la ecuación de regresión no tiene ninguna representatividad Si es 1 entonces se ajusta perfectamente Se recomienda valores superiores a 0,85

Ramiro Bermúdez Martínez

7

Fórmulas de Estadística Descriptiva

RBM

REGRESIÓN NO LINEAL Función polinómica

Función potencial

Función exponencial

Función logarítmica

ASOCIACIÓN ENTRE VARIABLES CUALITATIVAS

Estadístico

Siendo: r = el número de filas s = el número de columnas Oij = frecuencia observada Eij = frecuencia esperada

2



 

ODDS Ratio

Si OR > 1 → probabilidad de “a favor” es mayor en x que en y. Si OR = 1 → ambas probabilidades son iguales. Si OR < 1 → probabilidad de “a favor” es menor en x que en y.

Toma valores ≥ 0, siendo 0 independencia absoluta

 



El valor de esta medida está comprendido en el intervalo (0; ∞).



Coeficiente de contingencia C (de Pearson)

   

Coeficiente V de Cramer

Q de Yule Donde:

8

Es invariante ante los cambios de escala en filas y/o columnas. Alcanza sus valores extremos, 0 e ∞, bajo asociación perfecta. OR y 1/OR indican igual intensidad de la asociación, pero en direcciones opuestas.

Mide el grado de asociación entre dos conjuntos de atributos, ordenados o no Es independiente de la naturaleza de la variable (continua o discreta) El valor está entre 0 y 1 Cuanto mayor es el valor mayor interdependencia Nunca puede alcanzar el valor uno aunque haya completa asociación

 

Se obtiene a partir de 2 Su valor oscila entre 0 y 1 ◦ 0 = independencia total ◦ 1 = completa asociación



Está comprendida entre -1 y 1 ◦ Q = 0 independencia ◦ Q > 0 asociación positiva ◦ Q < 0 asociación negativa

Ramiro Bermúdez Martínez

Estadística Descriptiva...


Similar Free PDFs