Title | Tabla de fórmulas Int. a la Estadística |
---|---|
Course | Introducción a la Estadística (ADE) |
Institution | UNED |
Pages | 8 |
File Size | 440.9 KB |
File Type | |
Total Downloads | 73 |
Total Views | 138 |
Fórmulas para introducción a la estadística...
Fórmulas de Estadística Descriptiva
RBM
MEDIDAS EN DISTRIBUCIONES UNIDIMENSIONALES Definiciones generales Concepto Frecuencia absoluta Frecuencia total Frecuencia absoluta acumulada
Fórmula
Aclaraciones, interpretación y propiedades
ni
Número de veces que se presenta un valor
N
Suma de todas las frecuencias absolutas
Ni
Suma de la frecuencia absoluta de un valor más la suma de las frecuencias absolutas anteriores
Fi
Suma de las frecuencias relativas fi de un valor más los valores anteriores a él
Momentos
Frecuencia relativa Frecuencia relativa acumulada
Es la diferencia entre los dos extremos de un intervalo
Amplitud de intervalo
Marca de clase
Punto medio de cada intervalo
MEDIDAS DE POSICIÓN DE TENDENCIA CENTRAL Concepto
Fórmula
Aclaraciones, interpretación y propiedades
Media aritmética
Momentos
Es muy sensible a los valores extremos No vale para valores cualitativos Problemas de cálculo en distribuciones tipo III con intervalos abiertos Cambio de origen: queda aumentada en la constante sumada Cambio de escala: queda multiplicada por la constante
Para distribuciones tipo I
Media aritmética ponderada por coeficientes
Para distribuciones tipo II y III
Distribuciones tipo I
Media geométrica
Distribuciones tipo II y III
Distribuciones tipo I
Media armónica
Distribuciones tipo II y III
Propiedad general para las medias aritmética, geométrica y armónica
Estadística Descriptiva
H ≤G ≤
Menos sensible que la media aritmética Para distribuciones acumulativas y multiplicativas (porcentajes, números índice…) No puede haber valores nulos Puede no tener sentido con valores negativos Indicado para promedios de crecimiento Sólo para unidades relativas (km/h, rendimientos, productividades…) Menor influencia de valores extremos Sólo se puede calcular si NO hay datos iguales a 0 Valores muy pequeños pueden carecer de significado
Siempre se cumple
Ramiro Bermúdez Martínez
1
Fórmulas de Estadística Descriptiva
RBM
Para N impar
Mediana para distribuciones tipo I Para N par
Cuando
existe
un
Mediana para tipo II Cuando
Primer
Límite superior del intervalo en el que
no
existe
un
Es la medida más representativa en el caso de variables cualitativas o atributos ordenables No es sensible a valores extremos Puede ser adecuado en el caso de intervalos abiertos
Si existe
Mediana para tipo III Si NO existe un
En este caso también sería válido como Me la marca de clase o la aproximación mediante una regla de tres.
En las distribuciones tipo III podemos aproximarnos con la siguiente fórmula:
Valor que presenta mayor frecuencia absoluta
Moda
Si los intervalos tienen distinta amplitud y teniendo en cuenta que:
MEDIDAS DE POSICIÓN ROBUSTAS DE TENDENCIA CENTRAL Media K-recortada
Centrimedia
Media K-Winsorizada
Es la media de los datos que quedan después de eliminar el k por ciento de los datos más grandes y el k por ciento de los datos más pequeños
Media recortada al 20% de: 1 2 3 4 5 6 7 8 9 10 Quedaría: 3 4 5 6 7 8
Media recortada al 25% Se sustituyen el k % de los datos más grandes y más pequeños por el valor mayor y menor de los datos restantes
Media winsorizada al 20% de: 1 2 3 4 5 6 7 8 9 10 Quedaría: 3 3 3 4 5 6 7 8 8 8
Trimedia
2
Ramiro Bermúdez Martínez
Estadística Descriptiva
Fórmulas de Estadística Descriptiva
RBM
MEDIDAS DE POSICIÓN NO CENTRAL Donde: r = cuantil correspondiente q = número de intervalos
Los principales son: Cuartiles
Cuantiles
Para distribuciones agrupadas en intervalos:
Deciles
q=4
r=1,2,3.
q = 10
r=1,2…9.
Percentiles q = 100 r = 1,2…99
MOMENTOS DE UNA DISTRIBUCIÓN UNIDIMENSIONAL Momentos origen
respecto
al
Momentos centrales respecto a la media
o
Si h = 0 entonces a0 = 1 Si h = 1 entonces a1 =
MEDIDAS DE DISPERSIÓN
Muy sensible a los valores extremos Puede dar valores poco representativos Muy sensible a los valores extremos Puede dar valores poco representativos
Rango, Recorrido o Amplitud total de la distribución
Cuanto mayor sea su valor, mayor será la dispersión
Coeficiente de apertura
Cuanto mayor sea su valor, mayor será la dispersión
Recorrido o Rango intercuartílico
Cuanto mayor sea su valor, mayor será la dispersión
Es mucho menos sensible a los valores extremos
Rango entre percentiles
Cuanto mayor sea su valor, mayor será la dispersión
Menos sensible a los valores extremos
Menos sensible a los valores extremos
Menos sensible a los valores extremos
Expresa el número de veces que el recorrido contiene a la media.
Recorrido relativo
Cuanto mayor sea su valor, mayor será la dispersión
Recorrido semiintercuartílico
Cuanto mayor sea su valor, mayor será la dispersión
Desviación media
Cuanto mayor sea su valor, mayor será la dispersión
Desviación mediana
Cuanto mayor sea su valor, mayor será la dispersión La varianza siempre es mayor o igual que 0
Varianza
Estadística Descriptiva
Cuanto mayor sea la varianza mayor dispersión existirá y menor representatividad tendrá la media aritmética
Ramiro Bermúdez Martínez
Al estar elevado al cuadrado puede tener difícil interpretación (segundos al cuadrado…) Se utiliza cuando se trata a toda la población
3
Fórmulas de Estadística Descriptiva
RBM
Una desviación típica pequeña significa que los valores de la distribución están próximos a la media Una desviación típica grande indica que hay valores muy alejados de la media
Desviación típica
Es la medida de dispersión más empleada Siempre es ≥ 0 No está afectada por cambios de origen Sí está afectada por cambios de escala (queda multiplicada por el factor de escala)
Se utiliza cuando se trata a toda la población
Cuasivarianza
Ídem a varianza
Se utiliza cuando se trata de una muestra
Cuasidesviación típica
Ídem a desviación típica
Se utiliza cuando se trata de una muestra
Coeficiente de variación de Pearson
Se utiliza para eliminar la influencia de la unidad de medida y poder comparar la dispersión de dos distribuciones entre sí Si γ = 0 la representatividad de la media es máxima Si γ > 0,5 la media tiene poca representatividad Si γ > 0,75 hay que rechazar la media como parámetro representativo
El coeficiente NO varía ante cambios de escala
El coeficiente SI varía ante cambios de origen
MEDIDAS DE CONCENTRACIÓN
Mide si existe un reparto equitativo o poco o nada equitativo
Índice de Gini
Vale 0 cuando la variable está repartida de forma muy homogénea Vale 1 cuando está muy concentrada
Es la medida de concentración más utilizada
Curva de Lorenz
Es una forma gráfica de mostrar la dispersión o concentración de una distribución Si la variable está distribuida de forma equitativa la curva coincide con la línea de 45 grados que pasa por el origen Cuanta más concentración exista más pronunciada será la curva hacia abajo.
Se usan los datos de la tabla del Índice de Gini para su confección
4
Ramiro Bermúdez Martínez
Estadística Descriptiva
Fórmulas de Estadística Descriptiva
RBM
MEDIDAS DE FORMA
Coeficiente de asimetría de Fisher
Si g1 = 0 la distribución puede ser simétrica o no, pero si es simétrica siempre dará 0 Si g1 < 0 la distribución es asimétrica a la izquierda (negativa) Si g1 > 0 la distribución es asimétrica a la derecha (positiva)
Coeficiente de asimetría de Pearson
Ídem a coeficiente de asimetría de Fisher
Coeficiente de asimetría de Bowley
Ídem a coeficiente de asimetría de Fisher
Coeficiente de Curtosis
Aplicable a todo tipo de distribución
Es el más empleado
Aplicable sólo a las distribuciones unimodales y con forma de campana
Si g2 = 0 distribución mesocúrtica o normal Si g2 < 0 platicúrtica o menos apuntada que la normal Si g2 > 0 leptocúrtica o más apuntada
MEDIDAS EN DISTRIBUCIONES BIDIMENSIONALES Definiciones generales Frecuencia relativa La suma de todas las frecuencias relativas es igual a 1.
MEDIDAS DE POSICIÓN CENTRAL Medias aritméticas marginales
MEDIDAS DE DISPERSIÓN Varianzas marginales
COVARIACIÓN
Covarianza
Estadística Descriptiva
Si da 0, X e Y no están relacionadas linealmente Si X e Y son independientes siempre da 0 ¡Ojo! no siempre que da 0 las variables son independientes Si es positiva, la correlación es positiva directa (a medida que crece una variable la otra también) Si es negativa, la correlación es negativa o inversa (a medida que crece una variable la otra decrece) Si es positiva, también es positivo Si es negativa, también es negatio Los cambios de origen NO afectan a la covarianza Los cambios de escala SI afectan a la covarianza
Ramiro Bermúdez Martínez
5
Fórmulas de Estadística Descriptiva
RBM
MOMENTOS DE UNA DISTRIBUCIÓN BIDIMENSIONAL Momentos origen
respecto
al
Fórmula general
a través de los momentos a través de los momentos
Momentos respecto al origen de segundo orden
Momento producto
Momentos respecto a la media
Fórmula general
Momentos respecto a la media puestos en relación con los momentos respecto al origen
CORRELACIÓN O GRADO DE DEPENDENCIA LINEAL ENTRE DOS VARIABLES Mide la correlación entre dos variables cuantitativas
Coeficiente de correlación lineal de Pearson
El valor de este parámetro está entre -1 y +1 Cuando la relación lineal es perfecta Cuando no existe ninguna relación lineal Cuando existe dependencia estadística o o o o
6
Ramiro Bermúdez Martínez
de 0 a ± 0,25 no existe correlación suficiente de ± 0,25 a ± 0,50 baja correlación de ± 0,50 a ± 0,75 buena correlación ± 0,75 o mayor, excelente correlación
Estadística Descriptiva
Fórmulas de Estadística Descriptiva
RBM
REGRESIÓN LINEAL SIMPLE Tendrá la forma Recta de regresión de Y sobre X
Que dan lugar a:
La anterior fórmula es el resultado del siguiente sistema de ecuaciones:
Que dan lugar a:
y su fórmula es:
Tendrá la forma Recta de regresión de X sobre Y
La anterior fórmula es el resultado del siguiente sistema de ecuaciones:
y su fórmula es:
RECTAS DE REGRESIÓN A TRAVÉS DE LOS MOMENTOS Recta de regresión de Y sobre X a través de los momentos
Recta de regresión de X sobre Y a través de los momentos
BONDAD DEL AJUSTE Y PREDICCIONES Error de predicción
Cuando esta medida es alta los residuos son grandes y la función estimada es poco representativa Cuando es baja existe bastante representatividad
Varianza residual
Donde: Coeficiente de
2
determinación R . Fórmula general para cualquier tipo de regresión. Modelo utilizado en los exámenes
Coeficiente de
2
determinación R para el caso concreto de regresión lineal
Coeficiente de 2 determinación R según fórmulas del libro de texto
Estadística Descriptiva
Donde:
Si
0 entonces
Si
0 entonces
En este caso R2 coincide con el Coeficiente de correlación lineal de Pearson elevado al cuadrado.
Tiene un valor comprendido entre 0 y 1 Si es 0 entonces la ecuación de regresión no tiene ninguna representatividad Si es 1 entonces se ajusta perfectamente Se recomienda valores superiores a 0,85
Ramiro Bermúdez Martínez
7
Fórmulas de Estadística Descriptiva
RBM
REGRESIÓN NO LINEAL Función polinómica
Función potencial
Función exponencial
Función logarítmica
ASOCIACIÓN ENTRE VARIABLES CUALITATIVAS
Estadístico
Siendo: r = el número de filas s = el número de columnas Oij = frecuencia observada Eij = frecuencia esperada
2
ODDS Ratio
Si OR > 1 → probabilidad de “a favor” es mayor en x que en y. Si OR = 1 → ambas probabilidades son iguales. Si OR < 1 → probabilidad de “a favor” es menor en x que en y.
Toma valores ≥ 0, siendo 0 independencia absoluta
El valor de esta medida está comprendido en el intervalo (0; ∞).
Coeficiente de contingencia C (de Pearson)
Coeficiente V de Cramer
Q de Yule Donde:
8
Es invariante ante los cambios de escala en filas y/o columnas. Alcanza sus valores extremos, 0 e ∞, bajo asociación perfecta. OR y 1/OR indican igual intensidad de la asociación, pero en direcciones opuestas.
Mide el grado de asociación entre dos conjuntos de atributos, ordenados o no Es independiente de la naturaleza de la variable (continua o discreta) El valor está entre 0 y 1 Cuanto mayor es el valor mayor interdependencia Nunca puede alcanzar el valor uno aunque haya completa asociación
Se obtiene a partir de 2 Su valor oscila entre 0 y 1 ◦ 0 = independencia total ◦ 1 = completa asociación
Está comprendida entre -1 y 1 ◦ Q = 0 independencia ◦ Q > 0 asociación positiva ◦ Q < 0 asociación negativa
Ramiro Bermúdez Martínez
Estadística Descriptiva...