Title | FÓRMULAS PROBABILIDAD Y ESTADÍSTICA |
---|---|
Author | Hugo Villanueva |
Course | Análisis de Datos Económicos |
Institution | Universitat de les Illes Balears |
Pages | 13 |
File Size | 528.6 KB |
File Type | |
Total Downloads | 77 |
Total Views | 149 |
Recopilación de las fórmulas necesarias para aprobar la asignatura ....
Análisis de datos económicos: Formulas relevantes
Febrero 2018
Esta resumen de formulas incluye un gran parte de formulas usadas durante el curso. Nota importante: No es la hoja de formulas que vamos a adjuntar el examen. Media aritmética n
Frecuencias unitarias;
x x ... xn i 1 x 1 2 n n
En el caso contrario;
x
xi
k x1n1 x 2n 2 ... xk nk xn i i n i1 n
Comentario: Normalmente usamos la notación que i 1,2,..., n en el sumatorio, pero aquí hemos usado k para indicar el último valor; Es para tener claro que no es lo mismo como el tamaño de la muestra (n) en la formula. No obstante, abajo usamos i 1,2,..., n y el último valor en la sumatorio no tiene que ser lo mismo como el tamaño de la muestra.
xi' xi k
Cambio de origen;
x ' x k
Cambio de escala; x i' x i k x i''
xi k
x ' x k 1 x '' x k
Media geométrica n
G N x1n 1 x2n 2 xnnn N
x
ni i
n n n 1/N ( x1 1 x 2 2 x n n )
i 1
n
log G log N xini i 1
n 1 1 log x nii N i 1 N
n
log x
ni i
i 1
1 n (log x i )n i N i 1
Media armónica H
N 1 1 1 n 1 n 2 ... n n x1 x2 xn
N 1 ni i1 x i n
Mediana Número impar de observaciones (n): Número par de observaciones (n):
Me x n 1 2
x n x n Me
1 2
2
2
En distribuciones agrupadas en intervalos: Busca el valor que ocupa el lugar N / 2 , es decir, identifica el intervalo que contiene la mediana y calcula una aproximación de la mediana;
Me Li 1
N N i 1 2 ci ni
Moda La moda es el valor que tiene la frecuencia más alta. En distribuciones agrupadas en intervalos debemos identificar el intervalo que contiene la moda y después calcular una aproximación. ni 1 ci a) intervalos de la misma amplitud; Mo L i 1 ni 1 ni 1
di 1 b) intervalos de distinta amplitud; Mo L i 1 d i 1 d i1
c i
Medidas de posición no centrales; Cuantiles b) Para distribuciones agrupadas en intervalos
Q r / k L i 1
r N N i 1 k ci ni
Varianza de la población n
x n
2 i i
n
n ( x i ) i N i1 2
2
2 i1
N
x2 n
n
m2 a2 a 2
2 1
Nota:
xn
i i
a1
i 1
N
x
,
a2
x n 2 i
i
i1
N
Un cambio de origen en la variable no afecta a la varianza; 2 2 Si Yi X i k entonces, y x porque k es una constante y var(k ) 0 . Un cambio de escala de la variable afecta a la varianza; 2 2 2 Si Yi X i k entonces, y k x y y k x .
I
La media después de una fusión de grupos es; xT f i xi i 1
n f donde 1 I 1 ni i1
y hay I grupos. I
I
i 1
i 1
2 2 2 La varianza después de una fusión de grupos es; T f i i fi ( xi xT )
n2 n1 x1 xT ( n n ) x2 1 2 (n1 n2 ) n2 2 n1 2 n2 n1 ( x2 xT ) 2 (x 1 x T ) 2 2 1 T2 (n1 n 2 ) (n1 n 2 ) (n1 n 2 ) (n 1 n 2 )
Ejemplo con dos grupos:
Varianza de la muestra n
(x
s 2 i1
i
x )2 n i
n 1
n 2 s n 1
n
x
2 i
ni
i 1
n
2 x
Desviación típica o estándar (de una muestra) s s2
n
(x i
i 1
x )2
ni n 1
Tipificación zi
xi x
zi es la posición relativa de observación i , es decir, cuantas desviaciones típicas por encima de la media o por debajo de la media (si el signo es negativo). Si realizamos el cálculo para todas las observaciones i 1,..., n hemos estandardizado la variable; la media es 0 y la desviación típica es 1.
Medidas de dispersión relativas
C 3 C1 C 3 C1
Recorrido semi-intercuartílico;
Rs
Coeficiente de variación de Pearson;
CV
x
Coeficiente de asimetría de Pearson AP
x Mo
o alternativamente:
AP
3 ( x Me)
Coeficiente de asimetría de R.A. Fisher n
(x
x )3
i
ni N
m g 1 33 i1 3/ 2 n 2 ni ( x i x) N i1 m3 a3 3a2 a1 2 a31
Índice de Gini IG
2 k xi fi Fˆi 1 x i 1
IG 2 1
k
p
i
i 1 f f Fˆ i f j i Fi 1 i 2 2 j1
2 IG cov( x, Fˆ ) x
pi 1 qi q i 1
i1
Si tenemos el porcentaje de renta total para cada grupo i 1,..., k , en lugar de x i , podemos calcular: k
IG 2 u i Fˆi 1 i 1
Distribución normal 1 ( x ) 2
1 f (x ) e 2 2
2
Coeficiente de Asociación Chi-Cuadrado (χ2)
I
J
2
n
i1 j1
Coeficiente “C” de contingencia de Karl Pearson C
2 2 n
límite _ máximo 1
1 min(I ,J )
ij
e ij 2 e ij
Donde I es número de filas y J número de columnas en la tabla de contingencia. Covarianza de la población
n ( xi x ) ( yi y )ni xy i 1 N
xy m11 a11 a10 a01 n
xyn i
xy i 1
i
i
N
xy
Covarianza de una muestra
s xy
n n 1
n
x
i
yi ni
i1
n
xy
Coeficiente de correlación lineal xy rxy x y
s xy sx sy
Regresión lineal y a bx u
b xy 2 x
a y b x
s xy 2 sx
Varianza residual (VR) de una población
u2
n ˆ )2 n i (yi y i1 N
ni i1 N n
u
2 i
Varianza residual (VR) de una muestra
s
2 u
n
ˆ) 2 ni y n n k n k
(y i 1
i
n
ni n
u i 1
2 i
yˆ0 a bx0
Coeficiente de determinación de una población a) con sólo una variable explicativa: xy xy R bb' xy x2 y2 x y 2
2
2 rxy
b) fórmula más general:
VR VE u2 Y2 u2 R2 R 1 2 2 1 2 VT VT Y Y u 2
2 2 2 Donde varianza explicada es VE R Y u . (El subíndice R se refiere a regresión, ¡NO residual!).
Coeficiente de determinación de una muestra (Coeficiente de determinación ajustada)
2
R 2adj 1
su s 2Y
n 2 ui n i n i 1 n n K 1 n 2 yi n i n i1 y2 n n 1
n 1 2 2 Radj 1 (1 R ) n k
Nota: en este contexto k se refiere al número de parámetros del modelo de regresión.
Momento rs con respecto origen
Momento rs con respecto al las medias
Probabilidad condicionada P( A1 A2 )
P ( A1 A2 ) P (A 2 )
Ley de probabilidad total (LPT) P (D ) P (H 1 D ) P (H 2 D ) ... P( H1 ) P( D H1 ) P (H 2 ) P (D H 2 ) ...
El Teorema de Bayes P( H i D)
P ( H i ) P ( D Hi ) P( H 1) P( D H 1) P( H 2 ) P( D H 2 ) ...
Variable aleatoria discreta x
F ( x ) P ( X x ) p ( x ) 0
x2
P[ x1 X x2 ] p x( x) x1
P (X x) 1 - F(x)
Variable aleatoria continua x
F ( x) P( X x) f ( x) dx
x
P [x 1 X x 2 ] f x (x )dx F (x 2 ) F ( x 1) x 2
1
F (x ) f ( x) x
Valor esperado a) discreto
E ( X ) xi f ( x i )
b) continuo
E( X ) xi f ( x)dx
i
Varianza a) discreto 2 Var ( X ) E(( X ) 2 ) ( xi ) 2 f ( xi ) i
b) continuo
( xi )2 f ( x )dx 2 Var ( X ) E (( X ) 2 )
Desviación estándar Var ( X )
Distribución Bernoulli p ( x ) p x (1 p ) 1 x
x 0, 1
Bernoulli, esperanza y varianza 1
E[ X ] x P( X x) 0 P( X 0) 1P( X 1) p x0
1
Var (X ) E [ X 2 ] (E [ X ]) 2 x 2 P ( X x ) p 2 x 0
0 P( X 0) 1 P( X 1) p2 p p2 p(1 p) 2
2
Distribución Binomial
n f ( x) p x (1 p ) (n x ) x
f (x ) = probabilidad de x éxitos en n intentos. n n! x x n ! ( x)!
p = probabilidad de éxito en un intento. (1 p ) = probabilidad de fracaso en un intento. Distribución Binomial, esperanza y varianza E[ X ] np Var [ X ] 2 np(1 p )
Distribución Poisson e y P(Y y) f ( y | ) y!
y 0, 1, 2,...,
Distribución Poisson, esperanza y varianza Var (Y )
E (Y )
Función de densidad de distribución Normal
Distribución Chi-cuadrado Y X12 X 22 ... Xn2 ~ n2 2 2 2 Donde X 1 , X 2 , ..., X n son variables aleatorios independientes y X i N (0,1) y n son los grados de libertad.
E (Y ) n
Var (Y ) 2n
Distribución t student tn
z 1 2 n n
Distribución F de Fisher-Snedecor
Fn1 ,n2
n21 / n1 2n2 / n2
Muestreo sin reemplazamiento 2 N n n N 1
E (x )
Var ( x)
E (R)
Var (R )
(1 ) N n n N 1
Teorema Central de Límite Aproximar la distribución Binomial con la distribución Normal. x np np (1 p )
~ N(0,1)
x 0,5 np p ( X x ) np (1 p ) x 0,5 np p ( X x ) np(1 p)
Aproximar la distribución Poisson con la distribución Normal.
Pi (1) (1)
i 1
x ~ N(0,1)
y 0,5 p (Y y ) y 0,5 p (Y y )
Aproximar la distribución Chi-cuadrado con la distribución Normal. Z
n2 n ~ N(0,1) 2n
y n p (Y y ) 2n
Varianza muestral es una variable aleatoria con distribución chi-cuadrado y n 1 grados de libertad;
n2 1
( n 1) s 2 2
El cociente da las varianzas muestral es una variable aleatoria con distribución F nA 1, n B 1 con n A 1 y nB 1 grados de libertad Fn A 1,n B 1
s 2A s 2B
Elegir tamaño de muestra para estudiar la proporción poblacional a) sin reemplazamiento n1 n2 1 (n1 / N )
b) con reemplazamiento 2
Z n1 1 / 2 (1 ) c
Elegir tamaño de muestra para estudiar la media poblacional a) sin reemplazamiento n2
n1 1 (n1 / N )
b) con reemplazamiento 2
Z n1 1 / 2 2 c
Las fórmulas requieren tamaño de muestra, grandes.
n , y el tamaño de la población,
Estimación puntual Parámeter Media ( )
Estimator Media muestral
N
xn i
x i1
n
i
N ,
2 Varianza ( )
n
Varianza muestral
Sˆ 2 Proporción ( )
(x
i
x ) 2n i
i 1
Proporción muestral
R ˆp
n 1 n1 n...