Title | Fórmulas estadística descriptiva |
---|---|
Course | Estadística |
Institution | Universidad Nacional de Luján |
Pages | 16 |
File Size | 826.3 KB |
File Type | |
Total Downloads | 77 |
Total Views | 154 |
formulas...
Guía - Resumen de fórmulas estadísticas
En el siguiente cuadro se especifica la notación correspondiente a distintas medidas de frecuencia utilizadas en estadística.
Concepto
Población
Muestra
Valor de la variable bajo estudio correspondiente a la i-ésima observación
xi
xi
Frecuencia absoluta simple de un valor de la variable o de un intervalo de valores
fai
fai
N= ∑fai
n= ∑fai
fri = fai/N
fri =fai/n
Frecuencia relativa porcentual de un valor de la variable o de un intervalo de valores
fri %= fai/N*100
fri% =fai/n*100
Frecuencia absoluta acumulada hasta un valor de la variable o un intervalo de valores
Fai
Fai
Frecuencia relativa acumulada hasta un valor de la variable o un intervalo de valores
Fri = Fai/N
Fri =Fai/n
Frecuencia relativa porcentual de un valor de la variable o de un intervalo de valores
Fri %= Fai/N*100
Fri% =Fai/n*100
Tamaño de la población o muestra Frecuencia relativa de un valor de la variable o de un intervalo de valores
Material preparado por Lic. Adriana Ibero
1
En el siguiente cuadro se especifica la notación correspondiente a distintas medidas utilizadas en estadística de acuerdo a si se estudia una población en cuyo caso es un parámetro; o si se estudia una muestra en cuyo caso es un estimador.
Población
Muestra
Parámetro
Estimador
μ
x
Modo
Mo
mo
Mediana
Ma
ma
Proporción
π
p
Variancia
σ2
S2
Desvío estándar
σ
S
CV%
cv%
ρ
r
Medida o concepto
Media aritmética
Coeficiente de variación porcentual Coeficiente de correlación Coeficiente de determinación
Material preparado por Lic. Adriana Ibero
r2
2
Uso de Calculadora para Medidas descriptivas. De acuerdo al modelo se siguen las instrucciones por columna. Dada la situación se recomienda buscar el manual de uso o videos en Internet que permitan el manejo de la calculadora en modo estadístico SIN NAVEGADOR Poner en modo estadístico Borrar los datos cargados. Carga de datos
Mode Shift
• AC
Valor de la variable
Frecuencia
M+ 3
2
X
Shift
6
Suma de xi
Shift
5
xi2
Shift
4
µ
Shift
7
σ
Shift
8
S
Shift
7
Ejemplo: N
Suma de
M+
CON NAVEGADOR CHICO
Material preparado por Lic. Adriana Ibero
Poner en modo estadístico
Mode
2
Borrar los datos cargados. Carga de datos
Shift
AC
=
AC
Valor de la variable
Shift
,
Frecuencia
M+
Ejemplo:
2
Shift
,
3
M+
N
RCL
Hyp
Suma de xi
RCL
º, ,, 3
Suma de xi2
RCL
µ
Shift
1
σ
Shift
2
S
Shift
3
CON NAVEGADOR GRANDE Poner en modo estadístico Borrar los datos cargados.
Mode Shift
2 Mode
1
=
AC
Valor de la variable
Shift
,
Frecuencia
M+
Ejemplo: N
2 Shift
Shift 1
, 3
3 =
M+
Suma de xi Suma de xi2 µ σ
Shift Shift Shift Shift
1 1 2 2
2 1 1 2
= = = =
S
Shift
2
3
=
Carga de datos
Material preparado por Lic. Adriana Ibero
4
CON TABLA Poner en modo estadístico
Mode
Stat
1-Var
Borrar los datos cargados.
Shift - 1
Editar
Del
Poner Frec: Shit - Mode -↓ - 4Stat - On Se cargan los datos en la columna X con un igual. Luego las frecuencias. Carga de datos
Material preparado por Lic. Adriana Ibero
Finalmente se apreta el AC
N
Shift - 1 - Var 1 =
Suma de xi
Shift - 1 - Sum 2 =
Suma de xi2
Shift - 1 - Sum 1 =
µ
Shift - 1 - Var 2 =
σ
Shift - 1 - Var 3 =
S
Shift - 1 - Var 4 =
5
Fórmulas de estadística descriptiva Medidas de Posición central Datos sin agrupar Población
x μ i N
μ
x i fa i N
Muestra
x x i n
x
x i fa i n
Media aritmética
Modo
Datos agrupados por frecuencia
Población
Mo: Valor de la variable que posee mayor frecuencia absoluta simple
Muestra
mo: Valor de la variable que posee mayor frecuencia absoluta simple
Población Mediana (Datos ordenados) Muestra
Posición de la mediana j=K*(N+1) /100, con K=50 Si N impar: la observación del lugar j-ésimo Si N par: semisuma de los valores correspondientes a la observación del lugar de la parte entera de j y de j+1 Posición de la mediana j=k*(n+1) /100, con k=50 Si n impar: la observación del lugar j-ésimo Si n par: semisuma de los valores correspondientes a la observación del lugar de la parte entera de j y de j+1
Datos agrupados por intervalos PMi fai μ N PMi = (Li+Ls) /2 Punto Medio PMi fai x n PMi = (Li+Ls) /2 Punto Medio Se menciona cual es el intervalo donde está el modo Se menciona cual es el intervalo donde está el modo Se menciona cual es el intervalo donde está la mediana
Se menciona cual es el intervalo donde está la mediana
Medidas de Posición No Central
Población Percentiles k Pk Muestra
Datos sin agrupar Datos agrupados por frecuencia Datos agrupados por intervalos Posición del percentil K= j=K*(N+1) /100 Si N impar: la observación del lugar j-ésimo Si N par: semisuma de los valores correspondientes a la observación del lugar de la parte entera de j y de j+1 Posición del percentil k= j=k*(N+1) /100 Si n impar: la observación del lugar j-ésimo Si n par: semisuma de los valores correspondientes a la observación del lugar de la parte entera de j y de j+1
1º Cuartil Material preparado por Lic. Adriana Ibero
Q1
K = 25
3º Cuartil Q3
K = 75 6
Medidas de Variabilidad o Dispersión Datos sin agrupar
Datos agrupados por frecuencia
σ2
x μ2 σ i 2
2
x σ2 i μ 2 N
Variancia
x 2 fai σ2 i μ2 N
x i x S
2 x i x fai S
2
2
2
n-1
Muestra
S
Coeficiente de Variación %
N
N
Población
Desvío Estándar
x i μ 2 fai
2
x
i
2
Datos agrupados por intervalos 2 PMi μ fai σ2 N
σ2
2 PM i fai 2 μ
N PMi = (Li+Ls)/2 Punto Medio
S2
n-1
x i /n 2
S
n -1
2
x
2 i
fai n x 2 n 1
Población
σ σ2
Muestra
S S σ CV% 100 μ S cv% 100 x
S2
PM x 2 fa i n-1
PM2i fai n x 2
n 1 PMi = (Li+Ls)/2 Punto Medio
2
Población Muestra
Medidas de Forma y curtosis Forma
Coeficiente de asimetría
Curtosis
Coeficiente de Curtosis
Material preparado por Lic. Adriana Ibero
3
n x x μ - Mo i CAP σ n 1 n 2 S 4 2 n n 1 3 n 1 x x i n n n S n 2 n 3 1 2 3 7
Números índice Índice Relativo Simple x Rs i/o i 100 xo Índice de Agregado no Ponderado n
xij
I A j/o in1
100
x io
Índice Relativo Eslabón x R ei/i - 1 i 100 xi-1
Índice Relativo en Cadena Rci/i - 1 R ei/i - 1 R ei - 1/i - 2 ... R c1/o 100
Índice de Promedios de Relativos no Ponderado n x ij
IR j/o
x
i 1
io
n
i 1
100
Índices de Agregados Ponderados Índice de Precios de Laspeyres
Índice de Precios de Paasche
n
I PL j/o
p i j qi o
i 1 n
n
100
I P P j/o
i 1
i 1 n
IPF IPL IPP
Índice de Cantidades de Paasche
n
I Q j/o
Índice de Precios de Fisher
100
i 1
Índice de Cantidades de Laspeyres L
i 1 n
p i o qi j
p i o q i o qi j pi o
p i j q i j
n
100
qi o pi o
i 1
P
I Q j/o
qi j pi j i 1 n
Índice de Cantidades de Fisher
100
qi o pi j
i 1
Índice de Promedio Ponderado de Relativos de n p ij p p io q io i 1 i o L 100 Laspeyres I PR j/o n pi o qi o
Índice de Promedio Ponderado de Relativos de n p ij p pi o qi j i 1 i o P 100 Paasche I PR j/o n pi o qi j
Índice de Promedio Ponderado de Relativos de Laspeyres
Índice de Promedio Ponderado de Relativos de Paasche
i 1
Material preparado por Lic. Adriana Ibero
IQ F IQ L IQ P
i 1
8
n
L
I Q R j/o
qi j
i 1 q i o n
n
qi j
i 1
qi o
pi o qi o P
100
I Q R j/o
pi o q i o i 1
p i j qi o
n
100
pi j qi o i 1
n
p i j qi j
Índice de Valor
I V j/o
i 1 n
100
p i o q i o
Cambio de Base IMA o 100 (j)
Ínidce(j) 100 Ínidce(o)
i 1
Probabilidad: La probabilidad es una medida de la incertidumbre. Definición clásica o de Laplace
P(A)
Casos favorables Casos posibles
Toda probabilidad varía entre 0 y 1 0 P(A) 1
P(A) + P( A ) = 1
Definición frecuencial (Bernoulli)
a lím siendo n la cantidad de veces que se repite un experimento y a la cantidad de veces que se observa un n
n
evento Propiedades de la frecuencia relativa:
0 fr (A) 1 cualquiera que sea el suceso A.
fr(
fr(E) = 1
) = fr(A) + fr(B)
si
= Ø.
fr(Ø) = 0.
Definición axiomática. (Kolmogorov), La Probabilidad de cada suceso es un número que verifica:
Cualquiera que sea el suceso A, P(A)
Material preparado por Lic. Adriana Ibero
0. 9
Si dos sucesos son incompatibles, la probabilidad de su unión es igual a la suma de sus probabilidades.
=Ø
P(
) = P(A) + P(B).
La probabilidad total es 1. P(E) = 1.
mutuamente no excluyentes (Regla de la Suma)
mutuamente excluyentes (Regla del Producto) P(A ó B) P(A B) = P(A) P(B)
Probabilidad total:
Probabilidad condicional
P(A / B) =
P(A∩ B) P(B)
Ó P(B / A) =
P(A ó B) P(A B) P(A) P(B)- P(A B)
P(A ∩ B) P(A)
Probabilidad conjunta: P(A B) = P(A y B) 0
Mutuamente excluyentes
Sucesos independientes P(A y B) P(A) P(B) Mutuamente no excluyentes P(A y B) P(A) P(B/A) P(B) P(B/A) Sucesos dependient es
Distribuciones de probabilidad Discreta
Continua
n
Probabilidad puntual:
P(X = x) = p(xi) p i 0, p i 1 i 0
f (x ) 1
P(X = x) = F(x) = 0 f ( x) 0
Gráfico de bastones Probabilidad entre intervalos
P(a< x < b) = P(X =b) - P(X =a) Gráfico escalonado
Probabilidad acumulada: es P(X< x) = F (x) = p( x i ) xix siempre creciente, o a lo sumo constante Material preparado por Lic. Adriana Ibero
Gráfico escalonado
P(a< x < b) = F(a) –F(b)
Area
xi
P(X< x) = F (x)= f (x ) dx
Área
10
E(x) x i p(x i ) dx
E (x) x i p(x i )
Esperanza
V ( x) E( x )2 E( x 2 ) E( x)
V ( x) E( x )2 E( x 2 ) E( x)
2
Variancia
n n V ( x) x i2 p(x i ) x i p( x i ) i 0 i 0
Distribución Binomial X ~ Bi (n; p) X: cantidad de éxitos en n pruebas
2
2
2
V( x) x f( x) dx x 2 f( x)dx
2
Dominio 0 ≤ x ≤ n
n Probabilidad puntual: PBi(X = x /n; p)= • px • 1 - p n- x , E(x) = μ = n · p, V(x) = σ2 = n · p · (1-p) Parámetros de la distribución: n y p. Gráfico de bastones x Distribución de Poisson X ~ Po (λ)
x: cantidad de éxitos en un continuo de extensión t
Dominio 0 ≤ x
: número medio de éxitos por unidad de continuo
Probabilidad puntual: PPo (X =x / λ) =
e x x!
E(x) = λ
V(x) = σ2 = λ
Parámetro: λ
Distribución Normal o de Gauss – Laplace X ≈ N (μ x ; σ x ) Características: a) , 2 son los parámetros de la distribución. b) Tiene forma campanular, simétrica y asintótica al eje x, 2
1 x μ σ
1 e 2 c) f(x) 2πσ
f(x) 1 -
Cumple con las condiciones: f(x) ≥ 0;
2 d) La esperanza matemática es que coincide con la mediana y el modo, y la variancia es
e) Variable normal estandarizada o tipificada Z N (0;1) z =
x - μx , E(z) = 0, V(z) = 1 σx
x μx Teorema central del límite, aplicado a la media aritmética: X ~ N(μ; σ2/n) y por lo tanto = Z ~ N(0; 1) σ/ n Material preparado por Lic. Adriana Ibero
11
Estimación de parámetros por Intervalo de confianza-- Una Muestra
Parámetro
Promedio μ
Tamaño de muestra con un nivel de confianza de (1- α)% y un error e
Información
Estimación del Intervalo de confianza del (1-α)%
Tamaño de muestra grande.
P(x - Z 1- α/2 .σ x / n μ x + Z 1-α/2 .σ x / n) = 1 - α
z 1 α/2 σ x n e
P(x - t n-1; 1- α/2 .S x / n μ x + t n-1; 1-α/2 .S x / n) = 1 - α
t n-1; 1 α/2 Sx n e
Variancia conocida o desconocida.
2
Tamaño de muestra pequeña Variancia desconocida. Población normal. Proporción π Tamaño de muestra grande. Teorema Central del Límite
pˆ . (1 - pˆ) pˆ . (1 - ˆp) pˆ Z 1-α/2 . P pˆ - Z 1-α/2 . n n (n 1) S2 (n 1) S2 P 2 σ2 χ 2 n 1;α/2 χ n 1 ;1α/2
Variancia σ2
2
= 1- α
2
Z n 1-α/2 . ˆp. (1 - pˆ ) e
1 α
Estimación de parámetros por Intervalo de confianza -- Dos Muestras Parámetro
Información
Muestras Independientes Diferencia de Variancias conocidas. medias Muestras Independientes μ1- μ2 Variancias desconocidas e iguales.
Material preparado por Lic. Adriana Ibero
Estimación del Intervalo de confianza del (1-α)%
σ2 σ 2 σ2 σ 2 P (x1 - x2 ) - Z1 -α/2 . 1 2 μ1 - μ2 ( x1 - x2 ) Z1-α/2 . 1 2 = 1 - α n1 n2 n 1 n2 1 1 1 1 P (x1 - x2 ) - tn1 n2 -2; 1-α/2 .Sa μ1 - μ2 (x1 - x2 ) tn1 n2 -2; 1 -α/2 .Sa n 1 n2 n1 n2
= 1- α
12
Variancia amalgamada:
S
2 a
(n1 1) S21 (n2 1) S22 n1 n2 - 2
S 2 S2 S 2 S2 P(x1 - x 2 ) - t ; 1-α/2 . 1 2 μ1 - μ2 (x1 - x2 ) t ; 1-α/2. 1 2 = 1 - α n 1 n2 n1 n2 Muestras Independientes Variancias desconocidas y distintas.
Grados de libertad:
S 2 S2 1 2 n n 2 1
2
2 S2 S2 1 1 2 n 1 n 1 1 n2
2 1 n2 1
P( d - t n-1; 1-α/2 .Sd / n μd d + tn-1; 1 -α/2 .Sd / n) = 1 - α
Muestras Dependientes o Apareadas
di x 1 - x2
d
di n
S2d
d2i - n d 2 n-1
Diferencia de pˆ .qˆ pˆ .qˆ pˆ .qˆ pˆ .qˆ P (pˆ 1 - ˆp 2 ) - Z 1-α/2 . 1 1 2 2 π1 - π2 (pˆ1 - pˆ2 ) Z 1-α/2 . 1 1 2 2 proporciones n n2 n n 1 1 2 π1 – π2 Cuadro para la utilización de Z o t en intervalos de confianza y test de hipótesis de la media de la media Población Con hipótesis de normalidad Sin hipótesis de normalidad Material preparado por Lic. Adriana Ibero
Tamaño
σ2 conocido
=1- α
σ2 desconocido
Grande n>100
Z=
x -μ σ
n
Z=
x -μ n S
Pequeña n≤100
Z=
x -μ σ
n
t=
x -μ n S
Grande n>100
Z=
x -μ σ
n
Z=
x -μ n S 13
Test de hipótesis Una población Parámetro
Hipótesis
Estadístico de prueba Con variancia conocida
H0 : μ = μ0 Promedio μ
H1: μ ≠ μ0 μ > μ0 μ < μ0
z
x μ 0 σ x/ n
~ N(0; 1)
Población normal. Con variancia desconocida. n< 100 tn
x μ 0 S x/ n
~
t n-1
H0 : π = π 0 Proporción π
H1: π ≠ π 0 π >π 0 π...