Fórmulas estadística descriptiva PDF

Title	Fórmulas estadística descriptiva
Course	Estadística
Institution	Universidad Nacional de Luján
Pages	16
File Size	826.3 KB
File Type	PDF
Total Downloads	77
Total Views	154

Preview

CLICK TO PREVIEW PDF

Summary

formulas...

Description

Guía - Resumen de fórmulas estadísticas

En el siguiente cuadro se especifica la notación correspondiente a distintas medidas de frecuencia utilizadas en estadística.

Concepto

Población

Muestra

Valor de la variable bajo estudio correspondiente a la i-ésima observación

xi

xi

Frecuencia absoluta simple de un valor de la variable o de un intervalo de valores

fai

fai

N= ∑fai

n= ∑fai

fri = fai/N

fri =fai/n

Frecuencia relativa porcentual de un valor de la variable o de un intervalo de valores

fri %= fai/N*100

fri% =fai/n*100

Frecuencia absoluta acumulada hasta un valor de la variable o un intervalo de valores

Fai

Fai

Frecuencia relativa acumulada hasta un valor de la variable o un intervalo de valores

Fri = Fai/N

Fri =Fai/n

Frecuencia relativa porcentual de un valor de la variable o de un intervalo de valores

Fri %= Fai/N*100

Fri% =Fai/n*100

Tamaño de la población o muestra Frecuencia relativa de un valor de la variable o de un intervalo de valores

Material preparado por Lic. Adriana Ibero

1

En el siguiente cuadro se especifica la notación correspondiente a distintas medidas utilizadas en estadística de acuerdo a si se estudia una población en cuyo caso es un parámetro; o si se estudia una muestra en cuyo caso es un estimador.

Población

Muestra

Parámetro

Estimador

μ

x

Modo

Mo

mo

Mediana

Ma

ma

Proporción

π

p

Variancia

σ2

S2

Desvío estándar

σ

S

CV%

cv%

ρ

r

Medida o concepto

Media aritmética

Coeficiente de variación porcentual Coeficiente de correlación Coeficiente de determinación

Material preparado por Lic. Adriana Ibero

r2

2

Uso de Calculadora para Medidas descriptivas. De acuerdo al modelo se siguen las instrucciones por columna. Dada la situación se recomienda buscar el manual de uso o videos en Internet que permitan el manejo de la calculadora en modo estadístico SIN NAVEGADOR Poner en modo estadístico Borrar los datos cargados. Carga de datos

Mode Shift

• AC

Valor de la variable

Frecuencia

M+ 3

2

X

Shift

6

Suma de xi

Shift

5

xi2

Shift

4

µ

Shift

7

σ

Shift

8

S

Shift

7

Ejemplo: N

Suma de

M+

CON NAVEGADOR CHICO

Material preparado por Lic. Adriana Ibero

Poner en modo estadístico

Mode

2

Borrar los datos cargados. Carga de datos

Shift

AC

=

AC

Valor de la variable

Shift

,

Frecuencia

M+

Ejemplo:

2

Shift

,

3

M+

N

RCL

Hyp

Suma de xi

RCL

º, ,, 3

Suma de xi2

RCL

µ

Shift

1

σ

Shift

2

S

Shift

3

CON NAVEGADOR GRANDE Poner en modo estadístico Borrar los datos cargados.

Mode Shift

2 Mode

1

=

AC

Valor de la variable

Shift

,

Frecuencia

M+

Ejemplo: N

2 Shift

Shift 1

, 3

3 =

M+

Suma de xi Suma de xi2 µ σ

Shift Shift Shift Shift

1 1 2 2

2 1 1 2

= = = =

S

Shift

2

3

=

Carga de datos

Material preparado por Lic. Adriana Ibero

4

CON TABLA Poner en modo estadístico

Mode

Stat

1-Var

Borrar los datos cargados.

Shift - 1

Editar

Del

Poner Frec: Shit - Mode -↓ - 4Stat - On Se cargan los datos en la columna X con un igual. Luego las frecuencias. Carga de datos

Material preparado por Lic. Adriana Ibero

Finalmente se apreta el AC

N

Shift - 1 - Var 1 =

Suma de xi

Shift - 1 - Sum 2 =

Suma de xi2

Shift - 1 - Sum 1 =

µ

Shift - 1 - Var 2 =

σ

Shift - 1 - Var 3 =

S

Shift - 1 - Var 4 =

5

Fórmulas de estadística descriptiva Medidas de Posición central Datos sin agrupar Población

x μ i N

μ

x i  fa i N

Muestra

x x i n

x

x i  fa i n

Media aritmética

Modo

Datos agrupados por frecuencia

Población

Mo: Valor de la variable que posee mayor frecuencia absoluta simple

Muestra

mo: Valor de la variable que posee mayor frecuencia absoluta simple

Población Mediana (Datos ordenados) Muestra

Posición de la mediana j=K*(N+1) /100, con K=50 Si N impar: la observación del lugar j-ésimo Si N par: semisuma de los valores correspondientes a la observación del lugar de la parte entera de j y de j+1 Posición de la mediana j=k*(n+1) /100, con k=50 Si n impar: la observación del lugar j-ésimo Si n par: semisuma de los valores correspondientes a la observación del lugar de la parte entera de j y de j+1

Datos agrupados por intervalos  PMi  fai μ N PMi = (Li+Ls) /2 Punto Medio  PMi  fai x n PMi = (Li+Ls) /2 Punto Medio Se menciona cual es el intervalo donde está el modo Se menciona cual es el intervalo donde está el modo Se menciona cual es el intervalo donde está la mediana

Se menciona cual es el intervalo donde está la mediana

Medidas de Posición No Central

Población Percentiles k Pk Muestra

Datos sin agrupar Datos agrupados por frecuencia Datos agrupados por intervalos Posición del percentil K= j=K*(N+1) /100 Si N impar: la observación del lugar j-ésimo Si N par: semisuma de los valores correspondientes a la observación del lugar de la parte entera de j y de j+1 Posición del percentil k= j=k*(N+1) /100 Si n impar: la observación del lugar j-ésimo Si n par: semisuma de los valores correspondientes a la observación del lugar de la parte entera de j y de j+1

1º Cuartil Material preparado por Lic. Adriana Ibero

Q1

K = 25

3º Cuartil Q3

K = 75 6

Medidas de Variabilidad o Dispersión Datos sin agrupar

Datos agrupados por frecuencia

σ2  

 x  μ2 σ  i 2

2

x σ2   i  μ 2 N

Variancia

x 2  fai σ2   i μ2 N

 x i  x  S 

2  x i  x   fai S 

2

2

2

n-1

Muestra

S

Coeficiente de Variación %

N

N

Población

Desvío Estándar

 x i  μ 2  fai

2

x 

i

2

Datos agrupados por intervalos 2  PMi  μ  fai σ2  N

σ2 

2  PM i  fai  2 μ

N PMi = (Li+Ls)/2 Punto Medio

S2  

n-1

  x i  /n 2

S

n -1

2

x 

2 i

 fai  n  x 2 n 1

Población

σ  σ2

Muestra

S S σ CV%   100 μ S cv%   100 x

S2 

 PM  x  2 fa i n-1

 PM2i  fai  n  x 2

n 1 PMi = (Li+Ls)/2 Punto Medio

2

Población Muestra

Medidas de Forma y curtosis Forma

Coeficiente de asimetría

Curtosis

Coeficiente de Curtosis

Material preparado por Lic. Adriana Ibero

3

n x x  μ - Mo   i CAP   σ n  1  n  2   S  4 2  n  n  1 3  n  1 x  x    i   n  n  n   S   n  2  n  3    1   2   3 7

Números índice Índice Relativo Simple x Rs i/o  i  100 xo Índice de Agregado no Ponderado n

xij

I A j/o  in1

100

 x io

Índice Relativo Eslabón x R ei/i - 1  i  100 xi-1

Índice Relativo en Cadena Rci/i - 1  R ei/i - 1 R ei - 1/i - 2 ... R c1/o 100

Índice de Promedios de Relativos no Ponderado n x ij

IR j/o 

x

i 1

io

n

i 1

100

Índices de Agregados Ponderados Índice de Precios de Laspeyres

Índice de Precios de Paasche

n

I PL j/o 

p i j qi o

i 1 n

n

 100

I P P j/o 

i 1

i 1 n

IPF  IPL IPP

Índice de Cantidades de Paasche

n

I Q j/o 

Índice de Precios de Fisher

 100

i 1

Índice de Cantidades de Laspeyres L

i 1 n

 p i o  qi j

p i o q i o  qi j  pi o

p i j  q i j

n

 100

 qi o  pi o

i 1

P

I Q j/o 

 qi j pi j i 1 n

Índice de Cantidades de Fisher

 100

 qi o  pi j

i 1

Índice de Promedio Ponderado de Relativos de n p ij  p p io q io i 1 i o L  100 Laspeyres I PR j/o  n  pi o  qi o

Índice de Promedio Ponderado de Relativos de n p ij  p pi o  qi j i 1 i o P  100 Paasche I PR j/o  n  pi o  qi j

Índice de Promedio Ponderado de Relativos de Laspeyres

Índice de Promedio Ponderado de Relativos de Paasche

i 1

Material preparado por Lic. Adriana Ibero

IQ F  IQ L  IQ P

i 1

8

n

 L

I Q R j/o 

qi j

i 1 q i o n

n

qi j

i 1

qi o



 pi o  qi o P

 100

I Q R j/o 

 pi o  q i o i 1

 p i j  qi o

n

 100

 pi j  qi o i 1

n

 p i j qi j

Índice de Valor

I V j/o 

i 1 n

 100

 p i o q i o

Cambio de Base IMA o  100 (j) 

Ínidce(j)  100 Ínidce(o)

i 1

Probabilidad: La probabilidad es una medida de la incertidumbre. Definición clásica o de Laplace

P(A) 

Casos favorables Casos posibles



Toda probabilidad varía entre 0 y 1 0  P(A)  1



P(A) + P( A ) = 1

Definición frecuencial (Bernoulli)

a lím  siendo n la cantidad de veces que se repite un experimento y a la cantidad de veces que se observa un n

n  

evento Propiedades de la frecuencia relativa: 

0 fr (A) 1 cualquiera que sea el suceso A.



fr(



fr(E) = 1

) = fr(A) + fr(B)

si

= Ø.

fr(Ø) = 0.

Definición axiomática. (Kolmogorov), La Probabilidad de cada suceso es un número que verifica: 

Cualquiera que sea el suceso A, P(A)

Material preparado por Lic. Adriana Ibero

0. 9



Si dos sucesos son incompatibles, la probabilidad de su unión es igual a la suma de sus probabilidades.



=Ø

P(

) = P(A) + P(B).



La probabilidad total es 1. P(E) = 1.



mutuamente no excluyentes (Regla de la Suma)



mutuamente excluyentes (Regla del Producto) P(A ó B)  P(A B) = P(A) P(B)

Probabilidad total:

Probabilidad condicional

P(A / B) =

P(A∩ B) P(B)

Ó P(B / A) =

P(A ó B)  P(A B) P(A) P(B)- P(A B)

P(A ∩ B) P(A)

Probabilidad conjunta: P(A  B) = P(A y B)  0



Mutuamente excluyentes



Sucesos independientes P(A y B)  P(A) P(B) Mutuamente no excluyentes  P(A y B) P(A) P(B/A) P(B) P(B/A)  Sucesos dependient es

Distribuciones de probabilidad Discreta

Continua 

n

Probabilidad puntual:

P(X = x) = p(xi) p i  0,  p i  1 i 0

 f (x )  1

P(X = x) = F(x) = 0 f ( x)  0



Gráfico de bastones Probabilidad entre intervalos

P(a< x < b) = P(X =b) - P(X =a) Gráfico escalonado

Probabilidad acumulada: es P(X< x) = F (x) =  p( x i ) xix siempre creciente, o a lo sumo constante Material preparado por Lic. Adriana Ibero

Gráfico escalonado

P(a< x < b) = F(a) –F(b)

Area

xi

P(X< x) = F (x)=  f (x )  dx

Área



10

E(x)   x i  p(x i )  dx

E (x)   x i  p(x i )

Esperanza

V ( x)  E( x  )2  E( x 2 )  E( x) 

V ( x)  E( x   )2  E( x 2 )  E( x)

2

Variancia

n   n V ( x)   x i2  p(x i )    x i  p( x i )    i 0 i 0

Distribución Binomial X ~ Bi (n; p) X: cantidad de éxitos en n pruebas

2

2

2

  V( x)   x f( x) dx    x 2 f( x)dx       

2

Dominio 0 ≤ x ≤ n

 n Probabilidad puntual: PBi(X = x /n; p)=   • px • 1 - p n- x , E(x) = μ = n · p, V(x) = σ2 = n · p · (1-p) Parámetros de la distribución: n y p. Gráfico de bastones x  Distribución de Poisson X ~ Po (λ)

x: cantidad de éxitos en un continuo de extensión t

Dominio 0 ≤ x

 : número medio de éxitos por unidad de continuo

Probabilidad puntual: PPo (X =x / λ) =

e    x x!

E(x) = λ

V(x) = σ2 = λ

Parámetro: λ

Distribución Normal o de Gauss – Laplace X ≈ N (μ x ; σ x ) Características: a)  ,  2 son los parámetros de la distribución. b) Tiene forma campanular, simétrica y asintótica al eje x, 2

1 x μ   σ 

  1 e 2 c) f(x)  2πσ

  f(x)  1 - 

Cumple con las condiciones: f(x) ≥ 0;

2 d) La esperanza matemática es  que coincide con la mediana y el modo, y la variancia es 

e) Variable normal estandarizada o tipificada Z  N (0;1) z =

x - μx , E(z) = 0, V(z) = 1 σx

x  μx Teorema central del límite, aplicado a la media aritmética: X ~ N(μ; σ2/n) y por lo tanto = Z ~ N(0; 1) σ/ n Material preparado por Lic. Adriana Ibero

11

Estimación de parámetros por Intervalo de confianza-- Una Muestra

Parámetro

Promedio μ

Tamaño de muestra con un nivel de confianza de (1- α)% y un error e

Información

Estimación del Intervalo de confianza del (1-α)%

Tamaño de muestra grande.

P(x - Z 1- α/2 .σ x / n  μ  x + Z 1-α/2 .σ x / n) = 1 - α

z 1 α/2 σ x   n   e  

P(x - t n-1; 1- α/2 .S x / n  μ  x + t n-1; 1-α/2 .S x / n) = 1 - α

 t n-1; 1 α/2  Sx  n    e  

Variancia conocida o desconocida.

2

Tamaño de muestra pequeña Variancia desconocida. Población normal. Proporción π Tamaño de muestra grande. Teorema Central del Límite

 pˆ . (1 - pˆ) pˆ . (1 - ˆp)    pˆ  Z 1-α/2 . P pˆ - Z 1-α/2 . n n   (n  1)  S2 (n  1)  S2 P  2  σ2  χ 2 n 1;α/2  χ n 1 ;1α/2

Variancia σ2

2

   = 1- α 

2

Z  n   1-α/2  . ˆp. (1 - pˆ )  e 

   1  α 

Estimación de parámetros por Intervalo de confianza -- Dos Muestras Parámetro

Información

Muestras Independientes Diferencia de Variancias conocidas. medias Muestras Independientes μ1- μ2 Variancias desconocidas e iguales.

Material preparado por Lic. Adriana Ibero

Estimación del Intervalo de confianza del (1-α)%

 σ2 σ 2  σ2 σ 2 P (x1 - x2 ) - Z1 -α/2 . 1  2  μ1 - μ2  ( x1 - x2 )  Z1-α/2 . 1  2  = 1 - α  n1 n2  n 1 n2    1 1 1 1 P (x1 - x2 ) - tn1 n2 -2; 1-α/2 .Sa    μ1 - μ2  (x1 - x2 )  tn1 n2 -2; 1 -α/2 .Sa   n 1 n2 n1 n2 

   = 1- α 

12

Variancia amalgamada:

S

2 a



(n1  1) S21  (n2  1)  S22 n1  n2 - 2

 S 2 S2  S 2 S2 P(x1 - x 2 ) - t ; 1-α/2 . 1  2  μ1 - μ2  (x1 - x2 )  t ; 1-α/2. 1  2  = 1 - α  n 1 n2  n1 n2  Muestras Independientes Variancias desconocidas y distintas.

Grados de libertad:



       

 S 2 S2  1  2  n  n 2 1

2

2  S2   S2  1  1  2     n 1  n 1  1  n2   

2   1    n2  1 

P( d - t n-1; 1-α/2 .Sd / n  μd  d + tn-1; 1 -α/2 .Sd / n) = 1 - α

Muestras Dependientes o Apareadas

di  x 1 - x2

d

di n

 S2d 

d2i - n d 2 n-1

Diferencia de  pˆ .qˆ pˆ .qˆ pˆ .qˆ pˆ .qˆ P (pˆ 1 - ˆp 2 ) - Z 1-α/2 . 1 1  2 2  π1 - π2  (pˆ1 - pˆ2 )  Z 1-α/2 . 1 1  2 2 proporciones  n n2 n n 1 1 2  π1 – π2 Cuadro para la utilización de Z o t en intervalos de confianza y test de hipótesis de la media de la media Población Con hipótesis de normalidad Sin hipótesis de normalidad Material preparado por Lic. Adriana Ibero

Tamaño

σ2 conocido

 =1- α  

σ2 desconocido

Grande n>100

Z=

x -μ σ

n

Z=

x -μ n S

Pequeña n≤100

Z=

x -μ σ

n

t=

x -μ n S

Grande n>100

Z=

x -μ σ

n

Z=

x -μ n S 13

Test de hipótesis Una población Parámetro

Hipótesis

Estadístico de prueba Con variancia conocida

H0 : μ = μ0 Promedio μ

H1: μ ≠ μ0 μ > μ0 μ < μ0

z

x μ 0 σ x/ n

~ N(0; 1)

Población normal. Con variancia desconocida. n< 100 tn 

x μ 0 S x/ n

~

t n-1

H0 : π = π 0 Proporción π

H1: π ≠ π 0 π >π 0 π...