Statystyka wzory - Tabele wszystkich wzorów statystycznych potrzebnych do obliczeń PDF

Title	Statystyka wzory - Tabele wszystkich wzorów statystycznych potrzebnych do obliczeń
Course	Wprowadzenie do statystyki
Institution	Uniwersytet Wroclawski
Pages	7
File Size	595.5 KB
File Type	PDF
Total Downloads	23
Total Views	121

Preview

CLICK TO PREVIEW PDF

Summary

Tabele wszystkich wzorów statystycznych potrzebnych do obliczeń ...

Description

1

STATYSTYKA OPISOWA 1. Grupowanie danych w szereg rozdzielczy z przedziałami klasowymi:

Liczba klas:

Rozstęp: R  x max  xmin

k  n , k 5 ln n, k 1  3,32 ln n

2.1. Miary klasyczne

Szereg szczegółowy

Szereg rozdzielczy

x  x    xn 1 x   xi  1 2 n i1 n xH 

Średnia harmoniczna

n 1

n

x i1

Wariancja dla dużej próbki (n 30)

s2 

Wariancja dla małej próbki (n < 30)

i



1 n n  x H   i   n i1 x i 

1 1 n 2 2 2 x x      i  xi   x n i1 n i1 1 n ˆs 2   x  x 2 n  1 i 1 i n

s x

K – kurtoza (współczynnik skupienia)



n

s  s 2 , sˆ  sˆ2

Współczynnik zmienności: V s  100% , Vd  Współczynnik asymetrii

1

n n  n n n  xi x1  x2   i 1 i 1 2 n n 1 1 s 2    xi  x 2 ni   x2i ni   x  2 n i 1 n i 1 n 1 sˆ 2   x  x  2 n i n  1 i1 i

1 1 1    x1 x 2 xn

1 n 1 n d x   xi  x , d Me   x i  Me n i 1 n i1

Odchylenie przeciętne

częstości względne

n n 1 x   xi ni lub x  xi f i , f i  i n n i 1 i1

n

Odchylenie standardowe

R k

n

n

Średnia arytmetyczna

Długość przedziału: h 

dx 

1 n 1 n x x n   d ,  i Me i  x i  Me n i n i 1 n i1

d 100%. Typowy obszar zmienności cechy: x

1 ( x  x) 3 3 n  i As  3  s s3 1 x x 4 4 n  ( i  ) K 4  s4 s

As 

x  Dx s

x  s, x  s .

1 ( x  x) 3 ni 3 n  i As  3  s s3 1 x x 4n 4 n  ( i  ) i K 4  s4 s

Dx – dominanta (modalna)

E – eksces (współczynnik spłaszczenia):

E Kurtoza  3

Średnia arytmetyczna połączonych r próbek Wariancja połączonych r próbek = war. wewnętrzna + war. zewnętrzna

X 

1 N

r

n

i1

i 1

 xi N i , N  N i

2.2. Miary pozycyjne M ia ry

Dominanta (modalna) Mediana (wartość środkowa)

S2 

Dolna granica przedziału dominanty

Liczebność przedziału dominanty

Szereg szczegółowy Wartość najczęściej występująca (oprócz minimum i maks.)

1 r 2 1 r  xi  X  2 N i  s N   i i N i 1 N i1 Rozpiętość przedziału klasowego

Szereg rozdzielczy z przedziałami klasowymi

Liczebność przedziału poprzedniego

Dx  xm 

 1  Me   x 1  x 1  n 1  2  2 n 2 

Me x 1

n – parzysta liczba obserwacji

n nieparzyste

2



n1 

nm  nm1 h  nm  nm  1    nm  nm 1  m

Pozycja mediany

Me  x m 

k – ty centyl: C k 1  k  n  1, k   0,1.

Q – kwartyle, D – decyle, Q1 x1  1 n  1 ,Q 3 x 1 3 n  1 4 4 C – centyle.

,

Q1  x m 

1  k  n  1  C

n  4

n  2

n i 1

nm

m 1

n

i

i 1

nm

m 1

i

Liczebność przedziału następnego

hm

Suma liczebności poprzedzających przedział mediany Liczebność przedziału mediany

3n m 1   ni ; 4 i1 hm Q 3 x m  h m nm

Q1  Q3  2Me Q  Q1 Q Odchylenie , Współczynnik zmienności: VQ  100% , Asymetria: AQ  Q 3 ćwiartkowe: 2Q Me 2 3. Współczynnik koncentracji Lorenza: K L 1 

1 z z  isk 2 i 1sk f i 5000

Skumulowane wskaźniki (uporządkowanych rosnąco) wartości cechy X w % Wskaźnik struktury (częstość względna) w %

2

ANALIZA REGRESJI 1.1. Regresja I rodzaju:

1. Tablica dwudzielna:

yk \ xi

x1

x2

y1

a

b

y2 

c 

k

Y |  X x   y aa  yc c a 1

yˆ  aY x  bY

Regresja cechy Y względem X:

Objaśnienia:

s C( X , Y ) r x, y   Y  , sX s 2X

2

1

Y

x, y

Regresja cechy X względem Y:

d 

X | Y  y1  

– średnie,

sX – odchylenie standardowe cechy X, sY – odchylenie standardowe cechy Y,

bY  y  a Y x

ˆx aX y  bX C(X,Y) – kowariancja cech

Regresja cechy X względem Y:

x1a  x2b   a b 

s C( X , Y ) a X r x, y  X  , s2Y sY



a c b d

ni 

1.2. Regresja II rodzaju:

Regresja cechy Y względem X:

b X x  a X y

1 1 C X ,Y  1 2 2 r x, y  , C X,Y  x yi nk ik x y , x   xini , y   y kn k, s X   x 2in i   x , s Y   y2kn k   y sX sY n n n

Współcz. korelacji:

2. Dane w postaci szeregu szczegółowego: 2.1. Współczynnik korelacji liniowej Pearsona

2.2. Współczynnik korelacji rang Spearmana

1   xi  x  yi  y  C  X ,Y  n i 1    sX sY 1 n 1 n 2 2 yi  y    xi  x   n  n i 1 i1 n

rXY

2.3. Regresja liniowa Y względem X n

aY

 x C X , Y   

i

i1

s

2 X

n

 x

i

 x 2

i1

n

x

 x

i

i 1

2

n

y

 y

i

n

i

aX

s

2

 x yi  y

n

 y

i

6  d i2 i 1 3

n  n

rXY   a X aY   1;1

 y 2

n

bX  x  aX y,

 y

2 Y

s  a C( X ,Y )

i

 y 2

i 1

n

  x  x y  y i

i1

yˆ aY x  bY

; r   1;1

X względem Y – funkcja typu y = ax + b

i 1

2 Y

rs 1 

i 1

 x C X ,Y   

i1

bY  y  aY x,

  x i  x  y i  y 

2.4. Regresja liniowa X względem Y

 x  y i  y 

n

n

xˆ a X y  bX

b  y  ax,

y ax  b

MIARY ZALEŻNOŚCI

1. Cechy X i Y są dychotomiczne – przyjmują tylko dwie wartości:  Weryfikacja hipotezy o niezależności. H0: zmienne X, Y są niezależne. X \Y 0 1 0 1 

a c a+c

b d b+d

a+b c+d n

1.1. Współczynnik Yule’a:  

Wartość empiryczna:  2 

n ad  bc  2  a  b  a  c  b  d   c  d 

Odczyt wartości krytycznej  z tablic rozkładu  dla 1 stopnia swobody

2  n

1.2. Współczynnik V – Cramera: V 

ad  bc

a  b  a  c  b  d  c  d 

i

i 1

,

  0,1 .

ad  bc 2 , V   0,1  n  a  b   a  c   b  d   c  d 

2. Cecha X przyjmuje r możliwych kategorii, a cecha Y k możliwych wartości:

3

Wartość empiryczna: 

\ Y

X

nij  nˆij

  r

2

k

nˆ ij

i 1 j1

1

n

2 

n



,

nˆ ij 

ni n j n

Odczyt wartości krytycznej   z tablic rozkładu  dla (r – 1)  (k – 1) stopnia swobody. 

2 , n

2.1. Współczynnik Yule’a:  

r

2

n

2.2.

Współczynnik V – Cramera: V 

2.3. Współczynnik kontyngencji C – Pearsona: C 

dla tablicy  2 k     0,1. .

2 , V   0,1 . n min  r  1 , k  1 

2 , C  1 . Im wyższy współczynnik, tym większa zależność n  2

2 , gdy r  k , to T   0,1 . n   r  1  k  1 ANALI ZA SZER EGÓ W CZASOWYCH

2.4. Współczynnik zbieżności T – Czuprowa: T 

1. Trend: yˆ t  f ( t), yˆ t  wartości teoretyczne zmiennej objaśnianej yt wyznaczone z funkcji trendu. 1.1. Linia trendu: yˆt at  b n

 t

a

a) eliminacja trendu: w t 

 t  yt

i

i1 n

 t

i

 t

1.2. Analiza sezonowości

1 n , t 2

2

i1

y ch

yt , ˆyt

1. Wariancja resztowa

2. Współczynnik zbieżności n

1 S    yt  yˆ t  2 n k t

y

2

b) obliczenie średnich arytmetycznych z wartości wt dla tej samej fazy cyklu wahań,

k – liczba szacowanych parametrów (a, b: k = 2),

c) otrzymane surowe wskaźniki sezonowości podzielić przez ich średnią arytmetyczną.

b  y  at

1.4. Średnia chronologiczna:

1.3. Miary dopasowania funkcji trendu do danych

3. Współczynnik 1  y1  y 2 y 2  y 3 y 3  y 4      determinacji:   n  1 2 2 2 

2  yˆt 

 y

 y 2

 2  i n1

t

i1

R 1   2

t

2

  yˆ  y

t

 y

t

 y 2

2

2. Analiza dyna miki Indeksy dynamiki:

2.1. Przyrosty bezwzględne

2.2. Przyrosty względne

dt/ p 

 t / p  yt  y p

Jednopodstawowe:

dt /t  1 

 t / t 1 yt  yt  1

Łańcuchowe

x G  n 1 I 2 / 1 I 3 / 2  I n / n 1 n  1 In

Średnia geometryczna:

3. Indeksy cen, ilości i wartości: w = p  q 3.2. Indeksy zespołowe (agregatowe) 3.1. Indeksy Formuła Laspeyresa: Formuła Paaschego: indywidualne p1 p0

Indeks cen:

ip 

Indeks ilości:

q iq  1 q0

Indeks wartości:

L A) I p 

pq p q

1 0

0

w iw  1 w0

L

C) I q

p q  pq

P

Ip 

0

0 1

0

B)

0

Równość indeksowa:

p q p q

1 1

0

D)

P

Iq

yp



yt  y p

1 1

It/ p 

yp

t /t  1 y t  y t  1  yt  1 y t 1 /1

log xG 

I p  AB

I t / t 1 

yt yp

1  d t / p

yt  q  d t / t 1 yt 1

1 n 1 log I t /t  1  log  n  1 t2 n 1

Indeksy typu Fishera:

1

pq  p q 1

t / p

2.3. Indeksy indywidualne

Zespołowy indeks wartości

Iw 

p q p q

1 1

0

I q  CD

0

I w  L I p  P I q  P I p L I q ; AD BC

0

V – współczynniki zmienności indeksów indywidualnych p i q. rpq – współczynnik korelacji pomiędzy indywidualnymi indeksami p i q.

4 P

Równanie Bartkiewicza:

i w i p iq

L

Ip Ip

P

L

Iq Iq

;

B D  1  r pq V qV p , A C

Vq 

sq

Vp 

xq

sp xp

3. Indeksy wielkości stosunkowych: y = x  z Formuła Laspeyresa: Indeksy o stałej strukturze Indeksy wpływu zmian strukturalnych

A)

L

Iy 

y z y z

1 0

0

B)

I wp

1

Iy 

0 0 0

y z y z

1 1

Z  B

Z = AD = BC

I wp

y z  z

D)

1 1 1

y z  z

1 0 0

 x  x  y z z y  y z  y z  z z

Z) I y 

0 1

C)

0 1

P

0

 y z  y z  z z

Zespołowy indeks wszechstronny

Formuła Paaschego:

Z  A

Indywidualny indeks wielkości stosunkowych o zmiennej strukturze:

Z) I y

1

0

1

1

0

0

1 1 1

i

x1 j z1 j



x0 j z0 j

0

0

0

, j 1, 2,  , k

5

ESTYMACJA PRZEDZIAŁOWA NA POZIOMIE UFNOŚCI 1 –  1. Duża próba (n  30) 1.1. Dla średniej (wartości przeciętnej) m

1.2. Dla odchylenia standardowego 

Rozkład cechy X dowolny

s

x  t 

n

m  x  t  

1.3. Dla frakcji (wskaźnika struktury) p

Rozkład normalny

s 2n  2n  1  t 

s n

Odczyt wartości t z tablic rozkładu normalnego:

Rozkład normalny (losowanie niezależne)

pˆ 1  pˆ 1  pˆ   p  pˆ  t  n n 1 Przedział lewostronny:  t      Przedział prawostronny: 2

s 2n 2 n  1  t

pˆ  t 

1   t   2

Przedział dwustronny:

2. Mała próba 2.1. Dla średniej (wartości przeciętnej) m, zał. rozkład cechy normalny: X~N(m,  znane odchylenie standardowe w populacji

x  t 

2.2. Dla odchylenia standardowego 

nieznane odchylenie standardowe w popul.

  m x  t   n n

x  t 

s n 1

m  x  t 

n s 2 n s 2   .  12 0, 5  02, 5 

s n1

Odczyt wartości t z tablic rozkładu Studenta Odczyt wartości z tablic rozkładu  dla dla n – 1 stopni swobody n – 1 stopni swobody

Odczyt wartości t z tablic rozkładu normalnego

WERYFIKACJA H IPOTEZ PARAMETRYCZ NYCH NA PO ZIOMIE ISTO TNOŚCI   1. Parametryczne testy istotności oparte na dużych próbach (n  30) a) statystyka dla H0: m = m0 b) statystyka dla H0: m1 = m2 1.1. Średnia

m b)  1  2 , X~N(m, 

 2   20

2

2

2n s te    02

a) X~N(m, 

2n  1

a) statystyka dla H0: p = p0

1.3. Frakcja

pˆ 

x1  x2 2 1

2 2

s s  n1 n 2

dwustronny

prawostronny

H1: m < m0.

H1: m  m0. H1: m > m0.

b) H1: m1 < m2

H1: m1  m2 H1: m1 > m2

H1: < 0

H1:  0 H1: > 0

H1: p < p0

H1: p  p0

H1: p > p0

H1: p1 < p2

H1: p1  p2

H1: p1 > p2

a) statystyka dla H0:

1.2. Wariancja



te 

x  m0 te   n. s

Zbiór krytyczny lewostronny

te 

x n

b) rozkład dowolny:

te 

sˆ 2   20  02

n 2

b) statystyka dla H0: p1 = p2

pˆ  p0

te 

p 0  1 p 0  n

pˆ 1  pˆ 2

x , pˆ1  1 n1 p 1 p  n

p

1 1 1  t     t    t     2 2 2

Odczyt wartości krytycznej t z tablic rozkładu normalnego:

2. Parametryczne testy istotności oparte na małych próbach a) stat. dla H0: m = m0 b) statystyka dla H0: m1 = m2 2.1. Średnia X~ N(m, ) a) nieznane, b) nieznane,

te 

x  m0 te   n  1. s

 1  2 Odczyt t z tablic rozkładu t –Studenta:

dla n – 1 stopni swobody

2.2. Wariancja a) H0:  = 0

2

2

X~ N(m, )

Odczyt wartości krytycznej z tab.

 2e 

ns  20

 sˆ12 

rozkładu  dla n – 1 st. swobody

dwustronny

prawostronny

x1  x 2

H1: m < m0

H1: m  m0

H1: m > m0

n 1s 12  n 2s 22 n1  n 2  n1  n 2  2 n1n 2

H1: m1 < m2

H1: m1  m2

H1: m1 > m2

 t   2.

  t  .

 t   2.

2

x1i 

lewostronny

x1

n1  1

rozkładu F – Snedecora:

Zbiór krytyczny lewostronny

dla n1  n2  2 stopni swobody

b) H0:  = 2

n1 n 2 x1  x2 , n n1  n2 n1  n2

(0,  2 1   , n 

dwustronny

(0,  1  12      (  2

prawostronny 2

  2  , n  1,  

sˆ22 max( ˆs12  F     max , F  F F  s22 sˆ12 min(  F 1   , n2  1, n  F 1  0,5 , nl  1, nm  F 1   , n1  1, n F

W E R Y  I K A C J A  H I P O T E Z  N I E P A R A M E T R Y C Z N Y C H  N A  P O Z I O M I E  I  T O T N O ŚCI CI   Test zgodności :

Test – Kołmorogowa

Dwie populacje. H0: F1(x) = F2(x)

Odczyt wartości  z tab. rozkładu  dla k – r – 1 stopni swobody: k – liczba składników sumy (liczba przedziałów klasowych), r – liczba szacowanych parametrów rozkładu (np. m, ).

H0: F(x) = F0(x) k

 2 

ni 

np i  2

np i i1 pi = P(X = xi)

6  max F0  x   F  x   n

 ( t) 

 max F1 x  F2 x  n

x  x , Zk = 20, p3 0 ) :

X ~ N ( np,

npq )

2 E( X)=p , V( X)=p q E( X) =1 / p , V( X) =q/ p E( X)=n p , V( X) =n p q E( X) =V( X)=n p q = 1 – p, n – liczba niezależnych doświadczeń; p – stałe prawdopodobieństwo sukcesu w pojedynczej próbie, k - liczba sukcesów.

3. Rozkłady prawdopodobieństwa zmiennych losowych ciągłych jednowymiarowych Rozkład

Jednostajny Wykładniczy

Funkcja gęstości

Dystrybuanta

E(X)

V(X)

xa 1 1 1 b  dla x  (a a  b dla x  (a , F x   f x  b a b a 2 12 1 1 f  x  e x dla x  0,  F  x 1  e   x x  0,    2

Funkcja gęstości

Dystrybuanta...