Title | Statystyka wzory - Tabele wszystkich wzorów statystycznych potrzebnych do obliczeń |
---|---|
Course | Wprowadzenie do statystyki |
Institution | Uniwersytet Wroclawski |
Pages | 7 |
File Size | 595.5 KB |
File Type | |
Total Downloads | 23 |
Total Views | 121 |
Tabele wszystkich wzorów statystycznych potrzebnych do obliczeń ...
1
STATYSTYKA OPISOWA 1. Grupowanie danych w szereg rozdzielczy z przedziałami klasowymi:
Liczba klas:
Rozstęp: R x max xmin
k n , k 5 ln n, k 1 3,32 ln n
2.1. Miary klasyczne
Szereg szczegółowy
Szereg rozdzielczy
x x xn 1 x xi 1 2 n i1 n xH
Średnia harmoniczna
n 1
n
x i1
Wariancja dla dużej próbki (n 30)
s2
Wariancja dla małej próbki (n < 30)
i
1 n n x H i n i1 x i
1 1 n 2 2 2 x x i xi x n i1 n i1 1 n ˆs 2 x x 2 n 1 i 1 i n
s x
K – kurtoza (współczynnik skupienia)
n
s s 2 , sˆ sˆ2
Współczynnik zmienności: V s 100% , Vd Współczynnik asymetrii
1
n n n n n xi x1 x2 i 1 i 1 2 n n 1 1 s 2 xi x 2 ni x2i ni x 2 n i 1 n i 1 n 1 sˆ 2 x x 2 n i n 1 i1 i
1 1 1 x1 x 2 xn
1 n 1 n d x xi x , d Me x i Me n i 1 n i1
Odchylenie przeciętne
częstości względne
n n 1 x xi ni lub x xi f i , f i i n n i 1 i1
n
Odchylenie standardowe
R k
n
n
Średnia arytmetyczna
Długość przedziału: h
dx
1 n 1 n x x n d , i Me i x i Me n i n i 1 n i1
d 100%. Typowy obszar zmienności cechy: x
1 ( x x) 3 3 n i As 3 s s3 1 x x 4 4 n ( i ) K 4 s4 s
As
x Dx s
x s, x s .
1 ( x x) 3 ni 3 n i As 3 s s3 1 x x 4n 4 n ( i ) i K 4 s4 s
Dx – dominanta (modalna)
E – eksces (współczynnik spłaszczenia):
E Kurtoza 3
Średnia arytmetyczna połączonych r próbek Wariancja połączonych r próbek = war. wewnętrzna + war. zewnętrzna
X
1 N
r
n
i1
i 1
xi N i , N N i
2.2. Miary pozycyjne M ia ry
Dominanta (modalna) Mediana (wartość środkowa)
S2
Dolna granica przedziału dominanty
Liczebność przedziału dominanty
Szereg szczegółowy Wartość najczęściej występująca (oprócz minimum i maks.)
1 r 2 1 r xi X 2 N i s N i i N i 1 N i1 Rozpiętość przedziału klasowego
Szereg rozdzielczy z przedziałami klasowymi
Liczebność przedziału poprzedniego
Dx xm
1 Me x 1 x 1 n 1 2 2 n 2
Me x 1
n – parzysta liczba obserwacji
n nieparzyste
2
n1
nm nm1 h nm nm 1 nm nm 1 m
Pozycja mediany
Me x m
k – ty centyl: C k 1 k n 1, k 0,1.
Q – kwartyle, D – decyle, Q1 x1 1 n 1 ,Q 3 x 1 3 n 1 4 4 C – centyle.
,
Q1 x m
1 k n 1 C
n 4
n 2
n i 1
nm
m 1
n
i
i 1
nm
m 1
i
Liczebność przedziału następnego
hm
Suma liczebności poprzedzających przedział mediany Liczebność przedziału mediany
3n m 1 ni ; 4 i1 hm Q 3 x m h m nm
Q1 Q3 2Me Q Q1 Q Odchylenie , Współczynnik zmienności: VQ 100% , Asymetria: AQ Q 3 ćwiartkowe: 2Q Me 2 3. Współczynnik koncentracji Lorenza: K L 1
1 z z isk 2 i 1sk f i 5000
Skumulowane wskaźniki (uporządkowanych rosnąco) wartości cechy X w % Wskaźnik struktury (częstość względna) w %
2
ANALIZA REGRESJI 1.1. Regresja I rodzaju:
1. Tablica dwudzielna:
yk \ xi
x1
x2
y1
a
b
y2
c
k
Y | X x y aa yc c a 1
yˆ aY x bY
Regresja cechy Y względem X:
Objaśnienia:
s C( X , Y ) r x, y Y , sX s 2X
2
1
Y
x, y
Regresja cechy X względem Y:
d
X | Y y1
– średnie,
sX – odchylenie standardowe cechy X, sY – odchylenie standardowe cechy Y,
bY y a Y x
ˆx aX y bX C(X,Y) – kowariancja cech
Regresja cechy X względem Y:
x1a x2b a b
s C( X , Y ) a X r x, y X , s2Y sY
a c b d
ni
1.2. Regresja II rodzaju:
Regresja cechy Y względem X:
b X x a X y
1 1 C X ,Y 1 2 2 r x, y , C X,Y x yi nk ik x y , x xini , y y kn k, s X x 2in i x , s Y y2kn k y sX sY n n n
Współcz. korelacji:
2. Dane w postaci szeregu szczegółowego: 2.1. Współczynnik korelacji liniowej Pearsona
2.2. Współczynnik korelacji rang Spearmana
1 xi x yi y C X ,Y n i 1 sX sY 1 n 1 n 2 2 yi y xi x n n i 1 i1 n
rXY
2.3. Regresja liniowa Y względem X n
aY
x C X , Y
i
i1
s
2 X
n
x
i
x 2
i1
n
x
x
i
i 1
2
n
y
y
i
n
i
aX
s
2
x yi y
n
y
i
6 d i2 i 1 3
n n
rXY a X aY 1;1
y 2
n
bX x aX y,
y
2 Y
s a C( X ,Y )
i
y 2
i 1
n
x x y y i
i1
yˆ aY x bY
; r 1;1
X względem Y – funkcja typu y = ax + b
i 1
2 Y
rs 1
i 1
x C X ,Y
i1
bY y aY x,
x i x y i y
2.4. Regresja liniowa X względem Y
x y i y
n
n
xˆ a X y bX
b y ax,
y ax b
MIARY ZALEŻNOŚCI
1. Cechy X i Y są dychotomiczne – przyjmują tylko dwie wartości: Weryfikacja hipotezy o niezależności. H0: zmienne X, Y są niezależne. X \Y 0 1 0 1
a c a+c
b d b+d
a+b c+d n
1.1. Współczynnik Yule’a:
Wartość empiryczna: 2
n ad bc 2 a b a c b d c d
Odczyt wartości krytycznej z tablic rozkładu dla 1 stopnia swobody
2 n
1.2. Współczynnik V – Cramera: V
ad bc
a b a c b d c d
i
i 1
,
0,1 .
ad bc 2 , V 0,1 n a b a c b d c d
2. Cecha X przyjmuje r możliwych kategorii, a cecha Y k możliwych wartości:
3
Wartość empiryczna:
\ Y
X
nij nˆij
r
2
k
nˆ ij
i 1 j1
1
n
2
n
,
nˆ ij
ni n j n
Odczyt wartości krytycznej z tablic rozkładu dla (r – 1) (k – 1) stopnia swobody.
2 , n
2.1. Współczynnik Yule’a:
r
2
n
2.2.
Współczynnik V – Cramera: V
2.3. Współczynnik kontyngencji C – Pearsona: C
dla tablicy 2 k 0,1. .
2 , V 0,1 . n min r 1 , k 1
2 , C 1 . Im wyższy współczynnik, tym większa zależność n 2
2 , gdy r k , to T 0,1 . n r 1 k 1 ANALI ZA SZER EGÓ W CZASOWYCH
2.4. Współczynnik zbieżności T – Czuprowa: T
1. Trend: yˆ t f ( t), yˆ t wartości teoretyczne zmiennej objaśnianej yt wyznaczone z funkcji trendu. 1.1. Linia trendu: yˆt at b n
t
a
a) eliminacja trendu: w t
t yt
i
i1 n
t
i
t
1.2. Analiza sezonowości
1 n , t 2
2
i1
y ch
yt , ˆyt
1. Wariancja resztowa
2. Współczynnik zbieżności n
1 S yt yˆ t 2 n k t
y
2
b) obliczenie średnich arytmetycznych z wartości wt dla tej samej fazy cyklu wahań,
k – liczba szacowanych parametrów (a, b: k = 2),
c) otrzymane surowe wskaźniki sezonowości podzielić przez ich średnią arytmetyczną.
b y at
1.4. Średnia chronologiczna:
1.3. Miary dopasowania funkcji trendu do danych
3. Współczynnik 1 y1 y 2 y 2 y 3 y 3 y 4 determinacji: n 1 2 2 2
2 yˆt
y
y 2
2 i n1
t
i1
R 1 2
t
2
yˆ y
t
y
t
y 2
2
2. Analiza dyna miki Indeksy dynamiki:
2.1. Przyrosty bezwzględne
2.2. Przyrosty względne
dt/ p
t / p yt y p
Jednopodstawowe:
dt /t 1
t / t 1 yt yt 1
Łańcuchowe
x G n 1 I 2 / 1 I 3 / 2 I n / n 1 n 1 In
Średnia geometryczna:
3. Indeksy cen, ilości i wartości: w = p q 3.2. Indeksy zespołowe (agregatowe) 3.1. Indeksy Formuła Laspeyresa: Formuła Paaschego: indywidualne p1 p0
Indeks cen:
ip
Indeks ilości:
q iq 1 q0
Indeks wartości:
L A) I p
pq p q
1 0
0
w iw 1 w0
L
C) I q
p q pq
P
Ip
0
0 1
0
B)
0
Równość indeksowa:
p q p q
1 1
0
D)
P
Iq
yp
yt y p
1 1
It/ p
yp
t /t 1 y t y t 1 yt 1 y t 1 /1
log xG
I p AB
I t / t 1
yt yp
1 d t / p
yt q d t / t 1 yt 1
1 n 1 log I t /t 1 log n 1 t2 n 1
Indeksy typu Fishera:
1
pq p q 1
t / p
2.3. Indeksy indywidualne
Zespołowy indeks wartości
Iw
p q p q
1 1
0
I q CD
0
I w L I p P I q P I p L I q ; AD BC
0
V – współczynniki zmienności indeksów indywidualnych p i q. rpq – współczynnik korelacji pomiędzy indywidualnymi indeksami p i q.
4 P
Równanie Bartkiewicza:
i w i p iq
L
Ip Ip
P
L
Iq Iq
;
B D 1 r pq V qV p , A C
Vq
sq
Vp
xq
sp xp
3. Indeksy wielkości stosunkowych: y = x z Formuła Laspeyresa: Indeksy o stałej strukturze Indeksy wpływu zmian strukturalnych
A)
L
Iy
y z y z
1 0
0
B)
I wp
1
Iy
0 0 0
y z y z
1 1
Z B
Z = AD = BC
I wp
y z z
D)
1 1 1
y z z
1 0 0
x x y z z y y z y z z z
Z) I y
0 1
C)
0 1
P
0
y z y z z z
Zespołowy indeks wszechstronny
Formuła Paaschego:
Z A
Indywidualny indeks wielkości stosunkowych o zmiennej strukturze:
Z) I y
1
0
1
1
0
0
1 1 1
i
x1 j z1 j
x0 j z0 j
0
0
0
, j 1, 2, , k
5
ESTYMACJA PRZEDZIAŁOWA NA POZIOMIE UFNOŚCI 1 – 1. Duża próba (n 30) 1.1. Dla średniej (wartości przeciętnej) m
1.2. Dla odchylenia standardowego
Rozkład cechy X dowolny
s
x t
n
m x t
1.3. Dla frakcji (wskaźnika struktury) p
Rozkład normalny
s 2n 2n 1 t
s n
Odczyt wartości t z tablic rozkładu normalnego:
Rozkład normalny (losowanie niezależne)
pˆ 1 pˆ 1 pˆ p pˆ t n n 1 Przedział lewostronny: t Przedział prawostronny: 2
s 2n 2 n 1 t
pˆ t
1 t 2
Przedział dwustronny:
2. Mała próba 2.1. Dla średniej (wartości przeciętnej) m, zał. rozkład cechy normalny: X~N(m, znane odchylenie standardowe w populacji
x t
2.2. Dla odchylenia standardowego
nieznane odchylenie standardowe w popul.
m x t n n
x t
s n 1
m x t
n s 2 n s 2 . 12 0, 5 02, 5
s n1
Odczyt wartości t z tablic rozkładu Studenta Odczyt wartości z tablic rozkładu dla dla n – 1 stopni swobody n – 1 stopni swobody
Odczyt wartości t z tablic rozkładu normalnego
WERYFIKACJA H IPOTEZ PARAMETRYCZ NYCH NA PO ZIOMIE ISTO TNOŚCI 1. Parametryczne testy istotności oparte na dużych próbach (n 30) a) statystyka dla H0: m = m0 b) statystyka dla H0: m1 = m2 1.1. Średnia
m b) 1 2 , X~N(m,
2 20
2
2
2n s te 02
a) X~N(m,
2n 1
a) statystyka dla H0: p = p0
1.3. Frakcja
pˆ
x1 x2 2 1
2 2
s s n1 n 2
dwustronny
prawostronny
H1: m < m0.
H1: m m0. H1: m > m0.
b) H1: m1 < m2
H1: m1 m2 H1: m1 > m2
H1: < 0
H1: 0 H1: > 0
H1: p < p0
H1: p p0
H1: p > p0
H1: p1 < p2
H1: p1 p2
H1: p1 > p2
a) statystyka dla H0:
1.2. Wariancja
te
x m0 te n. s
Zbiór krytyczny lewostronny
te
x n
b) rozkład dowolny:
te
sˆ 2 20 02
n 2
b) statystyka dla H0: p1 = p2
pˆ p0
te
p 0 1 p 0 n
pˆ 1 pˆ 2
x , pˆ1 1 n1 p 1 p n
p
1 1 1 t t t 2 2 2
Odczyt wartości krytycznej t z tablic rozkładu normalnego:
2. Parametryczne testy istotności oparte na małych próbach a) stat. dla H0: m = m0 b) statystyka dla H0: m1 = m2 2.1. Średnia X~ N(m, ) a) nieznane, b) nieznane,
te
x m0 te n 1. s
1 2 Odczyt t z tablic rozkładu t –Studenta:
dla n – 1 stopni swobody
2.2. Wariancja a) H0: = 0
2
2
X~ N(m, )
Odczyt wartości krytycznej z tab.
2e
ns 20
sˆ12
rozkładu dla n – 1 st. swobody
dwustronny
prawostronny
x1 x 2
H1: m < m0
H1: m m0
H1: m > m0
n 1s 12 n 2s 22 n1 n 2 n1 n 2 2 n1n 2
H1: m1 < m2
H1: m1 m2
H1: m1 > m2
t 2.
t .
t 2.
2
x1i
lewostronny
x1
n1 1
rozkładu F – Snedecora:
Zbiór krytyczny lewostronny
dla n1 n2 2 stopni swobody
b) H0: = 2
n1 n 2 x1 x2 , n n1 n2 n1 n2
(0, 2 1 , n
dwustronny
(0, 1 12 ( 2
prawostronny 2
2 , n 1,
sˆ22 max( ˆs12 F max , F F F s22 sˆ12 min( F 1 , n2 1, n F 1 0,5 , nl 1, nm F 1 , n1 1, n F
W E R Y I K A C J A H I P O T E Z N I E P A R A M E T R Y C Z N Y C H N A P O Z I O M I E I T O T N O ŚCI CI Test zgodności :
Test – Kołmorogowa
Dwie populacje. H0: F1(x) = F2(x)
Odczyt wartości z tab. rozkładu dla k – r – 1 stopni swobody: k – liczba składników sumy (liczba przedziałów klasowych), r – liczba szacowanych parametrów rozkładu (np. m, ).
H0: F(x) = F0(x) k
2
ni
np i 2
np i i1 pi = P(X = xi)
6 max F0 x F x n
( t)
max F1 x F2 x n
x x , Zk = 20, p3 0 ) :
X ~ N ( np,
npq )
2 E( X)=p , V( X)=p q E( X) =1 / p , V( X) =q/ p E( X)=n p , V( X) =n p q E( X) =V( X)=n p q = 1 – p, n – liczba niezależnych doświadczeń; p – stałe prawdopodobieństwo sukcesu w pojedynczej próbie, k - liczba sukcesów.
3. Rozkłady prawdopodobieństwa zmiennych losowych ciągłych jednowymiarowych Rozkład
Jednostajny Wykładniczy
Funkcja gęstości
Dystrybuanta
E(X)
V(X)
xa 1 1 1 b dla x (a a b dla x (a , F x f x b a b a 2 12 1 1 f x e x dla x 0, F x 1 e x x 0, 2
Funkcja gęstości
Dystrybuanta...