Statystyka 2 - Notatki z wykładu 2 PDF

Title Statystyka 2 - Notatki z wykładu 2
Course statystyka matematyczna
Institution Zachodniopomorski Uniwersytet Technologiczny w Szczecinie
Pages 4
File Size 60.9 KB
File Type PDF
Total Downloads 93
Total Views 122

Summary

wykład...


Description

Metody badania współzależności w dwuwymiarowym rozkładzie empirycznym Badanie związków korelacyjnych ma sens tylko wtedy, gdy między zmiennymi istnieje więź przyczynowo-skutkowa, którą można logicznie wytłumaczyć. Rozpoczynając badania należy na podstawie analizy merytorycznej uzasadnić logiczne występowanie związku, po czym można przystąpić do określania siły i kierunku zależności. Wśród związków przyczynowo-skutkowych można wyróżnić związki: • dwustronne, które cechuje wzajemne oddziaływanie na siebie badanych zjawisk – przyczyny i skutki ,,zamieniają się miejscami”, np. zależność płacy i wydajności; • jednostronne (proste), które charakteryzuje jednostronne oddziaływanie przyczyny na skutek, np. zależność pomiędzy wielkością spożycia napojów chłodzących i wysokością temperatury. Analiza zależności korelacyjnej między cechami Analiza zależności cech statystycznych może dotyczyć cech: ➢ jakościowych i ilościowych, o miary zależności oparte na wartościach statystyki X2 [chikwadrat] – współczynnik φ-Youle’a, współczynnik zbieżności T-Czuprowa, współczynnik V-Cramera, o współczynnik korelacji rang Spearmana; ➢ ilościowych – współczynnik korelacji liniowej Pearsona. Metody statystyczne w analizie współzależności Metody statystyczne wykorzystywane w analizie współzależności pozwalają na określenie: 1) siły związku badanych cech(zjawisk), 2) kształtu zależnościbadanych cech(zjawisk), 3) kierunku zależnościbadanych cech(zjawisk), 4) istotnościzależnościbadanych cech(zjawisk). Badanie siły związku nazywa się analizą korelacji, a badanie kształtu zależności– analizą regresji. Badanie kierunku i istotności związku dotyczyć może zarówno korelacji, jak i regresji. Formy prezentacji danych statystycznych Formy tabelaryczne: • szereg korelacyjny, Warianty cechy X x1 x2 x3 x4 … xn Warianty cechy Y y1 y2 y3 y4 … yn • tablica korelacyjna (dla cech ilościowych), • tablica niezależności (dla cech jakościowych). Wybór tabelarycznej formy prezentacji zależy od • liczebności zbiorowości, • rodzaju cechy statystycznej. 2 Formy prezentacji danych statystycznych Formy graficzne pozwalają ocenić: ➢ czy występuje związek korelacyjny, czy też nie? ➢ jaka jest siła tego związku, ➢ jaki jest kierunek tego związku. • diagram korelacyjny (empiryczny rozrzut punktów) – dla danych w szeregu korelacyjnym, Korelacyjny wykres rozrzutu

Analizę zależności powinno się rozpoczynać od sporządzenia korelacyjnego wykresu rozrzutu. Wzrokowa ocena tego wykresu umożliwia określenie siły i rodzaju zależności. W prostokątnym układzie współrzędnych: • na osi odciętych zaznaczamy wartości tej cechy, którą określamy jako X – zmienną niezależną (zmienną objaśniającą), • na osi rzędnych wartości cechy Y przyjętej za zmienną zależną (zmienną objaśnianą). Punkty, odpowiadające poszczególnym wartościom cech, tworzą korelacyjny wykres rozrzutu – punktów tych nie łączymy. Przykładowe korelacyjne wykresy rozrzutu Korelacja dodatnia – wzrostowi wartości jednej cechy (X) odpowiada wzrost średnich wartości drugiej cechy (Y). Korelacja ujemna – wzrostowi wartości jednej cechy (X) odpowiada spadek średnich wartości drugiej cechy (Y). Współczynnik korelacji liniowej Persona Współczynnik korelacji Pearsona przyjmuje wartości z przedziału [-1, 1], jest unormowanym miernikiem natężenia i kierunku współzależności liniowej dwóch zmiennych ilościowych: 1) jeżeli obserwacje podane są w postaci szeregów szczegółowych, to: yxyxyxc ),(    n i ii yx n yx 1 1   n i ix n x 1 1   n i

iy n y 1 1   n i i xx n xs 1 2)( 1 )(    n i i yy n ys 1 2)(1)( )()( ),( )()( )()( 11 22 1 ysxs yxc yyxx yyxx rr n i n i ii n i ii yxxy           

2 yxr (lub 2 xyr ) nosi nazwę współczynnika determinacji liniowej, który wyrażony w % informuje w ilu procentach zmienność jednej cechy można wyjaśnić zmianami drugiej cechy. 3 Współczynnik korelacji liniowej Persona Znak współczynnika korelacji informuje o kierunku współzależności liniowej, natomiast jego bezwzględna wartość o natężeniu związku, rxy=ryx. Gdy rxy=1 lub rxy=-1, wówczas między zmiennymi zachodzi zależność w postaci funkcji liniowej (na wykresie punkty empiryczne układają się wzdłuż linii prostej). Gdy rxy=0, cechy są nieskorelowane. W analizach statystycznych zwykle (umownie) przyjmuje się, że jeżeli r współczynnik korelacji wynosi: ➢ mniej niż 0,2, praktycznie nie ma związku liniowego między badanymi cechami; ➢ 0,2-0,4 – zależność liniowa wyraźna, lecz niska; ➢ 0,4-0,7 – zależność umiarkowana; ➢ 0,7-0,9 – zależność znacząca; ➢ powyżej 0,9 zależność bardzo silna. Podsumowanie Obliczenie miar korelacji jest punktem wyjścia do dokładniejszego badania współzależności występujących pomiędzy analizowanymi cechami statystycznymi. Współczynnik korelacji liniowej Pearsona dostarcza informacji, czy pomiędzy badanymi cechami występuje zależność liniowa. Silna korelacja pozwala przypuszczać, iż do opisu kształtowania się wartości danej cechy uzasadnione jest wyznaczenie prostej regresji. Niski poziom współczynnika Pearsona wskazuje, że należy poszukiwać innych – nieliniowych – funkcji lepiej opisujących współzależności występujące pomiędzy badanymi zjawiskami (regresja nieliniowa)....


Similar Free PDFs