Statystyka całość omówiona przez kijka na prezentacjach PDF

Title Statystyka całość omówiona przez kijka na prezentacjach
Course Prawno-biznesowy
Institution Uniwersytet Marii Curie-Sklodowskiej w Lublinie
Pages 34
File Size 849 KB
File Type PDF
Total Downloads 43
Total Views 135

Summary

Dr Tomasz Kijek...


Description

Statystyka 04.03.2012r. Dr Arkadiusz Kijek Konsultacje p. 1116 środa 8.15-9.45, czwartek 8.15-9.45 [email protected] Literatura:      

M. Sobczyk Statystyka: podstawy teoretyczne, przykłady – zadania Wydawnictwo UMCS Lublin 2000 M. Sobczyk Statystyka Wyd. Naukowe PWN Warszawa 2008 S. Ostasiewicz, Z, Rusnak, U. Siedlecka Statystyka – elementy teorii i zadania, wyd. AE we Wrocławiu, Wrocław 2006 A. D. Aczel, Statystyka w zarządzaniu wyd. naukowe PWN, Warszawa 2000 W. Starzyoska Statystyka praktyczna, wyd. naukowe PWN, Warszawa 2006 A. Luszniewicz, T. Słaby Statystyka z pakietem komputerowym STATISTICA

Przedmiot statystyki Termin statystyka obecnie używany jest w wielu różnych znaczeniach, przede wszystkim jako:    

Zbiór danych liczbowych prezentujących kształtowanie się zjawisk i procesów Nazwa prac obejmujących gromadzenie, opracowywanie i prezentację danych liczbowych Nazwa charakterystyk liczbowych wyznaczanych na podstawie obserwacji zbiorowości próbnych Nazwa dyscypliny naukowej

Statystyka w ostatnim znaczeniu jest nauką zajmującą się badaniem prawidłowości zjawisk masowych. Zjawiska masowe to takie, które często się powtarzają i poprzez to wykazują określone prawidłowości. Prawidłowości nie są możliwe do zaobserwowania w pojedynczych przypadkach. Powstają one w wyniku oddziaływania na zjawiska przyczyn głównych (systematycznych) oraz ubocznych (przypadkowych). Przyczyny główne oddziaływają jednakowo lub podobnie na wszystkie jednostki badanej zbiorowości, natomiast przyczyny uboczne wpływają różnokierunkowo, przy czy w dużej liczbie przypadków wykazują tendencję do znoszenia się. Przykładem zjawisk masowych mogą byd: produkcja przedsiębiorstw, konsumpcja gospodarstw domowych, ceny dóbr, kursy akcji. Metody wykorzystywane do badania zjawisk masowych służą różnym celom. Pozwala to na wyodrębnienie dwóch głównych działów statystyki: statystyki opisowej oraz statystyki matematycznej. Statystyka opisowa zajmuje się metodami opisu danych statystycznych zebranych podczas badania statystycznego. Obejmuje ona programowanie badao statystycznych, metody obserwacji statystycz-

1

nej, opracowanie i prezentację materiału statystycznego oraz sumaryczny opis danych statystycznych. Celem statystyki opisowej jest podsumowanie zbioru danych i wyciągnięcie wniosków i uogólnieo na temat badanego zbioru. Statystyka matematyczna zajmuje się metodami wnioskowania o całej zbiorowości generalnej na podstawie wyników uzyskanych z wybranej jej części, zwanej próbą. Do tego celu wykorzystywany jest rachunek prawdopodobieostwa i inne działy matematyki. Funkcje statystyki:   

Informacyjna – dostatecznie wiarygodnych danych dających pełny i obiektywny obraz badanych zjawisk Analityczna – wskazanie czynników kształtujących procesy i zjawiska Prognostyczna – przewidywanie poziomu i struktury zjawisk w przyszłości

Podstawowe pojęcia statystyczne Zbiorowośd (populacja) statystyczna jest to zbiór dowolnych elementów (osób, przedmiotów, faktów) podobnych (ale nie identycznych) pod względem określonych cech i poddanych badaniom statystycznym. Jednostka statystyczna jest elementem składowym zbiorowości poddanej bezpośredniej obserwacji lub pomiarowi (obiektem badania). Zbiorowośd (populacja) generalna są to wszystkie jednostki statystyczne, co do których formułowane są wnioski ogólne. Zbiorowośd próbna (próba) jest to podzbiór populacji generalnej, obejmujący częśd jej elementów wybranych w określony sposób. Próba podlega badaniu statystycznemu, a jego wynik jest uogólniany na zbiorowośd generalną. Z uwagi na różne uwarunkowania analizie poddawana jest cała zbiorowośd (badanie pełne, kompletne, całkowite) lub tylko jej częśd (badanie częściowe). Badanie kompletne dostarcza pełnej informacji o populacji. Badania częściowe przeprowadza się w przypadkach gdy nie ma możliwości wykonania badania pełnego lub jest ono nieracjonalne z ekonomicznego punktu widzenia. Brak możliwości może wynikad z konieczności wyniszczenia populacji lub gdy jest ona nieskooczona. Druga sytuacji występuje, gdy przewidywane koszty badania pełnego przekroczyłyby spodziewane korzyści (zyski). W takich przypadkach przeprowadza się badanie częściowe, do którego wybiera się tylko częśd elementów badanej populacji tzw. próbę. Bardzo ważną sprawą jest by potrafid rozróżnid próbę od populacji oraz by dobrad tak próbę by była ona reprezentatywna dla populacji tzn. by stanowiła jej miniaturę (struktura próby zbliżona do struktury populacji). Reprezentatywnośd próby zapewnia jej losowy dobór, czyli taki w którym każdy element populacji ma jednakowe prawdopodobieostwo trafienia do próby. Natomiast próba losowa jest podzbiorem elementów populacji wylosowanych w taki sposób, że każdy podzbiór n elementów ma jednakowe szanse wylosowania. Przedmiotem badania statystycznego są cechy, które mogą mied różny charakter.

2

Podział cech statystycznych: 



Stałe – są wspólne dla wszystkich jednostek danej zbiorowości i nie podlegają badaniu, a jedynie decydują o zaliczeniu jednostki do określonej zbiorowości  Rzeczowe – określają co lub kto jest poddawany badaniu statystycznemu  Przestrzenne – wskazuje gdzie odbywa się badanie  Czasowe – informują jaki okres obejmuje badanie lub w jakim momencie się ono odbywa Zmienne – są to właściwości różnicujące poszczególne elementy zbiorowości, podlegają one badaniu statystycznemu, występuje ona w co najmniej dwóch odmianach zwanych wariantami (wartościami) cechy  Niemierzalne (jakościowe, kwalitatywne) – ich warianty ustala się w sposób opisowy, np. płed – kobieta, mężczyzna  Mierzalne (ilościowe, kwantytatywne) – zwane również zmiennymi, można je zmierzyd i wyrazid za pomocą liczb (np. waga, wzrost, dochody) o Skokowe (dyskretne) – przyjmują skooczony lub przeliczalny zbiór wartości na danej skali liczbowej, przy czym jest to najczęściej zbiór liczb całkowitych nieujemnych (np. liczba dzieci w rodzinie, liczba usterek) o Ciągłe – mogą przyjąd dowolną wartośd z określonego przedziału liczbowego, przy czym ilośd miejsc po przecinku zależy od dokładności pomiarów (no. waga, wzrost) o Quasi-ciągłe – ze swej natury są to cechy skokowe, natomiast traktowane są jako ciągłe ze względu na bardzo dużą skalę wartości jakie mogą przyjmowad (np. wydatki gospodarstw domowych na konsumpcję)  Quasi-ilościowe (porządkowe) – kwantyfikują natężenie badanej właściwości przedstawionej w sposób opisowy, porządkują w ten sposób zbiorowośd (np. oceny szkolne: bardzo dobra, dobra itd. albo w skrócie 5, 4 itd.).

Przykład. 200 wybranych losowo uczniów LO w Krakowie poddano badaniu ze względu na poziom wydatków i ilośd zakupionych podręczników w miesiącu wrześniu 2009r. Zbiorowośd statystyczna – uczniowie LO w Krakowie Zbiorowośd generalna – wszyscy uczniowie LO w Krakowie Jednostka statystyczna – uczeo LO w Krakowie Rodzaj badanej zbiorowości – zbiorowośd próbna Liczebnośd próby – 200 Cecha stała: 

Rzeczowa – uczniowie LO

 

Przestrzenna – Kraków Czasowa – wrzesieo 2009r.

3

Cecha zmienna:  

Wydatki na podręczniki (zł) – ilościowa, quasi-ciągła Liczba zakupionych książek (szt.) – ilościowa, skokowa

Proces badania statystycznego Etapy prowadzenia badania statystycznego:



Projektowanie badania statystycznego:  Określenie celu badania  Zdefiniowanie zbiorowości statystycznej i jednostki statystycznej  Wybór cech statystycznych  Dobór metody badania statystycznego  Wskazanie źródeł pozyskania danych  Opracowanie formularzy statystycznych i wzorów tablic wynikowych oraz zapewnienie kontroli materiału statystycznego Obserwacja statystyczna

 

Opracowanie i prezentacja materiału statystycznego Opis lub wnioskowanie statystyczne



Cele badania statystycznego Badanie statystyczne prowadzone jest w celu realizacji jednego lub kilku wymienionych zadao:   

Poznanie rozkładu zbiorowości pod względem wybranych cech (analiza struktury) Ocena rodzajów związków występujących między cechami (analiza współzależności) Poznanie zmian zbiorowości w czasie (analiza dynamiki)

Opracowanie i prezentacja materiału statystycznego Opracowany materiał należy odpowiednio zaprezentowad, wykorzystując jedną następujących form:   

Szereg statystyczny Tablica statystyczna Wykres statystyczny

Szeregi statystyczne Szereg statystyczny jest to ciąg wartości liczbowych badanej cechy, uporządkowanych według ściśle określonych kryteriów. Sposoby podziału szeregów zależą od rodzaju badania, rodzaju cechy, sposobu pomiaru oraz liczby obserwacji.

4

W badaniach statystycznych wyróżnia się następujące typy szeregów:  

 

Szczegółowy Rozdzielczy  Punktowy  Przedziałowy Przestrzenny (geograficzny) Czasowy (dynamiczny)

W przypadku gdy badana zbiorowośd jest nieliczna to uporządkowany ciąg wartości cechy tworzy szereg szczegółowy (wyliczający). Warianty cechy porządku się rosnąco bądź malejąco:

X(1) ≤ x(2) ≤ … ≤= x(n) lub x(1) ≥ x(2) ≥ … ≥ x(n) Gdzie:

xi – i-ty wariant cechy x(i) – i-ty uporządkowany wariant cechy n – liczebnośd zbiorowości statystycznej

Jeżeli mamy do czynienia z liczną zbiorowością wtedy budujemy szeregi rozdzielcze, czyli określonym wariantom xi lub przedziałom wartości cechy x0i – x1i przyporządkowuje się odpowiadające im liczebności bezwzględne ni lub liczebności względne (wskaźniki struktury) wi. Wskaźnik struktury (liczebnośd względna, częstośd, frakcja, odsetek) jest ilorazem liczby jednostek odpowiadających danemu wariantowi lub przedziałowi wartości cechy do liczebności badanej zbiorowości statystycznej. Oblicza się go następująco:

wi =

𝑛𝑖 𝑛

Przy czym: 𝑘𝑛 𝑖=1𝑖

=n

Gdzie:

ni – liczba jednostek zbiorowości o wartości cechy xi lub z przedziału x0i – x1i k – liczba przedziałów (klas) Wskaźnik struktury określa udział liczby jednostek zbiorowości charakteryzujących się określonym wariantem lub wariantami cechy w całkowitej liczebności badanej zbiorowości. Dokonując wyboru rodzaju szeregu rozdzielczego należy wziąd pod uwagę typ badanej cechy (skokowa, ciągła) oraz liczbę wariantów cechy. Jeżeli badana cecha przyjmuje małą liczbę wariantów tworzy

5

się szeregi rozdzielcze punktowe, natomiast przy dużej liczbie przyjmowanych wartości konstruuje się szeregi rozdzielcze przedziałowe. Szereg rozdzielczy punktowy to pogrupowany materiał statystyczny według rosnących bądź malejących wariantów cechy, którym przyporządkowuje się odpowiadające im liczebności bezwzględne lub względne. Szeregi statystyczne

xi x1 x2 … xk

ni n1 n2 … nk

xi x1 x2 … xk

wi w1 w2 … wk

Szereg rozdzielczy przedziałowy to pogrupowany materiał statystyczny według przedziałów wartości cechy, którym przyporządkowuje się odpowiadające im liczebności bezwzględne lub względne. Szeregi statystyczne

x0i – x1i x01 – x11 x02 – x12 .. x0k – x1k

ni n1 n2 … nk

x0i – x1i x01 – x11 x02 – x12 … x0k – x1k

wi w1 w2 … wk

gdzie: x0i – dolna i-tego przedziału x1i – górna granica i-tego przedziału Przy określaniu liczby przedziałów bierze się pod uwagę zmiennośd cechy (różnicę pomiędzy maksymalną a minimalną wartością), liczebnośd zbiorowości oraz cel badania. Do ustalenia liczby przedziałów można wykorzystad następujące wzory: k= √𝑛

k ≈ 1 + 3,322 log n k D). Stosując miary pozycyjne wskaźnik asymetrii przybiera postad:

WQ = (Q3 – Me) – (Me – Q1)

Współczynnik asymetrii (skośności) służy do określenia kierunku i siły asymetrii. Umożliwia porównywanie asymetrii różnych rozkładów. W zależności od stosowanych miar współczynnik asymetrii można obliczad z następujących wzorów:

AS =

𝑥− 𝐷

AQ =

𝑄3 − 𝑀𝑒− (𝑀𝑒 − 𝑄1 )

𝑠

𝑄3 − 𝑀𝑒 + (𝑀𝑒 − 𝑄1 )

=

𝑄3 + 𝑄1 −2𝑀𝑒 2𝑄

W przypadku dwóch pierwszych współczynników asymetrii informują one jaką częśd odchylenia standardowego lub przeciętnego stanowi różnica pomiędzy średnią arytmetyczną a dominantą. Pozycyjny współczynnik asymetrii określa kierunek i siłę asymetrii dla jednostek z ograniczonego przedziału (bez 25% o najmniejszych i 25% o największych wariantach cechy) i jest stosowany przede wszystkim gdy nie można wyznaczyd średniej arytmetycznej lub dominanty. Wartośd współczynnika asymetrii najczęściej zawiera się w przedziale:

-1 ≤ AS ≤1

Jedynie w przypadku bardzo silnej asymetrii wartośd współczynnika wykracza poza ten przedział. Większa wartośd bezwzględna współczynnika asymetrii oznacza silniejszą asymetrię rozkładu.

Teoria współzależności Teoria współzależności zajmuje się badaniem związków między wieloma zmiennymi. W rzeczywistości społeczno-gospodarczej zjawiska są ze sobą powiązane wielokierunkowymi zależnościami. Dlatego oprócz analizy zbiorowości pod względem jednej cechy – analizy jednowymiarowej, zachodzi potrzeba łącznej badania cech, czyli prowadzenia analizy wielowymiarowej (gdy co najmniej dwie cechy podlegają badaniu). Przykładami zależności występujących pomiędzy zjawiskami gospodarczymi mogą byd następujące związki: 

Bezrobociem a inflacją

18

   

Popytem a ceną dobra Popytem a dochodem Podażą a cenami czynników produkcji Plonami a nakładami



Wydajnością a poziomem płacy

Rodzaje związków pomiędzy zmiennymi Rodzaje zależności występujące między zmiennymi:  

Funkcyjna Stochastyczna

Zależnośd funkcyjna ma miejsce, gdy określonej wartości jednej zmiennej (zmienna niezależna, objaśniająca) odpowiada jedna i tylko jedna wartośd drugiej zmiennej (zależna, objaśniana). Istotą tej zależności jest to, że zmiana wartości jednej zmiennej powoduje ściśle określoną zmianę wartości drugiej zmiennej. Związku typu funkcyjnego występują najczęściej w naukach ścisłych np. pole kwadratu, P = a2. W naukach społeczno-gospodarczych są one rzadsze i nie podlegają głębszym analizom. Zależnośd stochastyczna występuje gdy określonemu wariantowi zmiennej niezależnej (lub ich kombinacji) odpowiadają różne warianty zmiennej zależnej. Oznacza to, że wraz ze zmianą wartości jednej zmiennej zmienia się rozkład prawdopodobieostwa drugiej zmiennej. Zależnośd ta wynika ze skomplikowanego charakteru zależnośd między zmiennymi, gdzie na zmienną zależną wpływa wiele zmiennych niezależnych oddziaływujących z różnym kierunkiem i siłą, a konkretnie badanie uwzględnia tylko niektóre z nich. Związki typu stochastycznego występują w naukach społeczno-gospodarczych, np. zależnośd wydatków na żywnośd od dochodu osiąganego przez gospodarstwo domowe, w gospodarstwach o jednakowych dochodach wydatki te mogą byd różne, ponieważ na ich wysokośd oddziałują inne pozadochodowe czynniki, np. liczba osób w gospodarstwie, gusty, itp. Szczególnym przypadkiem zależności stochastycznej jest zależnośd korelacyjna. W jej przypadku określony wariantom jednej zmiennej (niezależnej) odpowiadają średnie wartości drugiej zmiennej (zależnej). Zależnośd korelacyjna wskazuje jak zmienia się średnio wartośd zmiennej zależnej w wyniku zmiany wartości zmiennej niezależnej. Przykładowo, nie wszystkie gospodarstwa o wyższych dochodach wydają więcej na żywnośd, ale średnie wydatki na żywnośd w gospodarstwach o wyższych dochodach są wyższe. Stwierdzenie istnienia zależności korelacyjnej na podstawie analiz ilościowych nie zawsze będzie oznaczało występowanie więzi przyczynowo-skutkowej między zmiennymi. Dlatego analiza związków pomiędzy zjawiskami powinna byd dwukierunkowa; ilościowa i jakościowa. Analiza ilościowa powinna byd poprzedzana analizą jakościową przeprowadzoną na podstawie posiadanej wiedzy merytorycznej o badanym związku.

19

Związki przyczynowo-skutkowe mogą mied dwojaki charakter:  

Jednostronne (proste) – jednostronne oddziaływanie przyczyny na skutek np. wpływ poziom opadów na wielkośd plonów Dwustronne (złożone) – wzajemne oddziaływanie na siebie badanych zjawisk np. produkcji i kosztów.

Proste metody analizy związków korelacyjnych Proste metody stwierdzenia związków korelacyjnych: 



o

Analiza szeregów, polega na równoległym zestawieniu szeregów dla dwóch cech i porównaniu wartości liczbowych cech w szeregach w celu wykrycia prawidłowości, na tej podstawie można stwierdzid następujące zależności;  Korelacja dodatnia – zmiany jednokierunkowe o obydwu szeregach (wartości obydwu zmiennych na ogół rosną lub maleją0  Korelacja ujemna – zmiany różnokierunkowe (wzrostom wartości cechy w jednym szeregu odpowiadają spadki wartości cechy w drugim szeregu) Wykres rozrzutu punktów empirycznych (diagram korelacyjny), polega na zobrazowaniu w układzie współrzędnych punktów, których współrzędne są wartościami jednej zmiennej (zaznaczane na osi odciętych) i odpowiadającymi im wartościami drugiej zmiennej (zaznaczane na osi rzędnych), na poniższych wykresach przedstawiono możliwe do zaistnienia zależności: Korelacja liniowa dodatnia: yi

xi o

Korelacja liniowa ujemna yi

xi

20

o

Korelacja nieliniowa yi

xi

o

Brak korelacji

yi

xi

Mierniki korelacji Analiza korelacji prowadzona jest przy wykorzystaniu mierników korelacji, które służą do badania siły i kierunku związku korelacyjnego między zmiennymi. W zależności od ilości cech, ich rodzaju oraz sposobu prezentacji danych wykorzystywane są różne miary korelacji. Wśród nich wyróżnia się następujące: 

Pomiędzy dwiema zmiennymi  Zmienne ilościowe:  Współczynnik korelacji liniowej Pearsona  Współczynnik korelacji rang Spearmana  Zmienne jakościowe:  Miary zależności oparte na statystyce X2  Współczynnik 𝜑 Yule’a  Współczynnik zbieżności Czuprowa  Współczynnik V Cramera  Współczynnik kontyngencji C Pearsona

21

Współczynnik korelacji liniowej Pearsona Współczynnik korelacji liniowej Pearsona mierzy siłę i kierunek liniowego związku pomiędzy dwiema zmiennymi. W związku tym jednostkowym przyrostom jednej zmiennej towarzyszą średnie stałe przyrosty drugiej zmiennej. W sytuacji gdy dane zaprezentowane są w postaci szeregów szczegółowych dla obydwu zmiennych współczynnik Pearsona wyznacza się za pomocą wzoru:

rxy =

𝑐𝑜𝑣 (𝑥,𝑦 )

= 𝑠 𝑥 𝑠(𝑦)

𝑥𝑛𝑖=1 𝑖 −𝑥 (𝑦 𝑖 −𝑦)

𝑛 2 (𝑥 𝑖=1𝑖 −𝑥 )

2 (𝑦𝑛𝑖=1 𝑖 −𝑦)

Współczynnik Pearsona jest miarą symetryczną co oznacza, że rxy = ryx. Jest on unormowany w przedziale . Jego znak informuje o kierunku, natomiast jego wartośd bezwzględna o sile zależności liniowej. Gdy posiada znal „+” oznacza to korelację dodatnią, a gdy znak „-” oznacza to, korelację ujemną. Im wartośd bezwzględna współczynnik jest bliższa tym zależnośd jest słabsza, a im bliższa jedności tym zależnośd silniejsza. Wartośd współczynnika równa zero mówi o braku zależności korelacyjnej liniowej, natomiast wartośd bezwzględna równa jeden występuje w przypadku zależności funkcyjnych. W podręcznikach do statystyki przyjmuje się, że     

𝑟𝑥𝑦 < 0,2 – praktycznie brak zależności

0,2 ≤ 𝑟𝑥𝑦 0) lub zmaleje (a1 < 0) zmienna zależna jeżeli wartośd zmiennej niezależnej wzrośnie o jednostkę. Ocena a0 (b0) jest wyrazem wolnym i nie zawsze posiada interpretację ekonomiczną, gdyż jest to teoretyczny poziom zmiennej objaśnianej gdy zmienna objaśniająca jest równa 0. Współczynniki regresji dla liniowych funkcji regresji z jedną zmienną objaśniającą można obliczyd metoda pośrednią za pomocą wzorów:

a1 = rxy

𝑠(𝑦 )

𝑠(𝑥)

𝑠(𝑥)

lub b1 = ryx 𝑠(𝑦)

26

29.04.2012r.

Egzamin 17.06.2012r. 900 AULA I Częśd teoretyczna – test jednokrotnego wyboru, częśd zadaniowa – zadania! podstawą uz...


Similar Free PDFs