Statystyka opisowa PDF

Title Statystyka opisowa
Course Statystyka opisowa
Institution Uniwersytet Przyrodniczy w Poznaniu
Pages 4
File Size 178.8 KB
File Type PDF
Total Downloads 101
Total Views 138

Summary

Download Statystyka opisowa PDF


Description

PRZEDMIOT STATYSTYKI I PODSTAWOWE POJĘCIA STATYSTYCZNE Statystyka1 jest nauką zajmującą się metodami zbierania, analizy i syntezy informacji zawartej w zbiorach danych liczbowych – statystycznych2, opisujących zjawiska (społeczne, gospodarcze, przyrodnicze itd.), czyli stany badanych obiektów nazywanych jednostkami statystycznymi ze względu na pewne ich własności zwane cechami. Jej celem jest umożliwienie wyciągnięcia ogólniejszych wniosków na podstawie zebranych, a następnie analizowanych danych statystycznych, praktycznie w każdej dziedzinie wiedzy, a więc w ekonomii, demografii, biologii, rolnictwie i w wielu innych. Tutaj będziemy się zajmować zagadnieniami wykorzystania metod statystycznych w badaniach zjawisk gospodarczych i społecznych3. Zwykle wyróżnia się dwa podstawowe działy statystyki: a) statystykę opisową (jedno i wielowymiarową), b) statystykę matematyczną. Statystyka opisowa zajmuje się: zasadami programowania badań statystycznych, metodami obserwacji statystycznej – zbierania danych statystycznych, sposobami opracowania i prezentacji danych statystycznych, syntetycznym opisem zebranego materiału statystycznego za pomocą statystyk (parametrów opisowych). Należy podkreślić, że statystyka opisowa nie formułuje żadnych wniosków poza tymi, które wynikają z samych danych. Metody statystyki opisowej można podzielić na:  metody statystyki jednowymiarowej służące do analizy zjawisk prostych,  metody statystyki wielowymiarowej umożliwiające analizę zjawisk złożonych, czyli zbiorowości jednostek statystycznych charakteryzowanych ze względu na kilka (przynajmniej dwie) cech jednocześnie. Z kolei statystyka matematyczna zajmuje się metodami wnioskowania o całej zbiorowości na podstawie zbadania pewnej jej części – zwanej próbą, którą wybiera się w sposób losowy. Dyscyplinę tę tworzą trzy działy: a) teoria estymacji, b) weryfikacja hipotez statystycznych, c) metoda reprezentacyjna. Przedmiotem estymacji są zagadnienia szacowania nieznanych parametrów zbiorowości statystycznej (populacji) na podstawie danych z próby losowej. Z kolei weryfikacja hipotez statystycznych obejmuje zasady i metody sprawdzania określonych przypuszczeń dotyczących parametrów lub rozkładów populacji na podstawie wyników próby losowej. Metoda reprezentacyjna zajmuje się sposobami losowego wyboru próby ze zbiorowości skończonych. Przedmiotem rozważań w niniejszej pracy będą zagadnienia statystyki opisowej. Wprowadzimy teraz podstawowe pojęcia statystyki opisowej, takie jak: zbiorowość statystyczna, jednostka statystyczna, próba, cecha i skale pomiarowe cech. Zbiorowość statystyczna (zwana również populacją) jest rozumiana jako zbiór dowolnych elementów objętych badaniem statystycznym, które noszą nazwę jednostek statystycznych. Wyróżniamy dwa rodzaje zbiorowości statystycznej:  skończone, czyli o skończonej liczbie elementów,  nieskończone, czyli o nieskończonej liczbie elementów. Próba jest to część zbiorowości statystycznej, która może być wybrana w sposób losowy lub przez dobór celowy. Próba ma charakter losowy wtedy, gdy przypadek decyduje o tym, która jednostka zbiorowości będzie wylosowana, a tendencyjny wtedy, gdy zachodzi świadome typowanie jednostek do    

1

Słowo statystyka pochodzi od włoskiego słowa stato , które oznacza państwo albo zjawisko. Dane statystyczne są to informacje uzyskane od badanych jednostek w trakcie badań statystycznych, najczęściej mają charakter liczbowy, ale mogą też reprezentować fakty, pojęcia, rozkazy. 3 Zjawisko społeczne, gospodarcze jest stanem rzeczy polegającym na przysługiwaniu danej całości społecznej, gospodarczej (strukturze – zespołowi jednostek społecznych lub gospodarczych powiązanych określonymi relacjami) określonej własności – cechy.

2

próby. Jest ono najczęściej oparte na ogólnej wiedzy i rozeznaniu zagadnienia przez prowadzącego badania. Cecha jest to właściwość występująca u wszystkich jednostek zbiorowości, która pozwala odróżniać jednostki zbiorowości. Zbiór cech charakteryzujących jednostki nazywamy przestrzenią badań statystycznych. Cechy można sklasyfikować ze względu na różne kryteria: a) możliwość pomiaru, b) stopień złożoności, c) formę przedstawiania wartości. Ze względu na możliwość pomiaru cechy dzielimy na ilościowe i jakościowe. Cechy ilościowe (mierzalne) dają się wyrazić za pomocą liczb o różnych mianach. Wśród nich wyróżniamy:  cechy ciągłe, które mogą przyjmować każdą wartość z określonego przedziału liczbowego (np. powierzchnia targowisk stałych w m 2 , długość sieci wodociągowej rozdzielczej w km, produkcja koncentratów obiadowych w tonach),  cechy skokowe (dyskretne), które przyjmują jedynie skończoną liczbę wartości (niektóre wartości liczbowe) (np. liczba dzieci w rodzinie, liczba osób pracujących w sklepie),  quasi ciągłe, które teoretycznie mogłyby być uważane za ciągłe, jednak praktycznie przybierają skończoną liczbę wartości, a więc mogą być traktowane jako cechy skokowe (np. wiek). Cechy jakościowe mają różne warianty (kategorie, poziomy), które opisujemy słownie. Istnienie lub nieistnienie danego wariantu cechy można stwierdzić, ale nie można zmierzyć. Przykładami cech jakościowych są: forma własności przedsiębiorstw, cechy jakiegoś produktu, jego jakość, smak, zapach. Niekiedy wariantom cechy można przyporządkować liczby, których nie należy jednak traktować jako wielkości wyrażających wartości cechy w postaci mierzalnej. Wówczas mówimy o cesze porządkowej. Przykładem cechy porządkowej jest wykształcenie pracowników przedsiębiorstwa, gdzie poszczególnym poziomom wykształcenia można przyporządkować na przykład liczby: 0 – wykształcenie podstawowe, 1 – średnie, 2 – wyższe. Następnym kryterium podziału cech jest stopień ich złożoności. Z tego punktu widzenia cechy dzielimy na proste i agregatowe. Cecha prosta wyraża tylko jedną, bezpośrednio mierzalną właściwość jednostek zbiorowości (np. liczba lekarzy na 10 tys. ludności). Cecha syntetyczna (agregatowa) charakteryzuje właściwość bezpośrednio niemierzalną i jest funkcją rzeczywistą cech prostych. Na przykład cechą złożoną jest jakość życia mieszkańców, która jest funkcją takich cech prostych (między innymi) jak: emisja przemysłowych zanieczyszczeń powietrza w tys. t./mieszkańca, stopa bezrobocia rejestrowanego (w %), przeciętne miesięczne wynagrodzenie (w zł), liczba lekarzy na 10 tys. ludności. Wśród cech prostych tworzących cechę agregatową mogą występować cechy zwane stymulantami, destymulantami i nominantami. Cecha prosta jest stymulantą, jeśli jest dodatnio skorelowana z cechą agregatową, czyli jest to taka cecha, której większe wartości są pożądane, zaś niskie niepożądane z punktu widzenia rozważanej właściwości syntetycznej. Przykładami cech stymulant mogą być: rentowność przedsiębiorstw (w %), plony zbóż z ha w dt, dochody budżetów gmin w mln zł na 1 mieszkańca. Cecha destymulanta jest ujemnie skorelowana z cechą agregatową, tzn. jej mniejsze wartości są pożądane, zaś wysokie niepożądane z punktu widzenia rozpatrywanej właściwości syntetycznej. Przykładami cech destymulant mogą być: stopa bezrobocia rejestrowanego (w %), emisja zanieczyszczeń powietrza (w t/rok), udział wydatków na żywność w wydatkach ogółem w gospodarstwach domowych (w %). W końcu cecha nominanta - nie wykazuje istotnej korelacji z cechą agregatową, w pewnym przedziale zachowuje się jak stymulanta, a w pewnym jak destymulanta (można dla niej określić pożądaną wartość liczbową). Przykładem cech nominant są: zużycie nawozów sztucznych NPK (w kg/1 ha UR), suma opadów (w mm), płynność przedsiębiorstw rozumiana jako ich zdolność do spłacania bieżących zobowiązań. Ostatnim rozpatrywanym kryterium podziału cech jest forma przedstawienia wartości. Z tego punktu widzenia cechy mogą przybrać formę wskaźników struktury, natężenia i dynamiki. Wskaźniki struktury określają udziały, które mają poszczególne składniki struktury w badanej całości w odniesieniu do każdej jednostki. Wskaźnikiem struktury jest na przykład procentowy udział bezrobotnych w liczbie ludności czynnej zawodowo (stopa bezrobocia). Z kolei wskaźniki natężenia wyrażają stosunek wielkości charakteryzujących dwa różne zjawiska powiązane ze sobą w pewien logiczny lub przyczynowy sposób. Przykładem wskaźnika natężenia może być długość dróg gminnych i lokalnych miejskich na 100 km 2 w km. Natomiast wskaźniki dynamiki wyrażają stosunek między liczbami charakteryzującymi pewną

wielkość w dwóch różnych okresach lub momentach. Opisują rozwój zjawiska w czasie za pomocą stosunku między jego wielkościami w okresie badanym w porównaniu z okresem podstawowym. Przykładem wskaźnika dynamiki może być stosunek liczby studentów Akademii Rolniczej w Poznaniu w roku 2002 w porównaniu do roku 2001. SKALE POMIAROWE CECH W statystyce mamy do czynienia z wartościami (wariantami) cech, które otrzymuje się w wyniku pomiarów4. Pomiaru właściwości jednostek dokonuje się na odpowiednich skalach pomiarowych. Cechy mogą być mierzone przy wykorzystaniu czterech skal: 1) nominalnej, 3) przedziałowej (równomiernej), 4) ilorazowej. 2) porządkowej, Zostały one wymienione w kolejności od najsłabszej, którą jest skala nominalna, do najmocniejszej – ilorazowej. Skala nominalna zaliczana jest do skal niemetrycznych. Wykorzystuje się ją do mierzenia cech jakościowych. W tej skali podstawową operacją pomiarową jest operacja identyfikacji, czyli wyróżniania rozłącznych kategorii (poziomów, wariantów) cechy jakościowej. Prowadzi to do podziału zbioru jednostek statystycznych na podzbiory rozłączne. W tej skali posługujemy się relacją różności między kategoriami oraz relacją równości między jednostkami posiadającymi daną kategorię. Szczególnym przypadkiem skali nominalnej jest skala dychotomiczna stosowana przy pomiarze cech dwupunktowych, takich jak np. płeć lub pytanie w kwestionariuszu ankiety, na które istnieją tylko dwie odpowiedzi – tak lub nie. Jednej kategorii przypisuje się liczbę 1, a drugiej liczbę 0 i otrzymuje się w efekcie skalę zero jedynkową. Skala porządkowa jest skalą niemetryczną stosowaną do mierzenia cech jakościowych. W tej skali podstawową operacją jest operacja rangowania (szeregowania) kategorii cechy jakościowej za pomocą liczb, które wyznaczają rangi określające kolejność występowania (znaczenie) kategorii, jednak tych liczb nie można wykorzystać do mierzenia odległości między jednostkami. Za pomocą tej skali można wyznaczyć następujące relacje między stanami jednostek: różności, równości, mniejszości, większości. Na przykład, badając wzrost osoby możemy użyć określeń: niski, średni, wysoki, a następnie tym kategoriom cechy jakościowej, jaką jest wzrost, przypisać liczby 1 – niski, 2 – średni, 3 – wysoki. Mamy tu więc wyraźne uszeregowanie kategorii. W badaniu ankietowym preferowanych przez klienta marek handlowych pewnego produktu można w kwestionariuszu poprosić respondenta o porangowanie np. trzech różnych marek handlowych A, B, C. Liczbę 1 przypisuje się najbardziej preferowanej i ulubionej marce, 2 – marce preferowanej w drugiej kolejności, a liczbę 3 – ostatniej, najmniej preferowanej. Innymi przykładami skali porządkowej są:  skala Beauforta prędkości wiatru (12-stopniowa),  stopnie wojskowe, żeglarskie, naukowe. Skala przedziałowa (równomierna) jest skalą metryczną stosowaną do mierzenia cech ilościowych. Podstawową operacją pomiarową jest tu operacja identyfikacji wielkości różnic między elementami zbioru wyników. Pozwala ona na stwierdzenie, o ile natężenie cechy dla danej jednostki jest większe (mniejsze) od natężenia tej cechy dla innej jednostki. Mówimy wówczas, że natężenie jest większe (mniejsze) o tyle. Skalę taką określamy wskazując umownie – arbitralnie punkt zerowy (brak naturalnego punktu zerowego), stałą jednostkę miary i relację przyporządkowującą każdemu wynikowi obserwacji liczbę. Na pomiarach tej skali można dokonywać takich samych operacji jak w przypadku skali porządkowej, a ponadto za jej pomocą można określać odległość między jednostkami. Na wartościach tej skali dopuszczalne jest wykonywanie arytmetycznych operacji, takich jak dodawanie i odejmowanie. Przykładem skali przedziałowej może być skala Likerta, którą często stosuje się w badaniach marketingowych. Skala ta jest przedstawiana zwykle jako pięciostopniowa z arbitralnie ustalonym punktem zerowym, który oznacza postawę obojętną respondenta, a zbiór wyników dla tej skali jest następujący: (a) w pełni się zgadzam, (d) nie zgadzam się, (b) zgadzam się, (e) absolutnie się nie zgadzam, (c) nie wiem (ani się zgadzam, ani się nie zgadzam), z jakimś stwierdzeniem, na przykład, że 4

Pomiarem nazywamy czynność przyporządkowania liczb przedmiotom lub wydarzeniom zgodnie z pewnym zbiorem reguł.

 marketing to strata czasu?  marketing to reklamowanie i promocja produktów?  marketing pozwala zwiększać zyski firmy poprzez zadowolenie konsumenta? Innymi przykładami skali przedziałowej są: skala czasu kalendarzowego, skala temperatury. Skala ilorazowa jest skalą metryczną stosowaną do mierzenia cech ilościowych. Umożliwia stwierdzenie, ile razy natężenie cechy dla danej jednostki jest większe (mniejsze) niż natężenie tej cechy dla innej jednostki. Ma wszystkie własności skali przedziałowej, a ponadto określamy ją przez wybór stałej jednostki miary i wykazanie zera bezwzględnego (absolutnego naturalnego punktu zerowego), który oznacza zupełny brak wielkości mierzonej cechy. Przykładem cechy mierzonej na skali ilorazowej jest wiek, gdyż w jego przypadku można stwierdzić, nie tylko, że jedna osoba jest starsza od drugiej o tyle a tyle lat, ale jeszcze można powiedzieć, że jest starsza na przykład 2 razy. Inne cechy, które można mierzyć na skali ilorazowej odnoszą się do wielkości objętych układem jednostek SI, takich jak np. wiek, dochody firmy, ceny towarów, wielkość sprzedaży. Syntetyczny opis wyróżnionych skal pomiarowych przedstawiono w tab. 1. TABLICA 1. Charakterystyka skal pomiarowych cech Skala pomiarowa

Podstawowe operacje pomiarowe

Relacje między stanami jednostek

Operacje matematyczne

Nominalna

wyróżnianie rozłącznych kategorii

różności lub równości

zliczanie zdarzeń

różności, równości, zliczanie zdarzeń mniejszości, większości różności, równości, identyfikacja dodawanie i mniejszości, większości, odejmowanie wielkości różnic określanie odległości, między elementami wartości arbitralnie ustalony punkt zbioru wyników jednostek zerowy różności, równości, dodawanie, identyfikacja wartości mniejszości, większości, odejmowanie, ilorazów między określanie odległości, mnożenie i elementami zbioru absolutny punkt zerowy, dzielenie wartości wyników który oznacza zupełny brak jednostek wielkości mierzonej cechy szeregowanie kategorii

Porządkowa

Przedziałowa (równomierna)

Ilorazowa

PRZYKŁADY: 1) Procent niechłopskiej ludności w wieku produkcyjnym żyjącej na obszarach wiejskich według regionów rolniczych Polski kształtował się następująco (1995): Region

Stołecz.

Półn.

Półn.wsch.

Środ.

Środ. – zach.

Połud.zach.

Połud.

Połud.wsch.

Środ.wsch.

Procent ludności

35,1

67,8

38,4

31,0

50,4

66,5

61,2

32,8

24,3

Zbiorowość tworzą regiony rolnicze Polski, jednostką jest jeden region rolniczy, a cechą – procent niechłopskiej ludności w wieku produkcyjnym żyjącej na obszarach wiejskich, jest to cecha ilościowa ciągła wyrażona w postaci wskaźników struktury. 2) Wyposażenia gospodarstw domowych w telewizory z ekranem do odbioru kolorowego (w szt. /100 gospodarstw domowych) w Polsce w latach 1985-1996. Lata Liczba telewizorów

1985

1986

1987

1988

1989

1990

1991

1992

1993

1994

1995

1996

23,1

28,9

34,3

41,7

50,7

67,1

82,9

91,4

95,1

99,4

102,7

104,7

Zbiorowość tworzą lata od 1985 do 1996, jednostką jest jeden rok, a cechą wyposażenie gospodarstw domowych w telewizory z ekranem do odbioru kolorowego, jest to cecha ilościowa ciągła wyrażona w postaci wskaźników natężenia....


Similar Free PDFs