T-próba - t-próba PDF

Title T-próba - t-próba
Course Statisztika II.
Institution Debreceni Egyetem
Pages 15
File Size 550.9 KB
File Type PDF
Total Downloads 59
Total Views 188

Summary

t-próba...


Description

T-próbák A t-próbák statisztikai középérték összehasonlító tesztek. A középértékek esetében az egyszerű számtani átlagra kell gondolni. A valós életben sokszor érdekel minket, hogy vajon két minta átlaga között van-e szisztematikus eltérés. Például a közgazdaságtanban gyakori kérdés, hogy ugyanabban a pozícióban dolgozó férfiak és a nők átlagos bére között van-e eltérés. A pénzügyben két részvény árfolyam átlagos hozamát hasonlíthatjuk össze, míg az orvostudományban egy gyógyszer átlagos hatását vizsgálhatjuk. Fel lehet tenni a kérdést, hogy miért kell statisztikai próbát végrehajtanunk, és miért nem elég egyszerűen csak az átlagokat kiszámolni majd összehasonlítani? A statisztikai próbák előtt mintavételezés folyik, amely során random változókkal dolgozunk (azaz valamilyen valószínűségi eloszlástól függ az adott adat mintába való kerülése). Ez azt jelenti, hogy az átlagok lehet csak véletlen hatások miatt térnek el valamennyire egymástól, de valójában nincs igazi eltérés, így tekinthetjük őket egyformának (legalábbis nincs elég bizonyítékunk arra, hogy van valódi különbség közöttük). A próba az egyszerű összehasonlítás mellett több mindent is figyelembe vesz, például a minta nagyságát és szórását is. A t-tesztnek három típusa van: 1) Egy mintás t-próba 2) Független, két mintás t-próba 3) Páros mintás vagy párosított t-próba Egy mintás t-próba Az egy mintás t-próba során egy mintával rendelkezünk (vagy csak egy mintát szeretnénk vizsgálni), és annak átlagát hasonlítjuk egy elméleti középértékhez. Ez az elméleti középérték valamilyen előzetes feltevésből fakad. A teszt elvégzése előtt megfogalmazunk egy

nullhipotézist, amelyet   jelöléssel látunk el:

 :  = 

Azaz, a nullhipotézis szerint az átlag ( ) megegyezik azzal a bizonyos elméleti értékkel (). Ezután megfogalmazzuk ennek az ellenkezőjét (kétszélű próbát feltételezve), az alternatív hipotézist   :

 :  ≠  1

Azaz, az alternatív hipotézis  azt feltételezi, hogy az átlag nem egyezik meg az elméleti értékkel. A t-próba először is veszi az átlag és az elméleti érték közötti különbséget, majd azt elosztja az átlag standard hibájával: =

 − 

/√

Ahol a /√ jelöli a standard hibát, amelyet egyszerűen úgy kapunk, hogy a minta szórását () leosztjuk a darabszám gyökével. Ez egy t-eloszlású változó,  − 1 szabadságfokkal,

amelyet így jelölünk:

áí  − éé ∼ ( − 1)

Tehát a bal oldali érték a „∼ " jel jobb oldalán lévő eloszlásból származik. A t-eloszlás

„alakját” a szabadságfok befolyásolja, ezért szerepel a szabadságfok értéke (n-1) utána

zárójelben. Ha más eloszlással dolgozunk, akkor annak az eloszlásnak a fontos paraméterei szerepelnek majd (például normál eloszlás esetén a középérték és a szórás). A döntés két módon hozhatjuk meg és mind a két döntés ugyanarra az eredményre vezet: 1) Kritikus érték alapján: A t-próba esetén azt mondjuk, hogy ha a számított térték abszolút értékben > a kritikus érték, akkor elutasítjuk a nullhipotézist. Azért használunk abszolút értéket, mert lényegtelen, hogy a negatív részen vagy a pozitív részen esik az elutasítási tartományba az érték, amivel dolgozunk (a t-eloszlás szimmetrikus). 2) p-érték alapján: A p-érték esetében a „p” a probability szóra, azaz a valószínűségre utal. A p-érték azt mutatja meg, hogy mi annak a valószínűsége, hogy a kiszámított teszt statisztikával megegyező, vagy annál extrémebb (nagyobb vagy kisebb) értéket kapunk, amennyiben a nullhipotézis valóban igaz. Ezt az értéket úgy kaphatjuk meg, hogy megnézzük, hogy a számított teszt statisztika az eloszláson belül hova esik, és kiszámítjuk, hogy mi annak a valószínűsége, hogy ezt, vagy ennél extrémebb értéket kapunk (ehhez figyelembe vesszük, hogy a valószínűségi eloszlás függvénye alatti terület 1-et ad, mivel az összes kimenethez tartozó valószínűséget összegezi). A p-érték szabálya egyszerű, amennyiben a p-érték < a szignifikancia szint, elutasítjuk a nullhipotézist. Előnyként felróható, hogy a p-érték szabály bármilyen statisztikai próbánál érvényes, hátrányként pedig, hogy sokszor a döntés 2

binárissá válik így. Azaz, sokszor a döntés megáll ott, hogy elfogadjuk vagy elutasítjuk a nullhipotézist, pedig a megfelelő statisztikai elemzés esetében ez csak egy része kell, hogy legyen a döntésnek.

3

GYAKORLATI PÉLDA A kefir zsírtartalma szabvány szerint 3%. Az áruházlánc által forgalmazott kefirből 300 elemű mintát véve teljesíti-e a szabványt (1. feladat)? Döntését 5%-os elsőfajú hiba mellett hozza meg. Az alap adatbázisunk ez:

A 300 doboz kefirre elvégzett mérés eredménye megmutatja, hogy a különböző dobozoknak mekkora volt a zsírtartalma. Ahhoz, hogy a t-értéket kiszámoljuk, manuális eszközökre kell hagyatkoznunk, mivel az egy mintás t-próba egyszerűsége miatt az Excel nem implementálta beépített függvényként a t-próbát (legalábbis nem egyértelmű módon). 1. lépés 2. lépés 3. lépés 4. lépés

3,23 3,00 0,51 300

Átlag kiszámítása Elméleti átlag felírása Szórás kiszámítása Elemszám felírása

=ÁTLAG(…) (ezt tudjuk) =SZÓR.M(…) =DARAB(…)

Ez után kiszámoljuk az átlag standard hibáját (ezt a lépést kihagyva is meg lehet oldani a feladatot):



√

=

0,51

√300

4

= 0,02973

A következő lépésben már minden megvan a t-érték kiszámításához: =

 −  /√

3,23 − 3,00 = 7,74992 = 0,51/√300

Tehát a számított t-értékünk 7,74. Ezután az Excelben kritikus és p-értéket is ki lehet számolni, talán ez esetben egyszerűbb a kritikus értéket: Kritikus érték: = INVERZ.T(alfa ; n-1 szabadságfok) = INVERZ.T(0,05;300-1) = 1,967929669 Mivel a számított t-érték (7,74) abszolút értékben nagyobb, mint a kritikus t-érték (1,96), ezért elutasítjuk a nullhipotézist. Szignifikáns különbség van a kefir minta átlaga és a szabvány 3,00% között, tehát a minta nem teljesíti a szabványt. Amennyiben a kefires példát grafikusan ábrázolnánk, az 1. ábra képét látnánk. A feladat során arra vagyunk kíváncsiak, hogy a 300 elemű minta átlagos zsírtartalma 3,00% vagy attól szignifikánsan eltérő. A nullhipotézisben azt feltételezzük, hogy a minta átlag 3,00%, azaz nincs eltérés a számított és az elméleti átlag között. A kiszámított egy mintás t-próba értéke 7,74, amely (ha igaz a nullhipotézis), egy n-1, azaz 299 szabadságfokú t-eloszlásból származik. A hagyományos, 5% nagyságú szignifikancia szint mellett az alsó és a felső kritikus érték (mivel szimmetrikus eloszlás), -1,96 és +1,96. A két kritikus érték közé eső tartomány az elfogadási tartomány, míg a két kritikus értéktől extrémebb (kisebb vagy nagyobb érték) régió az elutasítási tartomány. Amennyiben igaz a nullhipotézis, a számított értékünknek is valahová a gyakori (valószínű) értékeket tartalmazó elfogadási régióba kellene esnie (azaz -1,96 és +1,96 közé). Mivel a mi értékünk jócskán az elutasítási régóba esik (mivel |7,74| > 1,96). Ezért azt mondjuk, hogy ha tényleg igaz lenne a nullhipotézis, akkor nagyon valószínűtlen, hogy a minta ilyen t-értéket produkálna, így inkább elvetjük a nullhipotézist. Ezért használjuk a kritikus érték szerinti döntési szabálynál az abszolútértéket is, mivel mindegy, hogy -1,96-nál kisebb, vagy +1,96-nál nagyobb értéket kapunk, mindkettő az elutasítási tartományba esik. A p-érték meghatározása kicsit nehezebb. A p-érték itt azt mutatja, hogy mi a valószínűsége annak, hogy ha igaz a nullhipotézis, akkor 7,74-et vagy 5

annál extrémebb értéket kapunk. Ez egy nagyon kicsi szám, gyakorlatilag zéró, ezért elutasítjuk a nullhipotézist. Az ábrán a piros régió területe pontosan 5%, míg a kék régió területe 95%. Ebből látható, hogy ha a teszt statisztikánk az elutasítási régióba esik, az automatikusan azt jelenti, hogy a p-érték is kisebb lesz, mint az adott szignifikancia szint. 1. ábra: A kefires példa grafikus ábrázolása

Test statistic= 7.7499

alfa = 0.05 = 5.00%

Elfogadási régió

Elutasítási régió

Elutasítási régió -1.96

-5

-4

-3

-2

1.96 -1

0

1

2

3

4

5

6

7

8

t-eloszlás 299 szabadságfokkal

A p-értéket érdemes hosszú távú valószínűségként felfogni. Például ha sokszor feldobunk egy érmét és azt feltételezzük, hogy az érme szabályos, akkor azt várjuk, hogy az esetek 50%ban fej (vagy írás) jön fel (ez lesz a nullhipotézisünk). Tehát ha például 100 dobást elvégzünk, akkor azt várjuk, hogy 50 fejet és 50 írást kapunk. Viszont ha a pénzérme dobálása során 90%-ban fejet kapunk, akkor feltételezhetjük, hogy az érme még sem szabályos. Ebben a specifikus példában a p-érték annak a valószínűsége, hogy 90 esetben fejet kapunk (ez az amit megfigyeltünk), egy olyan szabályos érmével, ahol valójában 50% a fejnek vagy írásnak az aránya (tehát ha a nullhipotézis tényleg igaz) (Kim – Bang, 2016). A 90 fejnek rendkívül kicsi lenne a valószínűsége egy szabályos érme esetén, így inkább elvetnénk a nullhipotézist (azaz, hogy szabályos az érme). A mi esetünkben: A kefir minta átlaga 3,23%, míg a feltételezett átlag 3,00%. A p-érték azt mutatja, hogy ha tényleg 3,00% lenne a minta átlag, akkor milyen valószínűséggel kapnánk ekkora különbséget a kettő között.

6

Két mintás független t-próba A két mintás független t-próba esetében két, egymástól független mintával dolgozunk. A két minta egymástól független, azaz, az egyik minta meghatározódása nem befolyásolja a másik mintáét. A gyakorlati példában arra kell gondolni, hogy azt, hogy Tunéziában hány évesen kezdik először használni az internetet, nem befolyásolja az, hogy Etiópiában mikor kezdik el ugyanezt a tevékenységet (vagy fordítva). A teszt nullhipotézise:

:   = *

Azaz, a nullhipotézis szerint az első minta és a második minta átlaga megegyezik egymással (nincs közöttük különbség). Az alternatív hipotézis: :   ≠ * A teszt elvégzése előtt meg kell vizsgálnunk, hogy a két minta szórásnégyzete (varianciája) megegyezik-e, mivel ez befolyásolhatja a végső eredményt. Ez a lépés csak a független két mintás t-próbára vonatkozik. 1) Kétmintás F-próba szórásnégyzetre (varianciára)

A két mintás F-próba azt vizsgálja, hogy a két minta varianciája megegyezik-e. A  szerint a

két minta varianciája megegyezik, míg a  szerint nem egyeznek meg. :  = * és :  ≠ *

Az F-próba ezt az egyezőséget kicsit máshogy teszteli, és azt vizsgálja, hogy a két minta varianciájának a hányadosa 1 körüli érték-e. +=

 =1 *

A két minta felcserélhető, mivel függetlenek. Ha 1-nél kisebb számot kapunk, akkor azt teszteljük, hogy 1-nél szignifikánsan kisebb-e az F-érték, míg ha 1-nél nagyobb értéket, akkor azt, hogy 1-nél szignifikánsan nagyobb-e az F-érték. Érdemes itt p-érték alapján dönteni, ahol a szokásos döntési szabály érvényesül. 7

2) A két mintás F-próba eredményétől függően használhatunk Független két mintás tpróbát azonos szórásnégyzet mellett: =

 − *

1 1 , - +   *

Az , paraméter egy úgynevezett súlyozott szórás („pooled”, ami az összevonást, súlyozást jelenti), ami abból fakad, hogy a két variancia között statisztikai értelemben nincs különbség.

, = /

(  − 1) + ( * − 1)*  +  * − 2

Ahogy a fentiekből látható, a súlyozott szórás a két variancia szabadságfokokkal és a minta elemszámokkal súlyozott kombinációja (gyökjel nélkül ez a súlyozott variancia lenne).. 3) Független két mintás t-próbát eltérő szórásnégyzet mellett: A nullhipotézis és az alternatív hipotézis megegyezik az előzőkkel, az egyetlen eltérés, hogy a szórásnégyzete között szignifikáns különbség van, ezért a nevezőben lévő standard hiba is változik. =

 − *   - + *  *

A döntési szabályok teljes mértékben megegyeznek az egy mintás t-próba esetén felírt döntési szabályokkal.

8

GYAKOLATI FELADAT A különböző országokban vizsgálja meg az Internetet először használók életkorát (2. feladat). Van-e szignifikáns különbség a nemzetek életkora között? Döntéseit 3%-os elsőfajú hiba mellett hozza meg. Az adatbázisunk úgy nevezett hosszú formátumban van (long format), ami azt jelenti, hogy az adott sor mindig jelzi, hogy a megfigyelés melyik kategóriába tartozik (például látni, hogy a 7. személy etiópiai és 22 éves).

A széles formátum (wide format), amire nekünk szükségünk van, pedig a „hagyományos” adattábla felépítés, ahol csak az oszlop fejcímkéje jelzi a kategóriát, és alatta halmozva vannak az adatok.

9

Ezt egyszerű átmásolással, több adat esetén szűréssel lehet megoldani. Az első lépés az Fpróba elvégzése. Adatok – Adatelemzés – Két mintás F-próba a szórásnégyzetre Az 1. és 2. változó tartomány az Etióp és a Tunézia oszlop, ahol kijelöljük a fejcímkét is. Bekattintjuk, hogy van feliratunk és beírjuk, hogy az alfa = 0,03. Kimeneti tartományt mindig úgy kérjük, hogy a táblázat lefelé terjeszkedik (tehát alatta legyen üres hely).

És az eredmény: A táblázat több adatot is közöl, de ami minket érdekel az az F-érték és a p-érték. Az F érték = 0,81, amely a két variancia hányadosa F = 6,95/8,56. Az ehhez tartozó p-érték 0,25. Azaz nem 10

tudjuk elutasítani, hogy a két minta szórásnégyzete megegyezik. Mehetünk tovább a két mintás t-próbával egyenlő szórásnégyzet mellet. Kétmintás F-próba a szórásnégyzetre Etiópia 21,43 6,95 44,00 43,00 0,81 0,25 0,56

Várható érték Variancia Megfigyelések df F P(F...


Similar Free PDFs