T-próbák alkalmazási köre

abc-accomplished-alphabet-48898.jpg

Tárgymutató

Általánosságban a t-próbákról; alkalmazási feltételek; döntési folyamat; egymintás t-próba; páros t-próba; kétmintás t-próba; hivatkozás APA formátumban; futtatás: SPSS, R, Kézi számítások  

Market Analysis

Letölthető jegyzetek


StatOkos Jegyzet: t-próbák

StatOkos Jegyzet: Összefoglaló

Adatfájlok: SPSS

Adatfájlok: Excel 

Used Books

Ajánlott könyvek

Barna Ildikó – Székelyi Mária: Túlélőkészlet SPSS-hez
Andy Field: Discovering Statistics Using SPSS
Sajtos László – Mitev Ariel: SPSS kutatási és adatelemzési kézikönyv
 

A hipotézisvizsgálatok általános célja, hogy a populációból szerzett minták tulajdonságai között különbséget keressenek. Ezek az összehasonlítások alapvetően azt feltételezik, hogy a minták között nincs számottevő (szignifikáns) eltérés. Ezt a feltételezést nevezzük nullhipotézisnek (H0). A különbségek keresésére leggyakrabban a hipotézisvizsgálatok közé tartozó t-próbákat használjuk. A t-próbák általánosan azt feltételezik, hogy a minták átlagai (!) között nem találunk eltérést és a nevét jelző próbastatisztika értéke, azaz a "t-érték", követi a Student-féle t-eloszlást, annak egy megadott intervallumában van. A döntési kritérium ebben az esetben úgy fogalmazható meg, hogy a t-eloszlás egy előre meghatározott intervallumába a saját eredményünk beletartozik-e vagy sem.  Amennyiben ebben az intervallumban megtaláljuk a saját értékünket, akkor a nullhipotézist megtartjuk, vagyis a mintánk nem tér el:

  • egy előre meghatározott értéktől (egymintás t-próba),

  • egymástól (kétmintás t-próba)

  • vagy egy elő- és utómérés átlaga nem különbözik (páros t-próba)

 

Ellenkező esetben az eltérést feltételező ún. alternatív hipotézist (Ha) választjuk. A t-próbák (mivel követik a Student-féle t-eloszlást) folytonos (függő) változók átlagait vizsgálják. Ez abból az összefüggésből ered, hogy a diszkrét változóknak nem lehet haranggörbe alakú eloszlásuk és átlaguk. A t-próbák általános feltétele tehát, hogy a minták normál eloszlásból származó folytonos változók legyenek. A legtöbb statisztikai program esetében nem a t-érték, hanem a vele párhuzamosan kalkulációra kerülő p-érték alapján hozunk döntést. Ettől függetlenül mindkét értéket figyelembe vehetjük a számításaink során, ezek általában megegyező konklúziót mutatnak.

 

A t-próbákat általánosan paraméteres próbáknak is nevezzük azért, mert az előfeltételüknek minősülő normál eloszlás számos tulajdonságát ismerhetjük előre, azonban egy nem-normál eloszlásnál már nehéz megmondani ezeket a paramétereket, hiszen számos variációjuk lehetséges. Fontos tudni, hogy a t-próbák igencsak robosztusak (erősen megbízhatóak), így ha a feltételek közül az egyik sérül, még lehet őket használni biztonsággal. Több feltétel sérülése esetén vagy ordinális adatsoroknál, a nemparaméteres próbákat alkalmazzuk. 

Abacus

Általában a t-próbákról

A hipotézisvizsgálatok kézi számításakor általában "t-értéket" határozunk meg, míg a számítógépes programok általában megadják a p értéket is. Mindkét érték meghatározása egy α (alfa) szintű hibahatárhoz képest történik. Ez az érték a legtöbb kutatásban 0.05-ös alfa érték, de találhatunk szigorúbb feltételű, 0.01-es alfa értékkel számoló kutatásokat is. A p-érték szignifikanciáját tehát ehhez mérten igazítjuk. Amennyiben ennél az alfa értéknél kisebb a mi p-értékünk, akkor elvetjük az egyezést feltételező nullhipotézist és elfogadjuk a különbséget feltételező alternatív hipotézist.

[p<0.05/0.01] vagy [|t|> a meghatározott alfa és szabadságfok melletti t-érték] = a próba eredménye szignifikáns különbséget jelez (Elvetjük a nullhipotézist (H0) és az alternatív hipotézist (Ha) használjuk)


[p>=0.05/0.01] vagy [|t| < a meghatározott alfa és szabadságfok melletti t-érték] = a próba eredménye nem jelez szignifikáns eltérést (Megtartjuk a nullhipotézist (H0))

 

 

A t-próbák t értékének a vizsgálata azonban ettől némileg eltérő, annak ellenére, hogy a p-érték alapján döntünk általában. A t-érték azt határozza meg, hogy a próbastatisztikánk számítása során kapott eredmény beletartozik-e a Student-féle t-eloszlás előre meghatározott intervallumába (általában szintén 0.05-ös alfa szinten jelzett érték intervallumába, a, kép). Ha igen, akkor megtartjuk az egyezést feltételező nullhipotézist, ha nem, akkor elvetjük azt. Ne zavarjon meg senkit, hogy a t-próbák előfeltétele a normál eloszlás és a döntést pedig a t-érték Student-féle eloszlásához viszonyítjuk! Az egyik (normál eloszlás) előfeltétel, míg a másik (Student-féle t-eloszlás) egy döntési kritériumhoz kapcsolódik (b, kép)! A t-érték és a p-érték eredményei azonos konklúziót mutatnak!

tpdftb.gif

a, A Student-féle t-eloszlás által meghatározott t érték intevallumán belül megtartjuk a nullhipotézist. Mivel a t lehet mínusz és pozitív érték is, így a t abszolút értékénél kisebb számokat soroljuk ebbe az intervallumba.

Hasonlóképpen dönthetünk konfidenciaintervallum alapján is, ahol általánosan 95%-os konfidenciaintervallumot (CI) használunk. Itt szintén azt keressük, hogy az általunk kapott átlag vajon 95%-os bizonyossággal bele esik-e ebbe az intervallumba. Mindegyik esetben a mintánk átlagát vizsgáljuk (X¯), és következtetünk belőle a populáció (vélhetően) valós átlagára (μ). Miért használunk 0.05-ös értéket (t és p esetén) és 95%-os konfidenciaintervallumot? Azért, mert ezt az elméleti (valójában 5%-os) értéket határozzuk meg arra vonatkozóan, hogy a véletlen szignifikáns különbséget okozott volna a mi esetünkben. Vagyis 95%-ban biztosak lehetünk abban, hogy nem a véletlen által kaptunk az eredményünket.

 

Arra is figyelnünk kell, hogy az elfogadási tartományt egyoldalas vagy két oldalas tesztek esetében különbözőképpen értelmezzük. Ugyanis amíg az egyoldalas próbák alfa értékét valamelyik oldal (pozitív vagy negatív eltérés) egyik végének teljes szakaszára értelmezzük (c, kép) , addig a kétoldalas próbák alfa értéke a két végponton, mind a negatív és pozitív tartományban összesen adja ki az alfa értékét (d, kép)!  

Legyünk tisztában azzal is, hogy egy mérésből vagy egy mintavételből nem tudunk teljes bizonyossággal bármit is állítani a teljes populációnkról, így azt a kellő odafigyeléssel és kritikai szemlélettel kezeljük!

example2-1.gif

b, t-próba próbastatisztikájának értékei. Először meg kell határoznunk a próbának megfelelő szabadságfokot (df - amit az elemszámból számítunk), valamint a megfelelő szignifikancia értéket. A kettő mátrixa megmutatja, hogy a megfelelő elemszám és szignifikancia szint mellett, milyen t-érték (pozitív és negatív) intervallumban fogadhatjuk el a saját eredményünket.

Standard Normal Distribution upper tail.

elfogadási tartomány

c, egyoldalas próba elfogadási tartománya

Standard Normal Distribution both tails.

elfogadási tartomány

d, kétoldalas próba elfogadási tartománya

Star Badge
 

Az egymintás t-próba célja, hogy a populáció átlagát hasonlítsa egy előre megadott értékhez viszonyítva. Ehhez mintát kell vennünk a populációból és az ott kapott értéket kell összehasonlítani egy standard, korábban már meghatározott átlagértékkel. Ez lehet például egy meglévő teszt korábban mért átlagértékének és a saját mérésünk átlagának az összehasonlítása.

A próba feltétele, hogy a minta normális eloszlású populációból származzon, emiatt a függő (vizsgált) változónak folytonosnak (metrikus skála) kell lennie. Diszkrét változók és ordinális adatsorok esetében a próba nem alkalmazható, hiszen ott átlagértéket nem tudunk meghatározni. A gyakorlatban kivételt képeznek a Likert-skálák, amelyeket ordinális jellegük ellenére, metrikusnak tekintünk az elemzések során. 

 

Nullhipotézis: a populációátlag nem tér el az adott értéktől (konstans), azzal megegyezik

Alternatív hipotézis: a populációátlag eltér az adott értéktől (konstans)

 

Ha a próba eredménye bármelyik kritérium (t-érték, p-érték, konfidencia intervallum) szerint szignifikáns, elvetjük a nullhipotézist.  

 Hivatkozása: t(df: szabadságfok (n-1)) = t értéke, p = szignifikancia 

Abacus

Egymintás t-próba

Az egymintás t-próba kétoldalas, paraméteres próba. Mivel az egymintás t-próba kézi számítása is átlagokkal és szórásokkal dolgozik, nem használhatjuk nem-folytonos, tehát nominális és ordinális változók esetében. Annak a megállapítására, hogy az általunk kapott átlag beletartozik-e az elfogadási tartományba, három különböző mód lehetséges:

  • konfidencia intervallum alapján

  • t-érték alapján

  • p-érték alapján

Ezek egyenértékűek, a különbségek megállapítására egyformán alkalmasak. Ha konfidencia intervallum alapján akarunk dönteni, akkor meg kell határozni a mintánk alapján azt az elfogadási tartományt, amelyben még elfogadjuk a konstans (c), vagyis a már meglévő, standard adatunk értékét. A t-érték próba statisztikájával hasonlóképpen egy elfogadási intervallumot adunk meg, majd a képlettel meghatározott értéket megvizsgálva eldöntjük, hogy az adott intervallumba beletartozik-e az érték vagy sem. A p-érték alapján történő döntés pedig megmutatja, hogy mekkora a valószínűsége annak, hogy a kapott eltérést a véletlen okozza. Egy 0.05-ös p-érték esetében ez pontosan 5%-ot jelent. A kézi számítások leírásában bővebben foglalkozunk ennek meghatározásával.

Star Badge
one-sample-normal.gif

Az egymintás t-próba során azt próbáljuk meghatározni, hogy a populáció átlagot jelentő érték (μ) mennyire tér el a konstans értéktől (c). A populációátlagra a mintánkból következtethetünk, a konstans pedig egy, már előre meghatározott érték, eredmény. Számos esetben használható, kutatási célokra leginkább a saját eredményeink, egy "gold standardhoz" való viszonyítása a leggyakoribb alkalmazási mód.

Hipotézisek:

H0: c=μ (azaz nincs eltérés a konstans és az átlag között)

Ha: c≠μ (azaz van eltérés a konstans és az átlag között)

módszerek az egymintás t-próba futtatására

 

A páros mintás t-próba célja, hogy ugyanannak a populációnak két összetartozó mintáját hasonlítsa össze. Ezek az összetartozó minták általában ugyanazon az egyedeken mért elő és- utóvizsgálat, vagy valamilyen módon összepárosítható adatok lesznek. Ehhez mintákat kell vennünk a populációból (két darabot) és az ott kapott értékek különbségének nullához kell közelítenie vagy pont nullának kell lennie. Így lehet kifejezni, hogy a páros mérés eredményei között nulla (azaz nincs) a különbség.

A próba feltétele, hogy a különbséget adó minta normális eloszlású populációból származzon, emiatt a függő (vizsgált) változónak folytonosnak (metrikus skála) kell lennie. Diszkrét változók és ordinális adatsorok esetében a próba nem alkalmazható, hiszen ott átlagértéket nem tudunk meghatározni. A gyakorlatban kivételt képeznek a Likert-skálák, amelyeket ordinális jellegük ellenére, metrikusnak tekintünk az elemzések során. 

Nullhipotézis: a populáció átlagainak a különbsége nulla

Alternatív hipotézis: a populáció átlagainak különbsége eltér nullától

Ha a próba eredménye bármelyik kritérium (t-érték, p-érték, konfidencia intervallum) szerint szignifikáns, elvetjük a nullhipotézist.  

 Hivatkozása: t(df: szabadságfok (n-1)) = t értéke, p = szignifikancia 

páros mintás t-próba

Abacus

Az páros mintás t-próba kétoldalas, paraméteres próba. Mivel a páros mintás t-próba kézi számítása is átlagokkal és szórásokkal dolgozik, nem használhatjuk nem-folytonos, tehát nominális és ordinális változók esetében. Annak a megállapítására, hogy az általunk kapott átlag beletartozik-e az elfogadási tartományba, három különböző mód lehetséges:

  • konfidencia intervallum alapján

  • t-érték alapján

  • p-érték alapján

Ezek egyenértékűek, a különbségek megállapítására egyformán alkalmasak. Ha konfidencia intervallum alapján akarunk dönteni, akkor meg kell határozni a minták átlagainak különbsége alapján azt az elfogadási tartományt, amelybe még beletartozhat a nulla (0), vagyis az átlagok különbsége még nem tér el számottevően attól. A t-érték próba statisztikájával hasonlóképpen egy elfogadási intervallumot adunk meg, majd a képlettel meghatározott értéket megvizsgálva eldöntjük, hogy az adott intervallumba beletartozik-e a saját értékünk vagy sem. A p-érték alapján történő döntés pedig megmutatja, hogy mekkora a valószínűsége annak, hogy a kapott eltérést a véletlen okozza. Egy 0.05-ös p-érték esetében ez pontosan 5%-ot jelent. A kézi számítások leírásában bővebben foglalkozunk ennek meghatározásával.

Star Badge

módszerek a páros mintás t-próba futtatására

 

A kétmintás (vagy független mintás) t-próba célja, hogy két független populáció mintáját hasonlítsa össze. Ezek a minták ugyanannak a függő változónak két csoporton történt mérései. Ehhez mintákat kell vennünk, két független csoportból, melyeken ugyanazt a jelenséget mérjük. A kapott változó átlagait vetjük össze, így lehet kifejezni, hogy a két független mérés eredményei között nulla (azaz nincs) a különbség.

A próba feltétele, hogy a minták normális eloszlású populációból származzanak, emiatt a függő (vizsgált) változónak folytonosnak (metrikus skála) kell lennie. Diszkrét változók és ordinális adatsorok esetében a próba nem alkalmazható, hiszen ott átlagértéket nem tudunk meghatározni. A gyakorlatban kivételt képeznek a Likert-skálák, amelyeket ordinális jellegük ellenére, metrikusnak tekintünk az elemzések során. További feltétel, hogy a minták varianciája megegyezzen! Ennek összehasonlítását F-próbával végezzük. Amennyiben a varianciák megegyeznek és minták normális eloszlást mutatnak, a kétmintás t-próba klasszikus formáját használjuk. Eltérő varianciák esetében vagy ha nincs ismeretünk a varianciákról, akkor az ún. Welch-féle kétmintás t-próbát kell alkalmazni.

Nullhipotézis: a populáció átlagai egyenlők (μ1=μ2)

Alternatív hipotézis: a populáció átlagai eltérők (μ1/=μ2)

Ha a próba eredménye bármelyik kritérium (t-érték, p-érték, konfidencia intervallum) szerint szignifikáns, elvetjük a nullhipotézist.  

 Hivatkozása: t(df: szabadságfok (n-1)) = t értéke, p = szignifikancia 

Kétmintás t-próba

Abacus

A kétmintás t-próba kétoldalas, paraméteres próba. Mivel a kétmintás t-próba kézi számítása is átlagokkal és szórásokkal dolgozik, nem használhatjuk nem folytonos, tehát nominális és ordinális változók esetében. Annak a megállapítására, hogy az általunk kapott átlag beletartozik-e az elfogadási tartományba, három különböző mód lehetséges:

  • konfidencia intervallum alapján

  • t-érték alapján

  • p-érték alapján

Ezek egyenértékűek, a különbségek megállapítására egyformán alkalmasak. Ha konfidencia intervallum alapján akarunk dönteni, akkor meg kell határozni a minták átlagai alapján azt az elfogadási tartományt, amelybe még beletartozhat mindkét átlag. A t-érték próba statisztikájával hasonlóképpen egy elfogadási intervallumot adunk meg, majd a képlettel meghatározott értéket megvizsgálva eldöntjük, hogy az adott intervallumba beletartozik-e a saját értékünk vagy sem. A p-érték alapján történő döntés pedig megmutatja, hogy mekkora a valószínűsége annak, hogy a kapott eltérést a véletlen okozza. Egy 0.05-ös p-érték esetében ez pontosan 5%-ot jelent. A kézi számítások leírásában bővebben foglalkozunk ennek meghatározásával.

A kétmintás t-próba esetében fontos kérdés a varianciák egyezősége vagy különbözősége. Azért fontos tudnunk, hogy a varianciák milyenek a két mintában, mert a középértéktől való eltérés (jelen esetben az átlagtól való eltérés) másképp is alakulhat annak ellenére, hogy az átlagok megegyeznek (a, kép)! 

Star Badge
random35.gif

a, Figyeljük meg, hogy mi történne akkor, ha a kétmintás t-próbával csak az átlagok egyezőségéről döntenénk! Azt mondanánk, hogy a két minta megegyezik, holott a szórásokból meghatározott variancia rámutat a minták különbözőségére. 

A varianciák egyezésének megállapítása az F-próba segítségével történik, amelyet bemutatunk a kézi számítás részben. Ha az F-próba segítségével azt állapítjuk meg, hogy a varianciák egyeznek, akkor a klasszikus kétmintás t-próbát alkalmazzuk, amelynek szabadságfogka gyorsan meghatározható a két csoport elemszámainak összegéből és abból kivonva kettőt (n+m-2 képlettel). Amennyiben eltérő varianciákat tapasztalunk az F-próba alapján a Welch-féle módszert kell alkalmaznunk, amely a varianciák ismeretének vagy eltérésének hiányában is megbízható becslést ad a mintán keresztül a populációra. A Welch-féle t-próba szabdságfoka egy képlettel határozható meg, amelyet szintén bemutatunk a kéziszámolással foglalkozó részben. A statisztikai programok is elkülönítik a két számítási módot. Abban az esetben, ha a normalitás sem teljesül, használjuk a Mann-Whitney féle nemparaméteres próbát!

módszerek a kétmintás t-próba futtatására