Nemparaméteres próbák alkalmazási köre

abc-accomplished-alphabet-48898.jpg

Tárgymutató

Általánosságban a nemparaméteres próbákról; alkalmazási feltételek; döntési folyamat; Wilcoxon-féle előjeles rangpróba; Mann-Whitney U-próba; Kruskal-Wallis próba; Friedman próba; futtatás: SPSS, R, Kézi számítások  

Market Analysis

Letölthető jegyzetek


StatOkos Jegyzet: Nemparaméteres próbák

StatOkos Jegyzet: Összefoglaló

Adatfájlok: SPSS

Adatfájlok: Excel 

Used Books

Ajánlott könyvek

Barna Ildikó – Székelyi Mária: Túlélőkészlet SPSS-hez
Andy Field: Discovering Statistics Using SPSS
Sajtos László – Mitev Ariel: SPSS kutatási és adatelemzési kézikönyv
 

A hipotézisvizsgálatok általános célja, hogy a populációból szerzett minták tulajdonságai között különbséget keressenek. Ezek az összehasonlítások alapvetően azt feltételezik, hogy a minták között nincs számottevő (szignifikáns) eltérés. Ezt a feltételezést nevezzük nullhipotézisnek (H0). A különbségek keresésére leggyakrabban a hipotézisvizsgálatok közé tartozó t-próbákat használjuk akkor, ha ismertek a populáció paraméterei, vagyis tudjuk, hogy a populációból vett minta követi a normál eloszlást. Azonban egyes esetekben a normalitás feltétele nem teljesül vagy csak egyszerűen megismerhetetlen a paraméter, ami a populációt jellemzi. Ilyen esetekben és ordinális mérési szintű változók esetén a nemparaméteres próbákat alkalmazzuk. A nemparaméteres próbák általánosan azt feltételezik, hogy a minták mediánjai (!) között nem találunk eltérést. A döntési kritérium ebben az esetben úgy fogalmazható meg, hogy a minták mediánjai megegyeznek vagy sem.  Amennyiben nincs számottevő eltérés közöttük, akkor a nullhipotézist megtartjuk, vagyis a mintánk nem tér el:

  • egy előre meghatározott mediántól (Wilcoxon-féle előjeles rangpróba),

  • két független csoport a mediánja nem  tér el egymástól (Mann-Whitney-féle U-próba)

  • egy elő- és utómérés mediánja nem különbözik (Wilcoxon-féle előjeles rangpróba)

  • több független csoport mediánja nem különbözik (Kruskal-Wallis próba)

  • vagy több, összefüggő mérés mediánja nem különbözik (Friedman próba)

 

Ellenkező esetben az eltérést feltételező ún. alternatív hipotézist (Ha) választjuk. A nemparaméteres próbák tehát folytonos (függő) változók mediánjait vagy ordinális mérési szintű változók mediánjait vizsgálják. Ez abból az összefüggésből ered, hogy a diszkrét (nominális) változóknak nincs sorba rendezhető értéke, amely a mediánszámítás alapja. Lehetséges, hogy a minta normalitása nem teljesül, így az egyes értékek rangsorolása biztosabb képet nyújt a populációról. A nemparaméteres próbák általános feltétele tehát, hogy a minták nem-normál eloszlásból származó folytonos változók vagy ordinális változók legyenek. A legtöbb statisztikai programban a kalkulációra kerülő p-érték alapján hozunk döntést. Ettől függetlenül mindkét értéket figyelembe vehetjük a számításaink során, ezek általában megegyező konklúziót mutatnak.

 

Amíg a t-próbákat általánosan paraméteres próbáknak is nevezzük azért, mert az előfeltételüknek minősülő normál eloszlás számos tulajdonságát ismerhetjük előre, addig egy nem-normál eloszlásnál már nehéz megmondani ezeket a paramétereket, hiszen számos variációjuk lehetséges. Abban az esetben, ha nincs előzetes információnk a populációból vett minta normalitását illetően, nekünk kell kideríteni, hogy megismerhető-e a paraméter. Ebben az esetben az eloszlások grafikus elemzése (hisztogram, Q-Q plot ábra) az egyik legfontosabb teendő, továbbá a normalitásvizsgálatok közé tartozó Saphiro-Wilk és/vagy Kolmogorov-Smirnov féle tesztek alkalmazhatók.

Abacus

Általában a nemparaméteres próbákról

A nemparaméteres próbákat azért alkalmazzuk, mert a populáció eloszlását jellemző paraméter nem követi:

 

  • a normál eloszlást (folytonos változók esetén),

  • binomiális eloszlást (dichotóm adatsorok esetén)

  • vagy a poisson eloszlást (egy adott esemény bekövetkezésének eloszlása egy eseménytérben)

 

 

 

A folytonos adatsorok esetében a normál eloszlás meglétét a normalitásvizsgálatok segítségével végezhetjük. Erre vonatkozóan számos különböző leírást találunk. Konklúzióként azt tudjuk elmondani, hogy az adatsorok tesztelését érdemes első sorban a Saphiro-Wilk féle normalitásvizsgálattal ellenőrízni. Mivel ezt a statisztikai eljárást a szerzők n=50 elemszám mellett végezték el, eddig a határig biztos eredményt ad. A magasabb elemszámokkal is megbírkózik, megerősítésképpen elvégezhetjük a Kolmogorov-Smirnov féle normalitásvizsgálatot is. Mindkét próba nullhipotézise, hogy a minta normál eloszlású populációból származik, ellenkező esetben (szignifikáns eltérés esetén) az eloszlás nem normál, ilyenkor érdemes a nemparaméteres próbákat használni. Fontos felhívni a figyelmet arra is, hogy ha nincs lehetőségünk vagy tudásunk elvégezni a normalitásvizsgálatot, akkor az eloszlás alakját illetően meggyőződhetünk a hisztogram és a Q-Q plot ábra alapján is. 

 

 

A legtöbb nemparaméteres próba rangosoroláson alapul, amelynek segítségével megpróbálják kiküszöbölni a paraméteres eloszlásoktól való eltérést, azonban nem minden nemparaméteres próba dolgozik ezzel a metódussal. A rangsorolás alapja, hogy az adatsorokat (34, 56, 56, 71, 12) növekvő sorrendbe helyezve (12, 34, 56, 56, 71) egyesével sorszámot kapnak (1, 2, 3, 4, 5). Ezek a sorszámok az azonos számok esetén is növekvők lesznek (1, 2, 3, 4, 5), azonban a sorszámozás végeztével az azonos sorszámúak között átlagot vonunk (1, 2, 3,5, 3,5, 5). Az így kapott rangsor alkalmassá válik a későbbi összehasonlításra. Fontos kiemelni, hogy csak akkor használjunk nemparaméteres próbát, amikor biztosak vagyunk benne, hogy a paraméteres próbák feltételeinek mindegyike vagy többszörös feltétel esetén nagyobb része sérül. A nemparametrikus eljárások a parametrikus eljárásokkal szemben kevésbé robosztusak, így bizonytalanság esetén javasolt inkább a paraméteres pár megfelelő használata. 

estimations.jpeg

A legtöbb információnk a paraméterről akkor van, ha az követi a normál eloszlás alakját és attól nem tér el számottevően (bal oldali eloszlás). Azonban számos esetben tapasztalhatjuk azt, hogy ez a feltétel nem teljesül (jobb oldali eloszlás). Ekkor nem tudunk biztosat mondani a paraméterről, leginkább azért, mert az eltérő eloszlások nagyon sok "formát ölthetnek". Más esetben pedig egyszerűen nincs lehetőségünk megismerni a populációt jellemző paramétert. 

nplots.gif
Cpk_exp_distribution.png

A Q-Q plot ábra normál eloszlás esetén (bal felső sarok) követi az ábra közepén lineárian növekvő egyenest. Minél inkább eltérő a pontok halmaza, annál biztosabb, hogy az adatsor nem követi a normál eloszlást.

A hisztogramra képzeletben rávetítve a normál eloszlásra jellemző haranggörbét (Gauss-görbe) megfigyelhetjük, hogy attól milyen eltérések mutatkoznak. A hisztogram "oszlopainak" illeszkednie kell a görbéhez. Ettől eltérő formák esetén nem teljesül a normalitás. 

Star Badge
 

Wilcoxon-féle rangpróba

A Wilcoxon-féle előjeles rangpróba célja, hogy megvizsgálja a rendelkezésre álló minták (minta) különbségét. Egyszerre használatos akkor, amikor egy előre meghatározott medián értékhez szeretnénk hasonlítani a mintánkat és akkor is, amikor egy csoporton végzünk két összefüggő mérést. Ezekben az esetekben a teszt azt vizsgálja, hogy a különbségek mediánja mennyire tér el a nullától. 

A próba feltétele, hogy a minta nem-normális eloszlású populációból származzon. A függő (vizsgált) változónak folytonosnak (metrikus skála) vagy ordinális mérési szintűnek kell lennie kell lennie. Diszkrét változók esetében a próba nem alkalmazható, hiszen ott mediánt nem tudunk meghatározni. 

 

Nullhipotézis: a populációk mediánja nem tér el nullától

Alternatív hipotézis: a populációátlag eltér nullától

 

Ha a próba eredménye szignifikáns, elvetjük a nullhipotézist és az alternatív hipotézist választjuk.  

 Hivatkozása: W(df - szabadságfok) = próba értéke, Z = z értéke, p = szignifikancia 

Abacus

módszerek a wilcoxon-féle rangpróba futtatására

Wilcoxon-féle előjeles rangpróba egy konstanshoz viszonyítva (SPSS)


Amennyiben a célunk egy nemparaméteres változó összevetése valamely külső értékkel, egymintás Wilcoxon-próbát alkalmazunk. Ilyen esetekben az adott változónak legalább ordinális mérési szintűnek kell lennie, ugyanis az átlag mellett a medián az az érték, melyet ilyen módon összehasonlíthatunk egy előre megadott, külső értékkel. Fontos tudni, hogy ez a próba az egymintás t-próba nemparaméteres párja, tehát nem csak ordinális változók esetén alkalmazhatjuk, hanem olyan metrikus változóknál is, melyek eloszlása nem felel meg a normál eloszlásnak. A külső érték rendszerint egy mediánérték, amelyet valamilyen korábbi kutatásból vagy más forrásból ismerünk.

Az egymintás Wilcoxon-próba futtatása és hivatkozása SPSS-ben Az egymintás Wilcoxon-próba megtalálható az Analyze>Nonparametric tests>One sample fül alatt. A „Fields” fül alatt válasszuk ki azt az ordinális változót, melyen az összehasonlítást szeretnénk elvégezni. A „Settings” fül alatt jelöljük ki a „Compare median to hypothesized (Wilcoxon signed-rank test)” és adjuk meg az általunk feltételezett mediánt a változó tekintetében. Az eredmények táblázatában látjuk a nullhipotézist, miszerint a kiválasztott változónk mediánja megegyezik az általunk megadottal. Ahol ez nem teljesül, ott elvethetjük ezt a nullhipotézist.




Wilcoxon-féle előjeles rangpróba páros mintán (SPSS)


Amennyiben két összefüggő mérést szeretnénk összehasonlítani egy csoporton és nem teljesül a normalitás feltétele, akkor páros mintás Wilcoxon-próbát kell alkalmaznunk. Ez a próba a páros mintás t-próba nemparaméteres párja. A páros mintás t-próbával azonos módon, kontroll-feltételes elrendezésben tudjuk alkalmazni vagyis egy elő- és utósztelés eredményeit hasonlíthatjuk össze. A próba feltétele, hogy olyan folytonos (metrikus) változókon vizsgálódjuk, ahol a normalitás nem teljesül vagy a változó ordinális mérési szintű legyen. A páros mintás Wilcoxon-próba egy mérési csoporton belül hasonlítja össze két változó mediánjainak különbségét. Ha a különbség közel áll a nullához, akkor megtartjuk a nullhipotézist, a mérések között nincs számottevő különbség. Szignifikáns eltérés esetén az alternatív hipotézist választjuk. A kalkulációhoz kérhetünk leíró statisztikát is, így arra is lehetőségünk nyílik, hogy kiderítsük, melyik változó esetében milyen irányba változnak a különbségek.

Próba futtatása SPSS-ben:

Keressük meg a próbát az Analyze > Nonparametric Tests > Legacy dialogs > 2 Related Samples menüpontban

A felugró ablakban kiválaszthatjuk az ordinális változó párokat, melyeket össze akarunk hasonlítani. Jelöljük ki a Wilcoxon lehetőséget! Options fül Az „Options” fül „Descriptive” lehetőségét is megadhatjuk, hogy lássuk, a mediánok értékét. Az eredmények között a „Test statistics” szignifikancia értékét megtekintve láthatjuk, hogy van-e különbség a mediánok között vagy sem. A nullhipotézis szerint nincs, ezért ha nem szignifikáns, a mediánok megegyeznek. Hivatkozása: W(df - szabadságfok) = próba értéke, Z = z értéke, p = szignifikancia




Wilcoxon-féle előjeles rangpróba (R)






 

Mann-whitney u próba

Abacus

A Mann-Whitney U próba célja, hogy két független populáció mintáját hasonlítsa össze. Ezek a minták ugyanannak a függő változónak két csoporton történt mérései. Ehhez mintákat kell vennünk, két független csoportból, melyeken ugyanazt a jelenséget mérjük. A kapott változó mediánjait vetjük össze, így lehet kifejezni, hogy a két független mérés eredményei között nulla (azaz nincs) a különbség.

A próba feltétele, hogy a minták nem-normális eloszlású populációból származzanak, emiatt a függő (vizsgált) változónak vagy folytonosnak (metrikus skála) vagy ordinális skálán mértnek kell lennie. Diszkrét változók és ordinális adatsorok esetében a próba nem alkalmazható, hiszen ott mediánokat nem tudunk meghatározni. Bár alkalmazási módja megfelel a kétmintás (független mintás) t-próbának, nem tekinthető annak nem paraméteres verziójának. 

Nullhipotézis: a populáció mediánjai egyenlők

Alternatív hipotézis: a populáció mediánjai eltérők

Ha a próba eredménye bármelyik kritérium szerint szignifikáns, elvetjük a nullhipotézist.  

 Hivatkozása: U(df - szabadságfok) = próba értéke, Z = z értéke, p = szignifikancia 

módszerek a mann-whitney u próba futtatására

Mann-Whitney próba (R)


A Mann-Whitney-próba a független mintás t-próba nemparaméteres párja. Ez azt jelenti, hogy a Mann-Whitney a független mintás t-próbával megegyező kutatási elrendezésben alkalmazható olyan változók esetén, melyek ordinális mérési szintűek, vagy metrikusak, de nem felelnek meg a normál eloszlásnak. Ekkor átlag helyett a csoportok mediánjai kerülnek összevetésre. A próba nullhipotézise szerint a két vizsgált csoport mediánjai nem különböznek jelentősen. Szignifikáns eredmény esetén statisztikailag jelentős eltérésről beszélhetünk.

Próba futtatása SPSS-ben:

A Mann-Whitney teszt megtalálható az Analyze>Nonparametric Tests>Legacy Dialogs>2 Independent Samples menüpontban. A felugró ablakban a „Test Variable List” felületre helyezzük a vizsgálni kívánt ordinális változót. A „Grouping variable” vagyis csoportosító változó lehetőségnél két független csoportot adjunk meg. Valamint az „Options” menüponban a „Descriptive” lehetőséget kiválasztva további információkhoz jutunk. A „Test Statistics” táblázatban vizsgáljuk meg a szignifikancia szintjét. A vizsgálat nullhipotézise szerint a mediánok között nincs különbség a független csoportokban. Ha szignifikáns, ez elvethető. A kapott eredményeknél a „Test Statistics” táblázatban tájékozódva tekinthetjük meg a szignifikancia szintjét. A próba nullhipotézise szerint a mediánok megegyeznek a független csoportokban. Amennyiben a próba szignifikáns, ezt a nullhipotézist elvetve feltételezhetjük, hogy a csoportok között van olyan, melynek mediánja eltérést mutat. Mann-Whitney próba hivatkozása: U(df - szabadságfok) = próba értéke, Z = z értéke, p = szignifikancia




Mann-Whitney próba (SPSS)


A Mann-Whitney U próba a független mintás t-próbával megegyező kutatási elrendezésben alkalmazható olyan változók esetén, melyek ordinális mérési szintűek, vagy metrikusak, de nem normál eloszlású populációból származnak. Ebben az esetben az átlag helyett a csoportok mediánjai kerülnek összehasonlításra. A próba nullhipotézise szerint a két vizsgált csoport mediánjai nem különböznek jelentősen egymástól, a nullhitpozésit megtartjuk. Szignifikáns különbség esetén statisztikailag jelentős eltérésről beszélhetünk, az alternatív hipotézist választjuk.

Próba futtatása SPSS-ben:

A Mann-Whitney teszt megtalálható az Analyze>Nonparametric Tests>Legacy Dialogs>2 Independent Samples menüpontban. A felugró ablakban a „Test Variable List” felületre helyezzük a vizsgálni kívánt ordinális változót. A „Grouping variable” vagyis csoportosító változó lehetőségnél két független csoportot adjunk meg. Valamint az „Options” menüponban a „Descriptive” lehetőséget kiválasztva további információkhoz jutunk. A „Test Statistics” táblázatban vizsgáljuk meg a szignifikancia szintjét. A vizsgálat nullhipotézise szerint a mediánok között nincs különbség a független csoportokban. Ha szignifikáns, ez elvethető. A kapott eredményeknél a „Test Statistics” táblázatban tájékozódva tekinthetjük meg a szignifikancia szintjét. A próba nullhipotézise szerint a mediánok megegyeznek a független csoportokban. Amennyiben a próba szignifikáns, ezt a nullhipotézist elvetve feltételezhetjük, hogy a csoportok között van olyan, melynek mediánja eltérést mutat. Mann-Whitney próba hivatkozása: U(df - szabadságfok) = próba értéke, Z = z értéke, p = szignifikancia





 

A Kruskal-Wallis próba célja, hogy három vagy több független populáció mintáját hasonlítsa össze. Ezek a minták ugyanannak a függő változónak több csoporton történt mérései. Ehhez mintákat kell vennünk, több független csoportból, melyeken ugyanazt a jelenséget mérjük. A kapott változó mediánjait vetjük össze, így lehet kifejezni, hogy a független mérések eredményei között nulla (azaz nincs) a különbség.

A próba feltétele, hogy a minták nem-normális eloszlású populációból származzanak, emiatt a függő (vizsgált) változónak vagy folytonosnak (metrikus skála) vagy ordinális skálán mértnek kell lennie. Diszkrét változók és ordinális adatsorok esetében a próba nem alkalmazható, hiszen ott mediánokat nem tudunk meghatározni. Bár alkalmazási módja megfelel a kétmintás (független mintás) t-próbának, nem tekinthető annak nem paraméteres verziójának. 

Nullhipotézis: a populáció mediánjai egyenlők

Alternatív hipotézis: a populáció mediánjai eltérők

Ha a próba eredménye bármelyik kritérium szerint szignifikáns, elvetjük a nullhipotézist.  

 Hivatkozása: U(df - szabadságfok) = próba értéke, Z = z értéke, p = szignifikancia 

KRUSKAL-WALLIS PRÓBA

Abacus

módszerek a kruskal-wallis próba futtatására

Friedman teszt (SPSS)


A Friedman teszt futtatása SPSS-ben:

A Friedman-próbát az Analyze>Nonparametric Test> Legacy dialogs> K Related Samples fül alatt találhatjuk meg.

A felugró ablakban válasszuk ki a tesztelni kívánt ordinális változóinkat, valamint a „Statistics” fül alatt jelöljük ki a „Descriptive” lehetőséget a további információkért. A kapott eredményeknél a „Test Statistics” táblázat a mérvadó, ahol a szignifikancia szintje mutatja meg, hogy van-e különbség a mediánok között. A szignifikáns különbség esetén elvethetjük a nullhipotézist, vagyis a mediánok nem egyeznek a csoportokban. A „Ranks” és „Descriptive Statistics” táblázatban megnézhetjük, a mediánok értékét is.

Tehát ebben az esetben nekünk kell felderíteni, hogy melyik érték "lóg ki a sorból".




Friedman teszt (R)






 

Friedman próba

A Friedman próba célja, hogy ugyanannak a populációnak három vagy több összetartozó mintáját hasonlítsa össze. Ezek az összetartozó minták általában ugyanazon az egyedeken mért többszöri vizsgálatok, vagy valamilyen módon összepárosítható adatok. Ehhez mintákat kell vennünk a populációból (háromnál többet időben egymást követőe) és az ott kapott értékek különbségének nullához kell közelítenie vagy pont nullának kell lennie. Így lehet kifejezni, hogy a páros mérés eredményei között nulla (azaz nincs) a különbség.

A próba feltétele, hogy a különbséget adó minta normális eloszlású populációból származzon, emiatt a függő (vizsgált) változónak folytonosnak (metrikus skála) kell lennie. Diszkrét változók és ordinális adatsorok esetében a próba nem alkalmazható, hiszen ott átlagértéket nem tudunk meghatározni. A gyakorlatban kivételt képeznek a Likert-skálák, amelyeket ordinális jellegük ellenére, metrikusnak tekintünk az elemzések során. 

Nullhipotézis: a populáció átlagainak a különbsége nulla

Alternatív hipotézis: a populáció átlagainak különbsége eltér nullától

Ha a próba eredménye bármelyik kritérium (t-érték, p-érték, konfidencia intervallum) szerint szignifikáns, elvetjük a nullhipotézist.  

 Hivatkozása: t(df: szabadságfok (n-1)) = t értéke, p = szignifikancia 

Abacus

módszerek a FRIEDMAN próba futtatására

Friedman teszt (SPSS)


A Friedman teszt futtatása SPSS-ben:

A Friedman-próbát az Analyze>Nonparametric Test> Legacy dialogs> K Related Samples fül alatt találhatjuk meg.

A felugró ablakban válasszuk ki a tesztelni kívánt ordinális változóinkat, valamint a „Statistics” fül alatt jelöljük ki a „Descriptive” lehetőséget a további információkért. A kapott eredményeknél a „Test Statistics” táblázat a mérvadó, ahol a szignifikancia szintje mutatja meg, hogy van-e különbség a mediánok között. A szignifikáns különbség esetén elvethetjük a nullhipotézist, vagyis a mediánok nem egyeznek a csoportokban. A „Ranks” és „Descriptive Statistics” táblázatban megnézhetjük, a mediánok értékét is.

Tehát ebben az esetben nekünk kell felderíteni, hogy melyik érték "lóg ki a sorból".




Friedman teszt (R)