Nemparaméteres próbák alkalmazási köre

abc-accomplished-alphabet-48898.jpg

Tárgymutató

Általánosságban a nemparaméteres próbákról; alkalmazási feltételek; döntési folyamat; Wilcoxon-féle előjeles rangpróba; Mann-Whitney U-próba; Kruskal-Wallis próba; Friedman próba; futtatás: SPSS, R, Kézi számítások  

Market Analysis

Letölthető jegyzetek


StatOkos Jegyzet: Nemparaméteres próbák

StatOkos Jegyzet: Összefoglaló

Adatfájlok: SPSS

Adatfájlok: Excel 

Used Books

Ajánlott könyvek

Barna Ildikó – Székelyi Mária: Túlélőkészlet SPSS-hez
Andy Field: Discovering Statistics Using SPSS
Sajtos László – Mitev Ariel: SPSS kutatási és adatelemzési kézikönyv
 

A hipotézisvizsgálatok általános célja, hogy a populációból szerzett minták tulajdonságai között különbséget keressenek. Ezek az összehasonlítások alapvetően azt feltételezik, hogy a minták között nincs számottevő (szignifikáns) eltérés. Ezt a feltételezést nevezzük nullhipotézisnek (H0). A különbségek keresésére leggyakrabban a hipotézisvizsgálatok közé tartozó t-próbákat használjuk akkor, ha ismertek a populáció paraméterei, vagyis tudjuk, hogy a populációból vett minta követi a normál eloszlást. Azonban egyes esetekben a normalitás feltétele nem teljesül vagy csak egyszerűen megismerhetetlen a paraméter, ami a populációt jellemzi. Ilyen esetekben és ordinális mérési szintű változók esetén a nemparaméteres próbákat alkalmazzuk. A nemparaméteres próbák általánosan azt feltételezik, hogy a minták mediánjai (!) között nem találunk eltérést. A döntési kritérium ebben az esetben úgy fogalmazható meg, hogy a minták mediánjai megegyeznek vagy sem.  Amennyiben nincs számottevő eltérés közöttük, akkor a nullhipotézist megtartjuk, vagyis a mintánk nem tér el:

  • egy előre meghatározott mediántól (Wilcoxon-féle előjeles rangpróba),

  • két független csoport a mediánja nem  tér el egymástól (Mann-Whitney-féle U-próba)

  • egy elő- és utómérés mediánja nem különbözik (Wilcoxon-féle előjeles rangpróba)

  • több független csoport mediánja nem különbözik (Kruskal-Wallis próba)

  • vagy több, összefüggő mérés mediánja nem különbözik (Friedman próba)

 

Ellenkező esetben az eltérést feltételező ún. alternatív hipotézist (Ha) választjuk. A nemparaméteres próbák tehát folytonos (függő) változók mediánjait vagy ordinális mérési szintű változók mediánjait vizsgálják. Ez abból az összefüggésből ered, hogy a diszkrét (nominális) változóknak nincs sorba rendezhető értéke, amely a mediánszámítás alapja. Lehetséges, hogy a minta normalitása nem teljesül, így az egyes értékek rangsorolása biztosabb képet nyújt a populációról. A nemparaméteres próbák általános feltétele tehát, hogy a minták nem-normál eloszlásból származó folytonos változók vagy ordinális változók legyenek. A legtöbb statisztikai programban a kalkulációra kerülő p-érték alapján hozunk döntést. Ettől függetlenül mindkét értéket figyelembe vehetjük a számításaink során, ezek általában megegyező konklúziót mutatnak.

 

Amíg a t-próbákat általánosan paraméteres próbáknak is nevezzük azért, mert az előfeltételüknek minősülő normál eloszlás számos tulajdonságát ismerhetjük előre, addig egy nem-normál eloszlásnál már nehéz megmondani ezeket a paramétereket, hiszen számos variációjuk lehetséges. Abban az esetben, ha nincs előzetes információnk a populációból vett minta normalitását illetően, nekünk kell kideríteni, hogy megismerhető-e a paraméter. Ebben az esetben az eloszlások grafikus elemzése (hisztogram, Q-Q plot ábra) az egyik legfontosabb teendő, továbbá a normalitásvizsgálatok közé tartozó Saphiro-Wilk és/vagy Kolmogorov-Smirnov féle tesztek alkalmazhatók.

Abacus

Általában a nemparaméteres próbákról

A nemparaméteres próbákat azért alkalmazzuk, mert a populáció eloszlását jellemző paraméter nem követi:

 

  • a normál eloszlást (folytonos változók esetén),

  • binomiális eloszlást (dichotóm adatsorok esetén)

  • vagy a poisson eloszlást (egy adott esemény bekövetkezésének eloszlása egy eseménytérben)

 

 

 

A folytonos adatsorok esetében a normál eloszlás meglétét a normalitásvizsgálatok segítségével végezhetjük. Erre vonatkozóan számos különböző leírást találunk. Konklúzióként azt tudjuk elmondani, hogy az adatsorok tesztelését érdemes első sorban a Saphiro-Wilk féle normalitásvizsgálattal ellenőrízni. Mivel ezt a statisztikai eljárást a szerzők n=50 elemszám mellett végezték el, eddig a határig biztos eredményt ad. A magasabb elemszámokkal is megbírkózik, megerősítésképpen elvégezhetjük a Kolmogorov-Smirnov féle normalitásvizsgálatot is. Mindkét próba nullhipotézise, hogy a minta normál eloszlású populációból származik, ellenkező esetben (szignifikáns eltérés esetén) az eloszlás nem normál, ilyenkor érdemes a nemparaméteres próbákat használni. Fontos felhívni a figyelmet arra is, hogy ha nincs lehetőségünk vagy tudásunk elvégezni a normalitásvizsgálatot, akkor az eloszlás alakját illetően meggyőződhetünk a hisztogram és a Q-Q plot ábra alapján is. 

 

 

A legtöbb nemparaméteres próba rangosoroláson alapul, amelynek segítségével megpróbálják kiküszöbölni a paraméteres eloszlásoktól való eltérést, azonban nem minden nemparaméteres próba dolgozik ezzel a metódussal. A rangsorolás alapja, hogy az adatsorokat (34, 56, 56, 71, 12) növekvő sorrendbe helyezve (12, 34, 56, 56, 71) egyesével sorszámot kapnak (1, 2, 3, 4, 5). Ezek a sorszámok az azonos számok esetén is növekvők lesznek (1, 2, 3, 4, 5), azonban a sorszámozás végeztével az azonos sorszámúak között átlagot vonunk (1, 2, 3,5, 3,5, 5). Az így kapott rangsor alkalmassá válik a későbbi összehasonlításra. Fontos kiemelni, hogy csak akkor használjunk nemparaméteres próbát, amikor biztosak vagyunk benne, hogy a paraméteres próbák feltételeinek mindegyike vagy többszörös feltétel esetén nagyobb része sérül. A nemparametrikus eljárások a parametrikus eljárásokkal szemben kevésbé robosztusak, így bizonytalanság esetén javasolt inkább a paraméteres pár megfelelő használata. 

estimations.jpeg

A legtöbb információnk a paraméterről akkor van, ha az követi a normál eloszlás alakját és attól nem tér el számottevően (bal oldali eloszlás). Azonban számos esetben tapasztalhatjuk azt, hogy ez a feltétel nem teljesül (jobb oldali eloszlás). Ekkor nem tudunk biztosat mondani a paraméterről, leginkább azért, mert az eltérő eloszlások nagyon sok "formát ölthetnek". Más esetben pedig egyszerűen nincs lehetőségünk megismerni a populációt jellemző paramétert. 

nplots.gif
Cpk_exp_distribution.png

A Q-Q plot ábra normál eloszlás esetén (bal felső sarok) követi az ábra közepén lineárian növekvő egyenest. Minél inkább eltérő a pontok halmaza, annál biztosabb, hogy az adatsor nem követi a normál eloszlást.

A hisztogramra képzeletben rávetítve a normál eloszlásra jellemző haranggörbét (Gauss-görbe) megfigyelhetjük, hogy attól milyen eltérések mutatkoznak. A hisztogram "oszlopainak" illeszkednie kell a görbéhez. Ettől eltérő formák esetén nem teljesül a normalitás. 

Star Badge
 

Wilcoxon-féle rangpróba

A Wilcoxon-féle előjeles rangpróba célja, hogy megvizsgálja a rendelkezésre álló minták (minta) különbségét. Egyszerre használatos akkor, amikor egy előre meghatározott medián értékhez szeretnénk hasonlítani a mintánkat és akkor is, amikor egy csoporton végzünk két összefüggő mérést. Ezekben az esetekben a teszt azt vizsgálja, hogy a különbségek mediánja mennyire tér el a nullától. 

A próba feltétele, hogy a minta nem-normális eloszlású populációból származzon. A függő (vizsgált) változónak folytonosnak (metrikus skála) vagy ordinális mérési szintűnek kell lennie kell lennie. Diszkrét változók esetében a próba nem alkalmazható, hiszen ott mediánt nem tudunk meghatározni. 

 

Nullhipotézis: a populációk mediánja nem tér el nullától

Alternatív hipotézis: a populációátlag eltér nullától

 

Ha a próba eredménye szignifikáns, elvetjük a nullhipotézist és az alternatív hipotézist választjuk.  

 Hivatkozása: W(df - szabadságfok) = próba értéke, Z = z értéke, p = szignifikancia 

Abacus

módszerek a wilcoxon-féle rangpróba futtatására

Wilcoxon-féle előjeles rangpróba egy konstanshoz viszonyítva (SPSS)


Amennyiben a célunk egy nemparaméteres változó összevetése valamely külső értékkel, egymintás Wilcoxon-próbát alkalmazunk. Ilyen esetekben az adott változónak legalább ordinális mérési szintűnek kell lennie, ugyanis az átlag mellett a medián az az érték, melyet ilyen módon összehasonlíthatunk egy előre megadott, külső értékkel. Fontos tudni, hogy ez a próba az egymintás t-próba nemparaméteres párja, tehát nem csak ordinális változók esetén alkalmazhatjuk, hanem olyan metrikus változóknál is, melyek eloszlása nem felel meg a normál eloszlásnak. A külső érték rendszerint egy mediánérték, amelyet valamilyen korábbi kutatásból vagy más forrásból ismerünk.

Az egymintás Wilcoxon-próba futtatása és hivatkozása SPSS-ben Az egymintás Wilcoxon-próba megtalálható az Analyze>Nonparametric tests>One sample fül alatt. A „Fields” fül alatt válasszuk ki azt az ordinális változót, melyen az összehasonlítást szeretnénk elvégezni. A „Settings” fül alatt jelöljük ki a „Compare median to hypothesized (Wilcoxon signed-rank test)” és adjuk meg az általunk feltételezett mediánt a változó tekintetében. Az eredmények táblázatában látjuk a nullhipotézist, miszerint a kiválasztott változónk mediánja megegyezik az általunk megadottal. Ahol ez nem teljesül, ott elvethetjük ezt a nullhipotézist.




Wilcoxon-féle előjeles rangpróba páros mintán (SPSS)


Amennyiben két összefüggő mérést szeretnénk összehasonlítani egy csoporton és nem teljesül a normalitás feltétele, akkor páros mintás Wilcoxon-próbát kell alkalmaznunk. Ez a próba a páros mintás t-próba nemparaméteres párja. A páros mintás t-próbával azonos módon, kontroll-feltételes elrendezésben tudjuk alkalmazni vagyis egy elő- és utósztelés eredményeit hasonlíthatjuk össze. A próba feltétele, hogy olyan folytonos (metrikus) változókon vizsgálódjuk, ahol a normalitás nem teljesül vagy a változó ordinális mérési szintű legyen. A páros mintás Wilcoxon-próba egy mérési csoporton belül hasonlítja össze két változó mediánjainak különbségét. Ha a különbség közel áll a nullához, akkor megtartjuk a nullhipotézist, a mérések között nincs számottevő különbség. Szignifikáns eltérés esetén az alternatív hipotézist választjuk. A kalkulációhoz kérhetünk leíró statisztikát is, így arra is lehetőségünk nyílik, hogy kiderítsük, melyik változó esetében milyen irányba változnak a különbségek.

Próba futtatása SPSS-ben:

Keressük meg a próbát az Analyze > Nonparametric Tests > Legacy dialogs > 2 Related Samples menüpontban

A felugró ablakban kiválaszthatjuk az ordinális változó párokat, melyeket össze akarunk hasonlítani. Jelöljük ki a Wilcoxon lehetőséget! Options fül Az „Options” fül „Descriptive” lehetőségét is megadhatjuk, hogy lássuk, a mediánok értékét. Az eredmények között a „Test statistics” szignifikancia értékét megtekintve láthatjuk, hogy van-e különbség a mediánok között vagy sem. A nullhipotézis szerint nincs, ezért ha nem szignifikáns, a mediánok megegyeznek. Hivatkozása: W(df - szabadságfok) = próba értéke, Z = z értéke, p = szignifikancia




Wilcoxon-féle előjeles rangpróba (R)






 

Mann-whitney u próba

Abacus

A Mann-Whitney U próba célja, hogy két független populáció mintáját hasonlítsa össze. Ezek a minták ugyanannak a függő változónak két csoporton történt mérései. Ehhez mintákat kell vennünk, két független csoportból, melyeken ugyanazt a jelenséget mérjük. A kapott változó mediánjait vetjük össze, így lehet kifejezni, hogy a két független mérés eredményei között nulla (azaz nincs) a különbség.

A próba feltétele, hogy a minták nem-normális eloszlású populációból származzanak, emiatt a függő (vizsgált) változónak vagy folytonosnak (metrikus skála) vagy ordinális skálán mértnek kell lennie. Diszkrét változók és ordinális adatsorok esetében a próba nem alkalmazható, hiszen ott mediánokat nem tudunk meghatározni. Bár alkalmazási módja megfelel a kétmintás (független mintás) t-próbának, nem tekinthető annak nem paraméteres verziójának. 

Nullhipotézis: a populáció mediánjai egyenlők

Alternatív hipotézis: a populáció mediánjai eltérők

Ha a próba eredménye bármelyik kritérium szerint szignifikáns, elvetjük a nullhipotézist.  

 Hivatkozása: U(df - szabadságfok) = próba értéke, Z = z értéke, p = szignifikancia 

módszerek a mann-whitney u próba futtatására

How long will it take to receive my order?


Orders will be dispatched within 5 working days of the order being made. Please allow 2-3 days for delivery within Japan and 7-14 days for international deliveries.




Can I return my order if I am not satisfied?


Yes. Please see our Shipping and Returns page for more details.




Are your items waterproof?


All items are coated with a non-toxic resin that is durable and waterproof.




Will you make bespoke orders?


Yes, we are happy to make bespoke orders. Please see our Bespoke Order page for more detail.




How can I pay for my order?


By Credit or Debit Card: Payment can be made by credit or debit card. Please select the relevant option when proceeding through checkout. International and Japanese cards are accepted. Please note that this page is in English only, although information (name, address etc) can be made in either English or Japanese. By Bank Transfer: Payment can also be made by Japanese bank transfer. Please select the 'Offline Payment' option when proceeding through the checkout. Payments must be made within 7 days of receiving the e-mail order confirmation and items will be shipped as soon as the payment has been received. Please include the order number in the transfer information (this can usually be added before or after the remitter's name) and be aware that your bank may charge you for domestic transfers. Please take care to ensure that the details are entered correctly in Japanese when making the transfer.




I live in Tokyo, is it possible to collect my order from you?


We do not have a phyical store front but if you live in the Shibuya area, we may be able to meet you locally with your order. Please send us an e-mail at satokoparsons@kamihoseki.com to see if this is possible and make appropriate arrangements.





 

A Kruskal-Wallis próba célja, hogy három vagy több független populáció mintáját hasonlítsa össze. Ezek a minták ugyanannak a függő változónak több csoporton történt mérései. Ehhez mintákat kell vennünk, több független csoportból, melyeken ugyanazt a jelenséget mérjük. A kapott változó mediánjait vetjük össze, így lehet kifejezni, hogy a független mérések eredményei között nulla (azaz nincs) a különbség.

A próba feltétele, hogy a minták nem-normális eloszlású populációból származzanak, emiatt a függő (vizsgált) változónak vagy folytonosnak (metrikus skála) vagy ordinális skálán mértnek kell lennie. Diszkrét változók és ordinális adatsorok esetében a próba nem alkalmazható, hiszen ott mediánokat nem tudunk meghatározni. Bár alkalmazási módja megfelel a kétmintás (független mintás) t-próbának, nem tekinthető annak nem paraméteres verziójának. 

Nullhipotézis: a populáció mediánjai egyenlők

Alternatív hipotézis: a populáció mediánjai eltérők

Ha a próba eredménye bármelyik kritérium szerint szignifikáns, elvetjük a nullhipotézist.  

 Hivatkozása: U(df - szabadságfok) = próba értéke, Z = z értéke, p = szignifikancia 

KRUSKAL-WALLIS PRÓBA

Abacus

módszerek a kruskal-wallis próba futtatására

Kruskal-Wallis próba (SPSS)


Kruskal-Wallis próba futtatása SPSS-ben: A Kruskal-Wallis próbát úgy használjuk, hogy kettőnél több független csoportunk van. Megtalálható az Analyze>Nonparametric tests>K Independent samples menüpontban. A felugró ablakban válasszuk ki a „Test Variable List” lehetőséghez azt az egy darab ordinális változót, melyen a mérést végezzük. A „Grouping Variable” tartalmazza a csoportosító nominális változót, mely itt már több, mint két csoportot is tartalmazhat. A minimum és maximum érték értelemszerűen a legalacsonyabb és legmagasabb számú csoportot mutassa. Az „Options” menüpontban kijelölhetjük a „Descriptive” lehetőséget, ugyanis további információkhoz juthatunk a mediánokat és a csoportokat illetően. A kapott eredményeknél a „Test Statistics” táblázatban tájékozódva tekinthetjük meg a szignifikancia szintjét. A próba nullhipotézise szerint a mediánok megegyeznek a független csoportokban. Amennyiben a próba szignifikáns, ezt a nullhipotézist elvetve feltételezhetjük, hogy a csoportok között van olyan, melynek mediánja eltérést mutat.




Kruskal-Wallis próba (R)






 

Friedman próba

A Friedman próba célja, hogy ugyanannak a populációnak három vagy több összetartozó mintáját hasonlítsa össze. Ezek az összetartozó minták általában ugyanazon az egyedeken mért többszöri vizsgálatok, vagy valamilyen módon összepárosítható adatok. Ehhez mintákat kell vennünk a populációból (háromnál többet időben egymást követőe) és az ott kapott értékek különbségének nullához kell közelítenie vagy pont nullának kell lennie. Így lehet kifejezni, hogy a páros mérés eredményei között nulla (azaz nincs) a különbség.

A próba feltétele, hogy a különbséget adó minta normális eloszlású populációból származzon, emiatt a függő (vizsgált) változónak folytonosnak (metrikus skála) kell lennie. Diszkrét változók és ordinális adatsorok esetében a próba nem alkalmazható, hiszen ott átlagértéket nem tudunk meghatározni. A gyakorlatban kivételt képeznek a Likert-skálák, amelyeket ordinális jellegük ellenére, metrikusnak tekintünk az elemzések során. 

Nullhipotézis: a populáció átlagainak a különbsége nulla

Alternatív hipotézis: a populáció átlagainak különbsége eltér nullától

Ha a próba eredménye bármelyik kritérium (t-érték, p-érték, konfidencia intervallum) szerint szignifikáns, elvetjük a nullhipotézist.  

 Hivatkozása: t(df: szabadságfok (n-1)) = t értéke, p = szignifikancia 

Abacus

módszerek a FRIEDMAN próba futtatására

How long will it take to receive my order?


Orders will be dispatched within 5 working days of the order being made. Please allow 2-3 days for delivery within Japan and 7-14 days for international deliveries.




Can I return my order if I am not satisfied?


Yes. Please see our Shipping and Returns page for more details.




Are your items waterproof?


All items are coated with a non-toxic resin that is durable and waterproof.




Will you make bespoke orders?


Yes, we are happy to make bespoke orders. Please see our Bespoke Order page for more detail.




How can I pay for my order?


By Credit or Debit Card: Payment can be made by credit or debit card. Please select the relevant option when proceeding through checkout. International and Japanese cards are accepted. Please note that this page is in English only, although information (name, address etc) can be made in either English or Japanese. By Bank Transfer: Payment can also be made by Japanese bank transfer. Please select the 'Offline Payment' option when proceeding through the checkout. Payments must be made within 7 days of receiving the e-mail order confirmation and items will be shipped as soon as the payment has been received. Please include the order number in the transfer information (this can usually be added before or after the remitter's name) and be aware that your bank may charge you for domestic transfers. Please take care to ensure that the details are entered correctly in Japanese when making the transfer.




I live in Tokyo, is it possible to collect my order from you?


We do not have a phyical store front but if you live in the Shibuya area, we may be able to meet you locally with your order. Please send us an e-mail at satokoparsons@kamihoseki.com to see if this is possible and make appropriate arrangements.