STATISZTIKAI ELJÁRÁSOK DISZKRÉT VÁLTOZÓKKAL

abc-accomplished-alphabet-48898.jpg

Tárgymutató

Illeszkedésvizsgálat, Khí-négyzet próba, McNemar- és CochranQ próba,  hivatkozás APA formátumban; futtatás: SPSS, R, Kézi számítások  

Market Analysis

Letölthető jegyzetek


StatOkos Jegyzet: Diszkrét változók statisztikája

StatOkos Jegyzet: Összefoglaló

Adatfájlok: SPSS

Adatfájlok: Excel 

Used Books

Ajánlott könyvek

Barna Ildikó – Székelyi Mária: Túlélőkészlet SPSS-hez
Andy Field: Discovering Statistics Using SPSS
Sajtos László – Mitev Ariel: SPSS kutatási és adatelemzési kézikönyv

diszkrét változók

A legáltalánosabb statisztikai eljárások a t-próbák. A t-próbákat akkor használjuk, amikor a változóink metrikusak (folytonosak). Az ilyen változókkal könnyen végezhetünk matematikai műveleteket is. De mi történik akkor, ha az adataink nem folytonosak, csak néhány értékkel bírnak? Természetesen bonyolultabb matematikai műveleteket ezekkel nem végezhetünk, mégis van lehetőségünk arra, hogy statisztikailag összevessük az ilyen típusú adatokat. 

Az olyan változókat, amelyek csak néhány értéket vesznek fel, nem folytonosak és bonyolultabb matematikai műveletek nem végezhetők velük, diszkrét változónak nevezzük. Azért diszkrétek, mert jól meghatározott kategóriákat vagy tulajdonságokat reprezentálnak. A legnépszerűbb példák közé tartoznak a jellemzésre alkalmas tulajdonságok, ember esetében például: szemszín, hajszín, nem. Diszkrét változó az is, ha egy mintát valamilyen tulajdonságok alapján csoportra bontunk. Például: későn kelők vagy korán kelők. A diszkrét változók közül is külön csoportot képeznek a dichotóm változók, amelyek legfeljebb két értéket vehetnek fel. Ilyen lehet az igen/nem; nő/férfi stb.  

 

Nominális változókhoz kapcsolódó szignifikancia próbák (Illeszkedésvizsgálat, Khí-négyzet próba, McNemar és Cochran-Q próba)

A nominális változókhoz kapcsolódó szignifikancia próbák megegyeznek abban, hogy a vizsgált függő változó nominális mérési szintű változó, vagyis valamilyen nem számszerűsíthető tulajdonságot jelölnek, például: nemek, csoportok, igen/nem válaszok ( amikor két lehetőség közül választunk, dichotóm változókról beszélünk).

nominalis.png

Binomiális eloszlás (Nominális változók)


Számos olyan esettel fogunk találkozni a kutatásaink során, amikor már egy meglévő adathoz szeretnénk hasonlítani a sajátunkat. Ilyen eset a következő: Egy képzeletbeli egyetem minden szakán megegyezik a nők és férfiak aránya, a nemi eloszlás 50-50%-nak mutatkozik. A pszichológiai intézetben mégis úgy tűnik, hogy a hölgyek vannak többségben, ugyanis a statisztikák szerint a hallgatók 65%-a lány, míg csupán 35%-a fiú. Bár első ránézésre szélsőségesnek tűnhet az eloszlás alakulása, azt is figyelembe kell vennünk, hogy a nehéz bejutási küszöb miatt a pszichológia szakon vannak a legkevesebben, ezért a populáció méreteiben különlegesnek számít. A kérdés az, hogy a pszichológia szakon tapasztalható eloszlás a nemek között szignifikánsan eltér-e az összegyetemi 50-50%-tól. Erre vonatkozóan az illeszkedésvizsgálatot, vagy más néven binomiális tesztelést alkalmazhatunk. Ennek lényege, hogy a kiválasztott nominális változó eloszlását az általunk megadott gyakorisággal vetjük össze. A próba során használt nullhipotézis szerint az eloszlások megegyeznek, szignifikáns eredmény esetén az eloszlás jelentősen különbözik az előre megadott értéktől.

Futtatása SPSS-ben:

A binomiális tesztelést megtalálhatjuk az SPSS Analyze > Nonparametric test > Legacy dialogs > Binominal útvonalon

A felugró ablakon válasszuk ki a maximum két szintű (azaz dichotóm) nominális változónkat, majd a „Test proportion” értékénél adjunk meg egy elvárt megoszlást.

A kapott táblázatunk mutatja a férfiak és nők megoszlásának arányát. Az „Observed proportion” mutatja, az adataink szerinti megoszlást, míg a „Test proportion” azt, hogy mi az általunk tesztelni kívánt eloszlás. Abban az esetben, ha itt szignifikáns értéket kapunk, akkor az általunk megadott tesztelési érték nem érvényes a csoportra. Az illeszkedésvizsgálat nullhipotézise szerint ugyanis a tesztelési és a megfigyelési megoszlások között nincs különbség.

Hivatkozása például: "a vizsgált mintán 60%-os volt a férfiak eloszlása a mintában, ami magasabb, mint az 50%-os tesztérték, azonban ez nem mutatkozott szignifikánsnak p=0,222.”




Khí-négyzet próba (Általában nominális változók)


Egy egyetemi értékelés alapján egy szak 5 tantárgya között próbáltak különbséget tenni abban a tekintetben, hogy azok vajon egyformán népszerűek-e a női és a férfi hallgatók körében. A szavazás során a válaszadóknak annyit kellett tenniük, hogy jelöljék meg, hogy az adott órát kedvelik-e avagy sem. A legtöbb kedvelést begyűjtő tárgy a legnépszerűbb, míg a legtöbb nemleges választ kapó a legkevésbé kedvelt. Az 5 tantárgy értékelésének összesítése után megvizsgálták, hogy ezek a mutatók miként alakulnak a férfiak és nők körében.

Két változót veszünk itt figyelembe: az 5 darab tantárgyat, illetve a férfiak és nők választását. Ebben az esetben a független változó a nem, melynek során két különböző csoportba soroljuk a résztvevőket, a függő változó pedig maga az értékelés. Arra keressük a választ, hogy a férfiak és nők között van-e különbség a kedvenc és az utált tárgyak tekintetében. A korábban tanultak alapján azt is tudjuk, hogy a nem és az 5 tantárgy egyaránt nominális, vagyis nemparaméteres változók. Abban az esetben, ha kettőnél több nemparaméteres változó kapcsolatára szeretnénk fényt deríteni, érdemes Khi-négyzet próbát alkalmaznunk.
Bár a Khí-négyzet próba minden változótípusnál ad értéket, melyet vele vizsgálunk, a legcélszerűbb mégis az, ha nominális vagy legfeljebb ordinális skálák esetében alkalmazzuk. Fontos, hogy a változóknak függetlennek kell lenniük egymástól, valamint az, hogy egyértelműen megállapítsuk, hogy melyik a független- és függő változónk.

A khí-négyzet próba a többi kereszttáblás-elemzéshez hasonlóan egy mátrixot képez. Ebben a mátrixban találjuk felsorakoztatva a vizsgált változókat és a cellák találkozásánál pedig az éppen aktuális értéket, amely kifejezi a kapcsolat erősségét. A teszt maga kimondja, hogy 5 cellánál nem lehet kevesebb a táblázatunkban, alatta megbízhatósági problémák léphetnek fel. Esetünkben az 5 tantárgy két nemre osztva összesen 10 cellát eredményez, mely megfelel ennek a kritériumnak.

A Khí-négyzet próba futtatása SPSS-ben: A Khí-négyzet próbát az Analyze > Descriptive Statistics > Crosstab s menüpont alatt érhető el A „Rows” tartalmazza a független változókat vagy csoportokat, míg a „Columns” a függő változókat, a vizsgálni kívánt tényezőket. A „Statistics” menüpontban állítsuk be a „Chi-square” opciót A „Pearson Chi-square” sor „Asymptotic Significane” oszlopa mutatja a szignifikancia szintjét. A khí-négyzet próba nullhipotézise szerint az eloszlások a csoportok között megegyeznek. Szignifikancia esetén ezt vetjük el.
Hivatkozása: χ2(szabadságfok - df, N = elemek száma) = χ2- próba értéke , p = szignifikancia




McNemar és Cochran-Q próba (Nominális változók)


Egy édességmárka új fagylalt piacra dobását tervezi. Annak érdekében, hogy biztosan a lehető legjobb minőségű termék kerüljön a boltok polcaira, szeretnék megvizsgálni, hogy az általuk megálmodott íz 2 receptúrája közül melyiket kedvelik jobban a potenciális fogyasztóik. A vizsgálatban résztvevők feladata egyszerű: Annyit kell eldönteniük mindkét receptúra esetében, hogy ízlik-e nekik a fagylalt, vagy sem.


A vizsgálat elrendezése alapján látjuk, hogy ugyanazon emberek vettek részt a tesztelésben egymást követő két alkalommal. A válaszaikban csak annyit kellett megadniuk, hogy kedvelték-e az adott ízt. Ez az igen/nem választás nominális változónak minősül. A kutatási kérdés teszteléséhez arra van szükség, hogy ennek a nominális változónak a két mérési alkalommal, vagyis a két különböző recept esetén kapott eloszlását vessük össze. Két nominális változó eloszlásának összehasonlítására McNemar próbát alkalmazhatunk.

A McNemar-próba nullhipotézise szerint ezek az eloszlások megegyeznek, amennyiben szignifikáns eltérést kapunk, úgy elmondható, hogy a két nominális változó eloszlása eltér. Fontos, hogy a címben szereplő McNemar- és Cochran-Q-próbák egyaránt úgynevezett dichotóm változókra lettek tervezve, ilyen változó az igen/nem típusú választás, a nem (nő/férfi), stb. Bár első ránézésre páros mintás t-próbát is választhatnánk a kutatási kérdés tesztelésére, tudnunk kell, hogy azt metrikus változók esetén alkalmazhatjuk!

Mivel az első kutatás során tesztelt 2 receptúra esetén nem volt különbség azok preferenciájában, a kutatást megrendelő cég egy harmadik receptúrát is szeretne kipróbálni. Ebben az esetben mivel kettőnél több dichotóm változót vizsgálunk, jobb statisztikát tudunk készíteni a Cochran-Q próbával. A tulajdonságai és alkalmazhatósági köre megegyezik a McNemar próbáéval, a különbség csupán annyi, hogy ezt 2-nél több változó esetén is alkalmazhatjuk.

Próbák futtatása SPSS-ben:

A McNemar próbát az Analyze >Descriptive Statistics > Crosstabs funkción belül tudjuk elérni. Azt itt felnyíló ablak „Statistics” lehetőségénél válasszuk ki a „McNemar” opciót Itt adjuk meg a két összehasonlítani kívánt változót Majd a Statistics menüpontban jelöljük be a McNemar lehetőséget Az eredményeinket szemügyre véve a McNemar Test sor szignifikancia értéke alapján döntünk. Mivel a próba nullhipotézise szerint a dichotóm változóink eloszlása megegyezik, az csak akkor vethető el, ha szignifikáns a különbség A Cochran-Q próba a McNemar teszttel azonos, a különbség annyi, hogy itt már kettőnél több dichotóm változó között tudunk vizsgálódni. A tesztet elérhetjük az Analyze > Nonparametric tests > Legacy dialogs > K-related samples menüpontban.
A felugró ablakban a Test variables felületre húzzuk át a vizsgálni kívánt változóinkat, majd pipáljuk ki a Cochran’s Q lehetőséget! Az eredményeinket megtekintve a „Test Statistics” táblázat szignifikancia értékét figyelhetjük meg. A McNemar teszthez hasonlóan a Cochran-Q próba nullhipotézise szerint az eloszlások megegyeznek a dichotóm változóink között. Hivatkozása: χ2(szabadságfok - df, N = elemek száma) = McNemar vagy Cochran Q próba értéke , p = szignifikancia