Varianciaanalízis

abc-accomplished-alphabet-48898.jpg

Tárgymutató

Egyszempontos varianciaanalízis (ANOVA), Összetartozó-mintás varianciaanalízis, Többszempontos varianciaanalízis (Two-Way ANOVA, Multifactor ANOVA), Kevert ANOVA, Kovariáns

Market Analysis

Letölthető jegyzetek

StatOkos Jegyzet: Varianciaanalízis
StatOkos Jegyzet: Összefoglaló

Adatfájlok: SPSS

Adatfájlok: Excel 

Used Books

Ajánlott könyvek

Barna Ildikó – Székelyi Mária: Túlélőkészlet SPSS-hez
Andy Field: Discovering Statistics Using SPSS
Sajtos László – Mitev Ariel: SPSS kutatási és adatelemzési kézikönyv
 

BEVEZETŐ

A többváltozós statisztikai eljárások ismérve a szignifikancia próbákkal ellentétben, hogy általánosságban nem két esetet, csoportot vagy mintát hasonlítanak össze, hanem annál több változóval operálnak. A többváltozós statisztikai eljárások három nagy csoportja a varianciaanalízisek, az olyan eljárások, amelyek a változók közötti kapcsolatokat tárják fel, illetve azok a próbák, amelyek a változók számát hivatottak csökkenteni vagy rendszerezni. Ebből az is következik, hogy a feltáró jellegű munkák gyakrabban használnak többváltozós módszereket. Emellett az is elmondható, hogy a szignifikanciapróbákat inkább kísérleti módszertanban, többváltozós eljárásokat pedig jellemzően kérdőíves kutatások esetén alkalmazunk. Természetesen ez nem kizárólagos, minden esetben a kutatás jellege és sajátosságai a mérvadóak. Az alábbi példák az IBM SPSS szoftverhez készültek.

A legtöbb variancaanalízis közös tulajdonsága, hogy összehasonlítja a vizsgált metrikus, függő változók átlagainak varianciáját. A független változó általában valamilyen csoportosító változó (nominális változó). A variancaanalízisek nullhipotézise, hogy az összehasonlított függő változó(k) között nincs szignifikáns eltérés a középérték varianciáját illetően. Szignifikáns különbség esetén elvetjük ezt a nullhipotézist. Annak megfelelően, hogy csoportokat vagy feltételeket hasonlítunk össze, a varianciaanalíziseknek is több típusát használjuk. 

Több, mint két csoport között, amit egy független, nem paraméteres változó alakít ki

Ismételt mérésű, metrikus, függő változók (min. 3) átlagainak összehasonlítása

Egy darab metrikus, függő változó átlagainak összehasonlítása

Több darab metrikus, függő változó hatásának és kereszthatásának vizsgálata

Vagyis: ebben az esetben a függő változónk egy metrikus mérési szintű skála, amelyet minimum három csoporton lemérünk. Például reakcióidős feladatot végzünk általános, középiskolai és egyetemi populáción. A teszt összehasonlítja a csoportok átlagértékeit. A nullhipotézis szerint a csoportok átlagai között nincs eltérés. Szignifikáns eredmény esetében ezt elvetjük.

Vagyis: ebben az esetben a függő változónk egy metrikus mérési szintű skála, amelyet minimum három csoporton lemérünk. Például reakcióidős feladatot végzünk általános, középiskolai és egyetemi populáción. A teszt összehasonlítja a csoportok átlagértékeit. A nullhipotézis szerint a csoportok átlagai között nincs eltérés. Szignifikáns eredmény esetében ezt elvetjük.

Vagyis: a többszempontos variancaanalízis esetében a függő változónk metrikus skálán jegyzett érték, melyet legalább két darab független változóval hasonlítunk össze, ami általában nominális mérési szintű. Például reakcióidős feladat esetében összehasonlítjuk, hogy az, hogy valaki ivott-e kávét (igen/nem) és a szeme színe (kék, zöld, barna) befolyásolja-e az értékeket. A próba a két tényező együttes, kereszthatását is képes értelmezni. 

Kevert elrendezésű (csoport x több mérés)

Egyszempontos varianciaanalízis - ANOVA

Többszempontos variancaanalízis 

Egy csoporton belül

Ismételt mérésű, metrikus, függő változók (min. 3) átlagainak összehasonlítása

Vagyis: egy független metrikus változót ugyanazon a mintán legalább háromszor felveszünk. Ez vélhetően egy ismételt mérés eredménye lesz. Például egy populáción mérjük a reakcióidőt három különböző időpontban: hétfőn, kedden és szerdán. Az ismételt mérés átlagainak értékét hasonlítja össze. A nullhipotézis szerint a mérések között nincs különbség, szignifikancia esetén ezt elvetjük.

Összetartozómintás varianciaanalízis - Repeated Measure ANOVA

 

KOVARIÁNS BEVEZETÉSE

1. eset

Mérésből származó hiba

Kovariáns

Lehetőség a nullhipotézis elvetésére

1. eset + kovariáns

Az első eset azt mutatja, hogy a statisztikai próbának mekkora a lehetősége van a nullhipotézis elvetésére. Természetesen szembesülnünk kell a mérésből származó hibákkal és azokkal a tényezőkkel, amelyek nem képezik részét a kísérletünknek, de aktívan hatást gyakorolhatnak rá, ez a kovariáns. A varianciaanalízis modelljébe illesztett kovariáns azt a célt szolgálja, hogy a modellünk teljes magyarázó erejének részét képezze úgy, hogy annak hatását lényegében leválasztjuk és már csak a mérésből származó hibákkal kelljen foglalkoznunk. Továbbá a kovariáns alapvetően nem mentes a mérési hibáktól, így elméletben ezzel is kell számolnunk. A kovariáns bevezetése a modellünkbe számos esetben, mint a jelenlegi példában is, képes megnövelni a lehetőséget a nullhipotézis elvetésére. Azonban olyan eset is fennállhat, hogy a kovariáns behozatala nem módosít a modellünkön, sőt azzal ellentétes eredményt kapunk. Fontos, hogy a kovariáns korreláljon a függő változóval, azonban ha egyszerre több kovariánst vizsgálunk, azok ne korreláljanak egymással.

 

A kovariáns bevezetése akkor lehet indokolt, amikor a független változók által kialakított csoportok/feltételek között valamilyen különbség alapvetően fellelhető (legalábbis sejtjük), de elsősorban nem releváns a kutatás szempontjából. Egy fiktív példában nők és férfiak, illetve az iskolázottság kapcsolatát vizsgálva különböző memória-feladatokon azt látjuk, hogy lényeges különbség nem mutatkozik az egyetemet végzett nők és férfiak között. Azonban egy másik kutatásból tudjuk, hogy a nők és a férfiak IQ értéke általánosságban eltérő képet mutat. Míg a nők értékei inkább az átlag körül csoportosulnak, addig a férfiak esetében nagyobb a szórás. Kovariánsként beemelhetjük a modellünkbe az IQ értékeket, amely azt az eredményt mutatja, hogy az egyetemet végzett nők mégiscsak szignifikánsan jobbak a memória-feladatokban. Ez a fiktív példa azt mutatja, hogy az IQ értékek figyelembevételével már könnyebben tudunk differenciálni a csoportok között. A statisztikai módszer hátterében az áll, hogy valójában úgy vettük figyelembe a kovariánst, hogy a memória-tesztek eredményeinek értelmezésekor az mégse legyen magyarázó erejű tétel. Egy másik egyszerű és mégis humoros példával élve: a kovariáns hozott ajándékot, meg nem is.

A legtöbb kísérlet, úgy tűnik, mintha maximális izoláltsággal lenne létrehozva a való világtól függetlenül. Ez egy olyan módszertani dilemmát vet fel, amely átnyúlik a statisztikai értelmezésbe is. Alapjaiban véve a kísérletek lényege a kontrolláltság, hiszen ennek segítségével tudjuk a változóinkat úgy összehasonlítani, hogy abba információs interferencia ne kerüljön. Ennek ellenére beláthatjuk azt is, hogy a valóságban nincs olyan eseménytér, amely a benne szereplő tényezőkre nézve teljesen izolált legyen. Röviden tehát: hiába alkotunk kísérleti helyzetet, mivel a valóságot akarjuk vele modellezni, figyelembe kell vennünk olyan tényezőket is, amelyek alapvetően nem képezik részét a vizsgálatunknak (hiszen néhány változót kontroll alatt tartunk), de aktívan befolyásolhatják annak eredményét. A statisztika nyelvére lefordítva ez azt jelenti, hogy egy eredmény szignifikanciájának vizsgálata és a nullhipotézis elvetése másképp következhet be akkor, ha ezeket a tényezőket figyelembe vesszük és akkor is ha nem. Összefoglalóan és tágabb értelmezésében minden olyan tényezőt kovariánsnak nevezhetünk, amely a kísérletünk szempontjából nem képezi részét az összehasonlítás fókuszának, de hatása aktívan befolyásolhatja azt. 

 

ISMÉTELT MÉRÉSEK CSOPORTOK KÖZÖTT

A kevert ANOVA onnan kapta a nevét, hogy egyszerre alkalmaz eltérő feltételt és eltérő csoportot. Az egyszerűbben kontrollált kísérletek általában vagy több mérési alkalmat különböztetnek meg egy csoporton belül (within subject) vagy ugyanannak a változónak a különbségeit vizsgálják a csoportok között (between subjects).  A kevert ANOVA alkalmas arra, hogy a kialakított csoportok (kettőnél több csoport is lehet) között tegyen különbséget ismételt mérések (kettőnél több mérés is lehet) alapján. Ezzel a kevert modellünk új dimenziójában enged vizsgálódni, ahol már nem csak a tesztelések sorozata, de a csoportok közötti különbségeket is kereshetjük. A modell alkalmas arra is, hogy kovariáns bevezetésével tovább árnyaljuk a kapott eredményeket.

1. mérés
2. mérés
3. mérés
1. csoport
1. csoport
1. csoport
2. csoport
2. csoport
2. csoport
3. csoport
3. csoport
3. csoport
Elemzésre már ez az elrendezés is alkalmas!
KOVARIÁNS
 

TÖBBVÁLTOZÓS VARIANCIAELEMZÉS

A többváltozós varianciaanalízis a nevéből adódóan, több függő változót képes kezelni, több differenciált független változó mellett. Figyeljünk arra, hogy ne keverjük össze a többszempontos varianciaanalízissel, amely egyetlen függő változót kezel több szempont (független változó) figyelembevételével. A többváltozós varianciaanalízis egyaránt használható több független változóval történő interakció felderítésére is. Általánosítva elmondható, hogy ez az eljárás képes a legtöbb információt kinyerni a mintánkból, így feltáró elemzésre is remekül alkalmazható.