MÓDSZERTAN: TÖBBVÁLTOZÓS KUTATÁSOK

abc-accomplished-alphabet-48898.jpg

Statokos jegyzet: Többváltozós kísérletek

Statokos jegyzet: Módszertani összefoglaló

Letölthető jegyzetek

kép.PNG

Ajánlott könyvek

TN6_2000002140230.JPG
Used Books

RÖVIDEN A TÖBBVÁLTOZÓS KUTATÁSOKRÓL

 

A legtöbb kutatás és kísérlet csoportok összehasonlítását vagy feltételek összehasonlítását preferálja. Felmerülnek azonban olyan kutatási területek és tevékenységek, amelyek esetében nincs lehetőségünk csoportokat összehasonlítani. Ennek első oka az, hogy általában az összehasonlítást végző kutatások kissebb elemszámmal dolgoznak és specifikus kérdésekre keresik a választ. Azonban a legtöbb szociológiai és pszichológiai kutatás ezzel szemben nagy elemszámú vizsgálatokat folytat, feltáró jelleggel dolgozik, vagy meglévő paradigmákat tesztel és von le következtetéseket. A leggyakoribb kutatási forma ebben a tekintetben a tesztek/kérdőívek felvétele, ma már online formában. Ez lehetővé teszi, hogy akár több száz, több ezer ember adatait tudjuk begyűjteni és elemezni. Emellett az olyan komplex jelenségek megértése, mint a személyiség vagy társadalmi jelenségek bizonyos aspektusai, több tényező együttes hatását feltételezik, ezért ugyanahhoz a jelenséghez rendszerint több, különböző típusú kérdőívet használunk. Természetesen, más tudományterületen is van szükség a többváltozós statisztikai eljárásokra. Például ilyen az agykutatás - amely manapság egyre inkább a hálózatkutatás jellemzőit veszi fel -, számtalan olyan tényezőt vizsgál, amit egyszerű összehasonlításokkal nem tudunk elemezni. Általánosságban tehát, adatok újracsoportosítását, redukcióját, besorolását végezzük leginkább. 

Az adatok újracsoportosítása és/vagy redukciója azért fontos, mert a hagyományos statisztikai eljárásokkal egyszerre nehéz túlságosan sok változót kezelni. Természetesen, arra van lehetőség, hogy ezeket egyszerre elemezzük, de az alapvetően elmélyültebb és más típusú statisztikai/módszertani alapokat kíván.

A legjellemzőbb, a többváltozós statisztikai eljárások esetében az, hogy:

- Több függő és független változóval operálnak (4-5 darabtól egészen 10-15 változóig is, vagy magasabb számban)

- A függő változók egy közös jelenséghez köthetők

- A függő változók redukciója azt jelenti, hogy például 10-15 változóból kevesebbet, akár 3 változót generálunk, amely valamilyen logika (vagy a program dönti el vagy mi) szerint értelmezhető

- Az újracsoportosítás (klaszterbe sorolás rendszerint) azt jelenti, hogy a vizsgálati személyek függő változó(k)ra adott reakciói alapján, hasonlóságot keresve egy csoportba sorolhatók

- Ismeretesek azok az eljárások is (logisztikus regresszió és diszkriminanciaanalízis, ROC-görbe), melyek segítségével a meglévő adatok alapján képesek vagyunk a vizsgálati személyeket csoportokba sorolni, elkülöníteni egymástól. Ez a klaszterezéssel szemben nem csak keresztmetszeti (éppen aktuális állapot), hanem a jövőbeli esetekre vonatkozóan is előrejelző funkcióval bír, vagyis akár diagnosztikus célt is szolgálhat. 

A faktorelemzés során (amely az adatredukciós technikák összefoglaló neve), a meglévő függő változóinkra kapott reakciók alapján, azok újracsoportosítását (valójában a meglévő változóink számának csökkentését) végezzük.

A klaszterelemzés során nem a változókat, hanem magukat a  vizsgálati személyeket soroljuk új csoportokba (klaszterekbe) egy közös tulajdonság alapján. A feltáró kutatások egyik fontos eljárása a nagy elemszámú minta kisebb egységekre való bontása. 

A predikciós funkcióval bíró többváltozós elemzések (logisztikus regresszió, diszkriminancia-analízis, ROC-görbe) azt hivatottak meghatározni, hogy a rendelkezésre álló adatok alapján a meglévő és a jövőbeni vizsgálati személyek (esetek) megbízhatóan besorolhatók-e egy-egy kategóriába; pl.: a meglévő vérnyomásértékek és nem alapján meghatározható-e, hogy valaki később stroke betegségben fog-e szenvedni. 

 
 

Mikor milyen statisztikai próbát használjunk?

 

Az előzőek alapján röviden tekintsük át, hogy milyen statisztikai próbát alkalmazzunk a különböző esetekre.
 

 

Példafeladat:

Egy kutatás során egy falu lakosságának élettel való elégedettségét vizsgálták. A vizsgálatban különböző kérdőíveket kellett kitöltenie a lakóknak. A kutatók 13 darab eltérő kérdőívet vittek a helyszínre. A kitöltést követően, az adatok feldolgozásánál azt állapították meg, hogy túl sok változójuk van és összefüggéseket is szeretnének keresni a tesztek között. 

 

Független változó: A kitöltött teszteken kívül minden releváns információ (magasság, nem, tömeg, életkor, iskolázottság stb.)

Függő változó: A kitöltött tesztek 

Csoportok száma: 1 (A falu lakossága)

Használt statisztikai próba: Faktorelemzés valamilyen típusa

  • Ha ismertek a tesztek és a várható eredmények is: Faktorelemzés

  • Ha feltáró jelleggel kutatnánk: Főkomponenselemzés  

Példafeladat:

Egy kutatás során egy falu lakosságának élettel való elégedettségét vizsgálták. A vizsgálatban különböző kérdőíveket kellett kitöltenie a lakóknak. A kutatók 4 darab eltérő kérdőívet vittek a helyszínre, illetve felvették az alapvető demográfiai adatokat. A kitöltést követően, az adatok feldolgozásánál arra voltak kíváncsiak a kutatók, hogy a kapott eredmények alapján valamilyen módon csoportosítható-e a falu lakossága és ha igen, milyen különbségek vannak az emberek csoportjai közt. 

 

Független változó: A kitöltött teszteken kívül minden releváns információ (magasság, nem, tömeg, életkor, iskolázottság stb.)

Függő változó: A kitöltött tesztek + a független változók közül azok, amely alapján a csoportosítást végezni szeretnénk.

Csoportok száma: 1 (A falu lakossága)

Használt statisztikai próba: Klaszterelemzés

Példafeladat:

Járványos megbetegedés jelentkezett az egyik faluban. A Járványügyi Bizottság a helyszínen megvizsgálta a teljes lakosságot, hogy a betegség terjedésére vonatkozóan további információkat gyűjtsenek. Többek között (pl.: magasság, tömeg, vérnyomás, vércukorszint, nem) vérvizsgálattal meghatározták a különböző szervek működésére jellemző értékeket is. Megfigyelték, hogy a májfunkciókkal összefüggő értékek a tünetmentes időszakban valamilyen szintű növekedésnek indultak, azonban ez még nem volt elég a tudományos igényű bizonyossághoz. Azt is észrevették, hogy a nemek között eltérő a betegség megjelenése. A járvány későbbi megelőzése érdekében meg akarták állapítani, hogy a nem és a májfunkció értéke milyen rizikófaktorként jelenik meg, ugyanis így a veszélyeztetett személyeket még időben azonosítani tudják.  

 

Független változó: A véreredményeken kívül minden releváns információ (magasság, nem, tömeg, életkor, iskolázottság stb.)

Függő változó: A véreredmények + a független változók közül azok, amely alapján a betegség bekövetkezését vizsgálni akarjuk.

Csoportok száma: 1 (A falu lakossága)

Használt statisztikai próba:

  • Ha van olyan függő változó, ami nem paraméteres (jelen esetben a nem változó), akkor: logisztikus regresszió

  • Ellenkező esetben: Diszkriminanciaelemzés

Nem találod a számodra szükséges statisztikai próbát?