Adatok előkészítése és átdolgozása

abc-accomplished-alphabet-48898.jpg

Tárgymutató

Adatok importálása, adatok változókká alakítása, műveletek változókkal, új változók létrehozása, 

Used Books

Ajánlott könyvek

Barna Ildikó – Székelyi Mária: Túlélőkészlet SPSS-hez
Andy Field: Discovering Statistics Using SPSS
Sajtos László – Mitev Ariel: SPSS kutatási és adatelemzési kézikönyv

Adatok bevitele és előkészítése

A napjainkban használt egyik legelterjedtebb statisztikai elemzőprogram, az IBM által kínált SPSS (Statistical Package for the Social Sciences). Az alábbiakban a program legalapvetőbb tulajdonságait ismertetjük és azt, hogy az adatainkat hogyan transzformálhatjuk úgy, hogy azon a későbbiekben a számunkra szükséges statisztikai próbát elvégezhessük. A mellékelt képek az SPSS 23.0 verzriójában készültek. A különböző funkciók némileg eltérő helyen vagy sorrendben lehetnek más verziószám esetén. 


Azonban számos egyéb opció is elérhető, akár ingyenesen is, amennyiben ez a program nem elérhető számotokra. A StatOkos honlapján ezekről is tájékozódhattok .

Adatok importálása


Az SPSS program számos fájlformátumot képes kezelni, a két legfontosabb adatbeviteli eljárás a manuális adatbevitel, valamint a különböző adatfájlok importálása a programba. Ez utóbbi egy kezdő felhasználó számára általában egy korábban már elkészített .sav kiterjesztésű SPSS fájl vagy egy, a Microsoft Excel által kínált .xls kiterjesztésű fájl importálását jelenti. A program megnyitásakor alapértelemezetten megjelenik egy ablak, mely fel is ajánlja a felhasználónak, hogy importálja be adatait.

A manuális adatbevitel

Amennyiben még nincs adatfájlunk, amin vizsgálódni szeretnénk vagy tesztjeink papír alapúak, és adatainkat kézzel kell bevinni a számítógépre, az első felület amivel találkozunk, az SPSS „Data View” opciója lesz. A „Data View” nézet alapvetően arra szolgál, hogy a vizsgálat résztvevőinek változók által csoportosított értékeit mutassa meg. Elsőre leginkább egy üres Excel táblázathoz hasonlítható. Pontosan ugyanúgy, kézzel lehet begépelni az adatokat ezen a felületen, vagy máshonnan kimásolt sorokat, oszlopokat beilleszteni.

Azonban fontos, hogy milyen sorrendben és hova illesztjük adatainkat. Az alaptétel, hogy minden személynek egy sora van, tehát minden adata új oszlopba kerül. Így kerül egymás után például a Sorszám; Nem; Életkor; stb…

Mielőtt nekiállnánk begépelni az adatainkat, ajánlott első lépésben nézetet váltani és beállítani, melyik oszlopba milyen adatot fogunk beilleszteni. Ezt a következő gombnál tehetjük meg:
Importálás
Adatainkat, amelyeken statisztikai elemzéseket akarunk végezni, számos fájlformátumban tárolhatjuk. A Microsoft Office programja, az Excel az egyik leggyakoribb táblázatkezelője. Manapság több felület (pl.: Google Form kérdőív) kínál lehetőséget arra, hogy közvetlenül Excel fájlba mentsük az adatainkat, így ezek importálásának ismerete elengedhetetlen. Az .xlsx kiterjesztésű munkafüzetek betöltésének menete a következő:

1. Kattintsunk a „Fájl (File)” menüpont „Adatok megnyitása (Open Data)” lehetőségére és válasszuk a legördülő listában megjelenő Excel formátumot. Fontos tudni, hogy az SPSS korábbi verziói nem feltétlenül ismerik fel az új, .xlsx kitejesztést, ilyenkor a munkafüzetet régebbi formátumba mentve tudjuk folytatni az importálást.

2. A megfelelő fájl megkeresése és betöltése után egy új ablak nyílik meg, mely segítségével meghatározhatjuk, hogyan olvassa a program a fájlt.

3. A Munkafüzetlap (Worksheet) opció lehetőséget biztosít, hogy kiválasszuk, a fájl melyik munkalapját kívánjuk megnyitni.

4. A Tartomány (Range) esetében a felhasználandó munkaterület kezdő és végpontját jelölhetjük ki (amennyiben ez eltér a teljes adattáblától).

5. Megadhatjuk továbbá a string, vagyis karakterlánc típusú (még egyszerűbben: szöveges) változóink maximális hosszát. Amennyiben volt olyan kérdésünk, melyre szövegesen kellett válaszolni, érdemes figyelni erre.

6. A különböző verziókban némileg eltérő helyen lehet az a beállítás, mely engedélyezi, hogy az adathalmazunk első, legfelső sora határozza meg a változóink neveit. Ez nagyon praktikus lehet, hiszen nem kell őket ismét begépelni, de érdemes figyelni néhány dologra: a változók nevei ne tartalmazzanak olyan karaktert, mely nem felel meg a korábban ismertetett kritériumoknak, valamint egyesített cellákat ne tartalmazzon az adatfájl, ezeket ugyanis nem kezeli az SPSS. Ilyen esetben az első cella kap egyedül értéket, a korábban összevont cellák üresen maradnak.

Itt nem részletezzük, hogyan lehet .txt .dat, vagy .csv fájlokat importálni azonban megemlítjük, hogy erre is van lehetőség. A „Fájl (File) Szöveges adat beolvasása (Read Text Data)” menüpont alatt érhető el ez a funkció. Az importálást varázsló segítségével értelemszerűen lehet elvégezni, A folyamat során érdemes figyelni arra, hogy kijelöljük az első sort, amennyiben a fejlécet tartalmazza a fájlunk. Megadható az is, milyen módon vannak elválasztva az egyes adatok egymástól (ez lehet szóköz, pontosvessző, tabulátor, de bármilyen egyéni karakter is). Egyszerre akár több elválasztó is kiválasztható, erre figyeljünk! Az importált adatfájl esetében is törekedjünk arra, hogy egy sor tartalmazza egy személy minden adatát. Ammennyiben ez nem teljesül, érdemes átstrukturálni az adatsort, melyről később bővebben is írunk az „Átrendezés (Restructure)” menüpont kapcsán.




Adatok változókká alakítása


A „Variable View” nézetben nem csupán a változók nevét, de lényeges tulajdonságait is meghatározhatjuk. Sorban haladva megadhatjuk a változó:

Nevét (Name): érdemes rövid és jól dekódolható nevet választani, hogy a kutatás során más is könnyedén tudja értelmezni azokat. A fenti példán például az első és második mérés pontszámait „pre” és „post” jelzővel láttuk el, így könnyen megkülönböztethetők (de ez lehet akár _01 és _02 is). A kérdőív nevét is rövidítve írtuk le, így könnyebben átláthatók a változók nevei. A névadásban szorítkozzunk az angol abc betűire, illetve ne használjunk szóközt vagy kötőjelet, ezeket a karaktereket az SPSS nem fogadja el érvényesnek. Szóköz helyett mi az alsóvonást alkalmazzuk.

Típusát (Type): a bevitt adat formátumát itt tudjuk meghatározni. Több lehetőség közül is választhatunk, mint a dátum, vagy az ún. „string” változó, melyet szöveges adatok esetében használhatunk. Érdemes kísérletezni, hogy kiválasszuk melyik a legmegfelelőbb formátum az adatainknak. A számadatok általában a „numeric” típust veszik fel.

Szélesség (Width): megmutatja, hogy hány darab karaktert tartalmazhatnak az egyes adatok.

Tizedesjegyek (Decimals): megmutatja, hogy a tizedesvessző után hány darab karaktert jelenik meg.

Címke (Label): itt megadhatjuk a változó hosszabb, informatívabb leírását, mely hasznos lehet, ha később elővesszük az adattáblánkat.

Értékek (Values): kódolhatjuk milyen értékeket (Value) vehet fel az adott változó. Ehhez jelentést is hozzá lehet rendelni, ahol megcímkézed (Label) az egyes értékeket. Ha statisztikai elemzést akarunk csinálni a nemi arányokról, a string típusú „nő” és „férfi” helyett érdemes „1” és „0” értékeket beállítani. Ezzel már végezhetünk leíró statisztikát.

Hiányzó értékek (Missing): Amennyiben rendelkezünk hiányzó értékekkel, (pl. nem mindenki szívesen adja meg a havi keresetét), beállíthatunk egy, az adatok hiányát mutató értéket. Ez feltétlenül egy olyan szám legyen, amely nem szerepelhet az adataink között. Gyakori konvenció a 999 vagy 9999, de bármit választhatunk.

Oszlopok (Columns): az oszlop szélességét adja meg „Data View” nézetben.

Zártság (Align): jobbra, balra vagy középre zárt pozícióba helyezi az értékeket.

Mérési szint (Measure): itt állíthatjuk be a korábbiakban már tárgyalt skála típusokat (nominális, ordinális, skála).




Példa SPSS-ben


Bizonyos esetekben a rendelkezésre álló adathalmaz még nem megfelelő a statisztikai próbák végrehajtására. Előfordulhat, hogy: • módosítani kell a változó típusát vagy mérési szintjét • új változókat kell kiszámítani a meglévő adatok alapján • nem a teljes adattáblára vonatkozó számításokat akarunk végezni Az SPSS több lehetőséget is kínál az adatok finomhangolására, módosítására, a velük való műveletekre. Az alábbiakban ezeket a műveleteket fogjuk sorra venni. Elsőként az SPSS „Transform” menüjének tartalmát vesszük sorra. Compute Variables: új változók létrehozását teszi lehetővé a már meglévő változók és matematikai műveletek kombinálásával.

Split file: egy meghatározott változó alapján csoportokra bonthatjuk az adathalmazunkat. A segítségével csoportokat képezhetünk, melyeket az elemzés során összevethetünk egymással. Például nem szerint nőkre és férfiakra bonthatjuk a mintánkat.

Select Cases: segítségével egyes eseteket, személyeket lehet ideiglenesen (vagy véglegesen) kivonni az elemzés alól. Amennyiben alkalmazzuk, úgy a nem használt értékek a „Data View” nézetben áthúzásra kerülnek.

Weight Cases: ebben a menüpontban az esetek súlyozását végezhetjük el, vagyis egyes alul vagy felülreprezentált értékek súlyát módosíthatjuk pozitív vagy negatív irányba.

Recode Into Same Variables: az „Átkódolás” során a már létező változóink kódolását írhatjuk felül. Ezzel a művelettel nem egy új változó fog létrejönni, hanem a már meglévő változó módosul véglegesen.

Recode Into Different Variables: ebben az esetben az átkódolás új változót fog eredményezni, vagyis az eredeti változó megmarad.




Példa R-ben


Ez a menüpont még nem elérhető, kérlek látogass vissza később!





data2.png

Változók, oszlopban

Egyedek, sorban