LEÍRÓ STATISZTIKA

Ajánlott könyvek

Andy Field: Discovering Statistics Using SPSS
Barna Ildikó – Székelyi Mária: Túlélőkészlet SPSS-hez
Sajtos László – Mitev Ariel: SPSS kutatási és adatelemzési kézikönyv

Letölthető adatfájlok

Standardizált adattábla - Minden statisztikai próbához - EXCEL

Standardizált adattábla - Minden statisztikai próbához - SPSS

Leíró Statisztika - SPSS

Please reload

Bevezető


Amikor statisztikával foglalkozunk, nem elég az egyes statisztikai próbák ismeretére szorítkozni. A módszertani alapfogalmak elsajátításával meghatározhatjuk, milyen mutatókat számolunk ki, vagy hogy milyen módon nyerjük ki eredményeinket az adathalmazunkból. Az alábbiakban bemutatunk néhány ilyen alapvető jelentőségű fogalmat, a legfontosabb középértékeket és szóródási mutatókat. Azok számára, akik már ismerik ezeket a fogalmakat egy táblázatot biztosítunk, mely röviden összegzi, milyen mérési szint szükséges az adott mutató alkalmazásához, valamint, hogy mikor melyiket érdemes alkalmazni. A középértékek és az általános statisztikai mutatók együtt jelentik a leíró statisztikát. 

 

Skálatípusok


Az általunk megfigyelt jelenségeket először mérhetővé, illetve statisztikai módszerekkel elemezhetővé kell tennünk. A számszerűsített adatok (változók) esetében különböző mérési szinteket különböztethetünk meg, amely a későbbiekben hatással lesz arra, hogy mely statisztikai módszereket alkalmazhatjuk adatainkon.

Fontos ismeretanyag!

 

A változók jellemzése és bemutatása grafikusan

A dolgozatok és tudományos jellegű munkák egyik "alapkelléke" az adatainkat jellemző grafikon, grafikonok. Ennek célja az, hogy a lehető leghahatékonyabb módon mutassa be az adatsorainkat, továbbá a megértést és a lényeg kiemelését is könnyebbé teszi. Azonban a különböző adattípusok eltérő ábrázolási módot kívánnak meg. A korábban már bemutatott diszkrét (azaz kategorikus) változók másképp kerülnek prezentálásra, mint a folytonos változók. További lehetőséget és pontosítást láthatunk akkor, ha az adatainkat nominális, ordinális és metrikus mérési szintekre osztva szeretnénk ábrázolni. Ezekre vonatkozóan tekintsünk meg néhány példát:  

Az oszlopdiagramok (bal) és a kördiagramok (jobb) alkalmasak arra, hogy számszerű gyakoriságot vagy százalékos értékeket jelenítsünk meg. A százalékos érték a gyakoriság egy formája, az ún. relatív gyakoriság. Ennek az értéknek a meghatározása a százalékszámítás egyszerű módszerével történik, vagyis az adott értékrészletet elosztjuk a teljes értékkel és a kapott törtet megszorozzuk százzal (100). Az oszlop- és kördiagramok a kategorikus (és nominális) változók esetében használható leginkább, hiszen ezek a változók diszkréten, néhány értéket vehetnek fel, a megjelenítésük ebben a formában könnyű. Képzeljük el egy harminc fős osztály egyéni magasságértékeit oszlopdiagramon vagy kördiagramon ábrázolva. Túlságosan zsúfolt és nehezen értelmezhető lenne az eredmény.

Histogram_with_Distribution_Curve_04.png

A folytonos változók megjelenítésére leginkább alkalmas forma az ún. hisztogram készítése. Ránézésre nagyon hasonlít egy oszlopdiagramra, azonban bizonyos tulajdonságai eltérőek. A leginkább szembetűnő különbség, hogy intervallumokba lehet rendezni a folytonos értékeket és ezekben az intervallumokban jelöljük az "y" tengelyen megjelenő frekvenciát vagyis azt, hogy abban az intervallumban hány darab elemszám található. Egy teljes mérési intervallumban, amely az "x" tengely legelső és legutolsó értéke között mozog, általában meg tudunk állapítani egy átlagot (a képen ezt jelöli a mean, 60,7 értékkel). Az átlag értéke egy képzeletbeli Gauss-görbe (vagy normál görbe) csúcsa. Ha a hisztogramunk követi ezt a formát, akkor az eloszlásunk szimmetrikus (vagy másnéven paraméteres) eloszlású.

 
Schematic-representation-of-basic-types-

A hisztogramok remek lehetőséget adnak a folytonos adatsor gyors becslésére, amely mellett a számszerű statisztikai adatok átgondolása is szükségszerű! Azt is látjuk, hogy amikor a leggyakrabban előforduló érték (medián) és a minta átlaga megegyezik vagy közel azonos, akkor a minta eloszlása a leginkább szimmetrikus és egycsúcsú (a). Olyan eset is előfordulhat, amikor a mintának két módusza van (b), ezt multimodálisnak nevezzük, amely lehet szimmatrikus és kétcsúcsú (b) vagy aszimmetrikus és kétcsúcsú (c). Ha azt tapasztaljuk, hogy a legtöbb érték a skála elején (első felében) található, akkor a hisztogram jobbra ferde (e), ennek ellentéte lehet, ha a hisztogram balra ferde. Ez mit jelent? Az első esetben az értékek javarésze (leggyakrabban előforduló értéke, tehát módusza) az alsó, míg a második esetben a felső adattartományba esik. 

Fontos ismeretanyag!

Középértékek

 

A középértékek az adataink értéknagyságának centrumát fejezik ki, azaz az értékek csoportosulását egyetlen számmal fejezik ki. A módszertani fejezetben is beszéltünk róla, illetve itt is megemlítettük a három különböző változótípust. Ezek közül a középértékek tekintetében más-más mutatókat használunk. Ha megismertük a három változótípust, majd azonosítottuk a középértékeket, akkor megérthetjük, hogy melyik skálatípus miért és melyik középérték kiszámítását vonhatja maga után.

Milyen a nők és férfiak aránya a csapatban?

Táblázat: Skálatípusok és mérési szintek

Az alábbi táblázat megmutatja, hogy az egyes mérési skálákra milyen középértékeket érdemes és kell alkalmazni. A belátást megkönnyíti, ha magabiztosan ismerjük mind az átlag, a módusz és a medián fogalmát. Általánosan elmondható, minél "magasabb" a mérési szint, annál több középértéket használhatunk

Szóródási mutatók és terjedelem

A szóródási mutatók azt mérik, hogy az adott értékek mennyire koncentrálódnak a középérték körül, az ingadozás mértékét fejezik ki egy számmal. 


A terjedelem a legnagyobb és legkisebb elem közti különbséget írja le. Ennek a mutatónak csak olyan skálák esetében van értelme, ahol az elemek sorrendbe állíthatók, nagyságuk pedig megállapítható. Ilyenek a metrikus skálák.

Fontos ismeretanyag!