Keresés
  • StatOkos

Az átlagkereset és az átlag kérdőjeles köszönőviszonya

Frissítve: 2018. dec 9.

A Központi Statisztikai Hivatal 2018. júniusi jelentése szerint ,,Nemzetgazdasági szinten az átlagos nettó kereset családi kedvezmény nélkül 219 200 forint volt, a kedvezményt is figyelembe véve pedig 227 700 forintra becsülhető."


Nem érzed reálisnak? Nem vagy vele egyedül. Olyan változók esetén, amik nem felelnek meg a normáleloszlásnak (a kereset tipikusan ilyen), illetve ahol előfordulnak kiugró értékek (Pl.: kevés, nagyon magas keresettel rendelkező személy) ott az átlag nagyon keveset árul el a teljes populációról. Ilyen esetben érdemes más középérték mutatókat (módusz, medián), illetve egyéb leíró statisztikai adatokat (terjedelem, szórás, alsó és felső kvartilis, etc.) is kiszámítani, hogy teljes képet kapjunk arról, amit vizsgálunk (jelen esetben tehát a magyarok keresetéről).


További probléma, hogy a KSH által közölt módszertan szerint a fent látható átlagkeresetet csak azoknak a személyeknek a bevételeiből számították ki, akik teljes munkaidőben dolgoznak, és be vannak jelentve. Ez tovább torzítja az adatokat, hiszen így azok, akik valószínűleg a legalacsonyabb keresettel rendelkeznek, mert részmunkaidőben dolgoznak vagy nincsenek bejelentve (ez általában nem a felsővezetőkre jellemző J) azok be sem kerültek a mintába. Ez azért fontos, mert így a KSH kimutatása nem a dolgozó magyarok keresetének leírását célozta, hanem egy ennél szűkösebb csoportot vizsgált, a jelentés címe ezzel szemben mégis azt sugallja, hogy a populáció a teljes lakosság volt. Ez olyan módszertani probléma, amelyre saját kutatásaink esetén is mindenképpen oda kell figyelnünk.


A keresetekkel és más, nem normális eloszlású adatsorokkal való munkára vegyünk egy egyszerű példát, ahol egy elképzelt lakosságot 100 fő reprezentál. Ha a 100 fő közül 20-an 80 ezer forintot, 20-an 100 ezret, 40-en 160 ezret, 15-en 300 ezret, 5-en pedig 1 millió forintot keresnek, akkor a középérték mutatók a következőképpen alakulnak:


Átlag: 195 ezer Ft
Módusz: 160 ezer Ft
Medián: 160 ezer Ft

Ebben az esetben elmondhatjuk, hogy az átlag a minta tagjai közül valójában senkit sem reprezentál igazán. Míg a mintha 80%-a, aki 160 000 Ft-ot, vagy annál kevesebbet keres, azt érezheti az átlagkeresetről szóló jelentést olvasva, hogy az irreálisan magas, addig a felső 20 vagy 5%-ba tartozók sem éreznék úgy, hogy a sajátjuktól nagyságrendekkel különböző 195 ezer forintos átlagfizetés bármit is elárulna az ő élethelyzetükről. Ilyen szempontból az átlagnál talán érdekesebb és árulkodóbb adat a módusz, vagyis leggyakrabban szereplő érték, ami kereset esetén nagyban elősegítheti, hogy a lakosság minél nagyobb százalékát reprezentálják az elkészített kimutatások-feltéve, hogy ez a célunk azok elkészítésével. Emellett a medián (vagyis a sorbarendezett adatok közül a középső érték) is fontos és beszédes lehet, hiszen ezt néhány kiugró érték még nem torzítja olyan mértékben, mint az átlagot.


A középérték mutatók egyszerű kiszámításánál azonban még hasznosabb, ha a fentihez hasonló adatsorok esetén boxplotot készítünk. Ehhez elsőként tekintsük át, hogy milyen adatokat jelenítünk meg egy boxploton, illetve hogy Excelben hogyan tudjuk azt elkészíteni.





Amint láthatjuk a boxploton a következő értékek szerepelnek: Minimum és maximum érték, alsó és felső kvartilisek, medián, kiugró, a többitől távol eső értékek (ezek mellett gyakran ábrázoljuk még az átlagot is, x jelöléssel). A boxplot elkészítése több okból is fontos és hasznos lehet. Egyrészt segíthet abban, hogy áttekintsük, milyen jellegű adatsorral van dolgunk, mennyire homogén/heterogén a minta, illetve a kiugró értékek eltávolítását is érdemes lehet megfontolnunk, így később az egyes próbák lefuttatásakor a teljes populációt tekintve pontosabb és relevánsabb eredményeket kaphatunk.

A boxplot Excelben való elkészítése a következőképpen zajlik: Jelöljük ki az adatsorunkat, majd a diagramok közül válasszuk ki a dobozos ábrát a következő helyen:



Amint a képernyőképen is látható, a boxploton ábrázolt adatokat külön is lekértem, ez elsősorban az átláthatóságot segíti, ugyanis az ábrán az adatok számszerűsítve, feliratként nem kerülnek megjelenítésre. A minimum, maximum, alsó és felső kvartilis, medián, átlag és terjedelem excelben való kiszámítását keresd a StatOkoson.




Az ábrán látható, hogy mind a 300 000 Ft-os, mind a 1 000 000 Ft-os fizetés kiugró értékként kezelendő, illetve azt is érdemes megfigyelni, hogy a medián és a felső kvartilis egyaránt alacsonyabbak az átlagnál. Azt gondolom, hogy a fenti adatok ismeretében már sokkal nagyobb bizonyossággal mondhatjuk, hogy feltártuk az elképzelt társadalom keresetének jellemzőit. Már nem csak annyit tudunk, hogy az átlagkereset 195 ezer Ft, de azt is, hogy a minta nagy részének keresete 160 000 Ft vagy annál kevesebb, de nem kevesebb 80 000 Ft-nál, illetve hogy bár vannak, akik ennél többet (300 000 vagy 1 000 000 Ft-ot) keresnek, ők azonban kisebbségnek tekinthetőek.


Összességében a következőket érdemes megjegyeznünk: Amennyiben a mintánkat csak a leíró statisztika segítségével szeretnénk bemutatni, sose hagyatkozzunk egyetlen értékre vagy mutatóra, kiváltképp, ha a vizsgált változó nem eloszlása nem felel meg a normáleloszlásnak. Ez egyrészt nagyon kevés, szinte semmit sem árul el arról a bizonyos esetekben igen nagyszámú adatról, amivel dolgoztunk, másrészt pedig, ahogy a fent bemutatott eset is jól példázza, gyakran torz következtetésekhez vezethet. Emellett a mintavétel során is fontos, hogy körültekintően járjunk el, és ügyeljünk arra, hogy a kutatásunkban használt minta valóban azt a populációt reprezentálja, amelyet vizsgálni szeretnénk. Amennyiben ez valamilyen okból nem valósulhat meg (pl: mert a populáció valamely csoportját nem tudjuk elérni) azt a publikáció során mindenképpen jelezzük, és kerüljük a félreértéseket, a címadáskor pedig fokozottak ügyeljünk arra, hogy ne vezessük félre olvasóinkat.


A cikk szerzője Alter Emese, a StatOkos munkatársa és az SPSS Guru szerkesztője



0 hozzászólás