STATISZTIKAI ALAPPROBLÉMÁKRÓL RÖVIDEN

 
Used Books

Ajánlott könyvek

Barna Ildikó – Székelyi Mária: Túlélőkészlet SPSS-hez
Andy Field: Discovering Statistics Using SPSS
Sajtos László – Mitev Ariel: SPSS kutatási és adatelemzési kézikönyv

BEVEZETŐ

Mint a korábbiakban írtuk, a statisztika az ésszerű bejóslás tudománya és bizonyító eszköze. Ennek ellenére néhány alapproblémával itt is találkozhatunk. Előbb azonban olvassuk el az Index.hu cikkét a baseball labdákról:

„Bizarr dolgok történnek a baseball-labdákkal

Két lehetséges magyarázat van arra, mitől ugrott ésszerűtlenül magasra a hazafutások száma az amerikai baseball-bajnokságban: vagy 750 játékos kezdett el ugyanazon a napon, ugyanolyan hatékony, de kimutathatatlan doppingszert szedni, vagy 2015 nyara óta sokkal rugalmasabb, és valamivel kisebb labdákkal játszanak. Előbbi lehetetlen, utóbbit a liga és a gyártó is tagadja.

Az elmúlt 2 évben több hazafutást ütnek az MLB-ben, vagyis az amerikai baseball-bajnokságban, mint valaha, beleértve ebbe az 1995-2005 közötti ész nélküli doppingérát is. A meccseket sokkal látványosabbá tevő fejlemény pont kapóra jött a liga vezetőinek, a 2015 elején kinevezett új főtitkár, Rob Manred ugyanis pont a meccsek romló minőségén szeretett volna javítani.

Hogy értsük, miről is van szó, íme néhány számadat:

• A New York Yankees újonca, Aaron Judge június közepén hosszabb hazafutást ütött, mint korábban bárki az amerikai profi ligában. A július eleji All-Star-szünetig összesen 30 hazafutásig jutott, ami minden idők második legmagasabb száma, nem csak az újoncokat, hanem a teljes mezőnyt nézve.

• Előtte kevesebb mint egy héttel Scooter Gennett (Cincinnati Reds) egy meccsen ütött rekordot jelentő 4 hazafutást.

• Júniusban összesen 1101 hazafutást ütöttek az MLB-ben, ez 32-vel döntötte meg az eddigi, 2000 májusában felállított rekordot.

• A jelenlegi mutatók alapján majdnem 500 hazafutással dől majd meg az eddigi szezoncsúcs, a 2000-ban felállított 5693-as szám.

• Az All-Star-meccsig 30 hazafutást ütő Aaron Judge az egyik legnagyobb haszonélvezője annak, ami történik

• Az All-Star-meccsig 30 hazafutást ütő Aaron Judge az egyik legnagyobb haszonélvezője annak, ami történik

Minden idők legjobb átlagteljesítményét a 2000-es szezonban hozták össze, akkor 1,17 hazafutás volt átlagosan meccsenként, emögött szorosan jött az eggyel korábbi idény a maga 1,14-es mutatójával. A tavalyi szezon a kettő közé szúrt be 1,16-tal, idén viszont egészen elképesztő, 1,26 hazafutást tapasztalunk átlagosan meccsenként.

Egy a baj: senki nem tudja, mitől lett hirtelen eszement sok hazafutás, az egyetlen értelmes magyarázatot pedig kategorikusan cáfolja az MLB. (A számok némileg csalókának tűnhetnek, a hivatalos MLB-statisztikákban ugyanis a csapatonként lejátszott meccsek számát veszik alapul, tehát harmincszor veszik a 162 mérkőzést, vagyis mindet duplán számolják, így valójában pont dupla annyi hazafutást ütnek meccsenként.)

Magyarázatból egyébként három lehetséges van, ebből egy teljesen légből kapott, egy annyira sok összetevős, hogy lehetetlen bizonyítani (és így cáfolni is), egyet pedig, amit bizonyítottak is, az MLB nem hajlandó elfogadni, sőt, kikérik maguknak, hogy erről lenne szó. Nézzük is sorban ezeket!

Az egyik verzió szerint nagyjából 750 ütőjátékos kezdett el egyszerre szedni egy irtózatosan hatékony, mégis kimutathatatlan doppingszert. Ennek már alapból elhanyagolhatóan minimális a valószínűsége, úgy pedig főleg kizárható, hogy az MLB és a fiókligák között átmozgó játékosok ellenére az alsóbb ligákban nem látszik nyoma a titokzatos doppingnak, ott egyáltalán nem változott szignifikánsan a hazafutások száma.

A köztes megoldás az lenne, hogy olyan tucatnyi külső tényező egyszerre változott úgy, hogy azok mind a több és több hazafutás felé mozdították el a statisztikákat. Például az egyre gyorsuló dobások, a ligába évről évre bekerülő technikásabb újoncok játszhatnak ebben szerepet, illetve, hogy egyszerre minden ütőjátékos változtatott az eddigi mozdulatsorán, és teljesen új módszerrel, az eddigiekhez képest felfelé ütik el a labdát.

Ebben persze van is valami, amióta 2015-ben elkezdték a dobások sebessége mellett mérni a labda forgásszámát, az ütés sebességét és szögét is mérni, egyre több ütőjátékos dolgozik együtt statisztikusokkal, hogy előnyt szerezzenek az adatokból.

Viszont ezeket a tényezőket összeadva sem tűnik valószínűnek, hogy ez állna a háttérben, hiszen, mint már a dopping kapcsán írtuk, a fiókligákban nem történt ugrásszerű változás. Egyetlen olyan tényező van, ami jelentősen eltér az MLB és a fiókligák között: a labda, és szinte biztos, hogy ez változott meg 2015 nyarán, még ha a liga tagadja is. Az MLB labdáit az azokat Costa Ricában gyártó Rawlings szállítja, az alsóbb ligák labdái Kínában készülnek, vagyis ha a Costa Rica-i labdák kicsit megváltoztak, az megmagyarázná, miért látunk több hazafutást az MLB-ben, és az alsóbb ligákban miért nem. A jelenségre először a 2016-os szezon indulása előtt figyelt fel az ESPN statisztikai aloldala, a FiveThirtyEight. Ők három lehetséges okot vizsgáltak meg, miután több csapatvezetővel is beszéltek:

• az átlagosnál melegebb időjárás, illetve az ez által okozott ritkább levegő,

• erősebb, ügyesebb újoncok,

• rugalmasabb labdák.

Ekkor még csak félszezonnyi adatból dolgozhattak – a változás ugyanis a nyári All-Star-szünet után kezdődött, de az időjárási tényezőt így is gyorsan kizárták, miután a fedett arénákban ugyanakkora elmozdulást találtak, mint a nyitott pályákon. Az újoncok teljesítménye sem győzte meg őket. Maradtak a labdák, már csak azért is, mert a nyári szünet során tölti fel a legtöbb csapat a kiürült készletét, vagyis ekkor kerülhetnek be a korábbitól eltérő tulajdonságúak a vérkeringésbe. Ezeket elküldték egy független laboratóriumba bevizsgálni, de itt is arra jutottak, hogy semmi drasztikus változás nem történt, a 2015-ben használt labdák átlagosan három ezrelékkel voltak ruganyosabbak a korábbiaknál, ami elhanyagolható.

Második felvonás

A FiveThirtyEight azzal zárta a 2016-os szezon előtti cikkét, hogy félszezonnyi adatból nem tudnak biztos következtetés levonni, így nyáron újra megvizsgálták az adatokat, arra jutva, hogy bármi változás is történt, az csak a profikra igaz, a fiókligákban ugyanis nem ugrott fel a hazafutások száma. Vagyis az időjárás kilőve, és félig az újoncok is, abban ugyanis nem sok ráció van, hogy a profik közé vágyó tehetség pont azon a platformon fogja, gyengébb ellenfelek ellen fogja vissza magát, ami alapján felkerülhet a profik közé. Megcáfolhatatlan bizonyítékot ekkor sem találtak semmire, ám mivel továbbra is a labdára gyanakodott a szerzőpáros, Ben Lindbergh és Rob Arthur, ezeket vetették még komolyabb vizsgálat alá. Erre már csak azért is jó okuk volt, mert az MLB labdákat bevizsgáló UMass-Lowell laboratórium 2000-es tanulmányában azt találta, hogy elméletileg előfordulhat két olyan labda, amik megfelelnek a hivatalos előírásoknak, ám az egyiket 49,1 lábbal (15 méterrel) messzebbre lehet elütni teljesen azonos körülmények között, mint a másikat.

Nevetségesen tág határok

A legelfogadhatóbb magyarázatot a fenti cikkek kapcsán már emlegetett, a FiveThirtyEighttől azóta már a The Ringerhez igazolt Ben Lidbergh és Mitchel Lichtman tanulmánya adja, aminek alapja Lichtman labdakísérlete volt – akit érdekel ennek a menete, az a legördülő blokkban találja a kísérlet leírását. Lindbergh korábban arra jutott, hogy a labda változása a legvalószínűbb magyarázat, ami már önmagában elegendő lett volna a kísérlethez, ám azzal kiegészítve, hogy minimális minőségváltozás óriási eltérést hozhat a végeredményben, duplán indokolttá tette, miért ezen a vonalon kutakodtak. Az ütés hosszúsága, vagyis közvetve a szerzett pontok és hazafutások mennyisége ugyanis a labda ruganyosságán, átmérőjén, tömegén, a labdán található varrás magasságán, és részben az ütés/lendítés, illetve dobás erején múlik. Persze ezeken is, de egy 1 mérföld/órával erősebb dobás minimális pluszt jelent, tehát egy méterekkel nagyobb ütéshez annyival erősebb dobások kellenének, amiket nem tapasztalni a korábbiakhoz képest.

Hogy a labda minimális változása mekkora eltérést jelenthet, azt jól mutatja, hogy amikor az egyetemi bajnokság 2014 és 2015 között új labdára váltott, drasztikusan emelkedtek a hazafutások számai: a csapatok olyan labdákat kaptak, amiken a varrások 0,4 milliméterrel laposabbak lettek, ez pedig átlagosan 6 méterrel hosszabb ütéseket eredményezett. Lichtman a vizsgálat végén arra jutott, hogy a 2015-ös nyári szünet előtt és után használt labdák elütési sebessége között átlagosan 1,43 mérföld/órás (2,3 km/h) eltérés is lehet (a labdák kisebb átmérője, a laposabb varrás és a ruganyosabb összetétel miatt). Egy független, 2016-os elméleti számítás arra jutott, hogy 1,5 mérföld/órás változás megmagyarázhatja a nagyjából 11 százalékos hazafutás-növekedést, vagyis nagyjából helyben is volt.

Ugyanez a kutatás azt hozta ki, hogy a labdák ruganyosságára használt úgynevezett COR-mérőszám 0,012-es eltérése gond nélkül eredményezheti a 2015 és 2016 közötti ugrást – ezzel szemben az, hogy az MLB 0,514 és 0,578 közötti COR-mutatójú labdákat tekint játékra alkalmasnak, nevetségesnek tűnik, ez ugyanis nem 0,012-es, hanem 0,062-es, tehát ötször akkora hibahatárt vesz elfogadhatónak. Az is csoda tehát, hogy nem minden ütés végén a lelátón kötnek ki a labdák.

Az MLB tagad, bár nem lenne mit

Lindberghék többször is megkeresték a ligát, hogy biztosan nem módosítottak-e semmit a használt labdákon, de mindig ugyanazt a választ kapták: a liga semmit nem módosított, és minden labda, ami játékba kerül, az elfogadható követelményeken belülre esik. Ezt július elején hivatalos közleményben is megerősítették, mind a 30 csapatnak kiküldtek egy jelentést, amiben az áll, hogy az összes használt labda a határértékeknek megfelelő, és semmi nem utal arra, hogy a labdákkal olyan történt volna, ami a játékot befolyásolná. Csak hogy érthetetlen módon a 2017-es labdákat a 2016-osokkal hasonlították össze, miközben a törés 2015 közepén volt.

Bár a fenti adatok alapján úgy tűnhet, hogy lapítanak, valójában könnyen lehet, hogy mindkét félnek igaza van. Az MLB ugyanis a 2000-ben bevezetett minőségellenőrzés során nem a Lichtman által felkért Sports Science Lab módszerét, hanem annál jóval pontatlanabb rendszert használ, lassabban is lövik ki a labdákat, és azokkal nem az ütőt helyettesítő hengert, hanem lapos felületet céloznak meg. Nem is ez a fő gond, ugyanis érezhető problémát jelentettek az MLB-ben az egyre kevesebb pontot hozó, így egyre kevésbé élvezhető meccsek. Vagyis releváns lépés lett volna a liga részéről, ha javítanak a támadójátékon, Manfred ezt is akarta elérni, de később igazolták, hogy sem ők, sem a gyártó nem nyúlt tudatosan a labdákhoz. Ez már csak azért is furcsa, mert bár a hibahatár nagy, semmi nem indokolja, hogy hirtelen folyamatosan az egyik – pont a ligának kedvező – véglet felé tendáló, de még legális labdák kerüljenek a csapatokhoz bármiféle ellenőrzött beavatkozás nélkül.

A vízhólyag a koronatanú?

Júliusban újabb, váratlan bizonyíték merült fel, amik a labdák érintettségét bizonyítják, nevezetesen az, hogy rekordszámú meccset hagynak ki a dobójátékosok a tenyerükön megjelenő vízhólyagok miatt. Bár az ilyen típusú sérülésekre nincs tökéletesen pontos adatbázis, a bejelentett esetek alapján az látszik, hogy 2016-ban és 2017-ben legalább kétszer annyi napot hagytak ki vízhólyag miatt a dobójátékosok, mint 2007 óta bármikor.

Még ha hozzá is vesszük az adatokhoz, hogy a labdák fókuszba kerülése miatt tavaly és idén valószínűleg több vízhólyagot jelentettek be így, és nem egyéb sérülésként, illetve hogy az elmúlt másfél szezon vízhólyag-problémáinak majdnem harmada három játékosnál jelent meg, akkor is azt látjuk, hogy többet kerül elő ez a dobójátékosoknál, mint eddig. Vízhólyagot elég sok dolog okozhat egy dobójátékosnál, az, ahogyan fogja a labdát, az adott dobások típusa, vagy akár a varrás magasságának megváltozása – egy olyan tényező, ami bizonyítottan bekövetkezett 2015 nyara után. Abban viszont a játékosok, edzők és orvosi személyzet között sincs egyetértés, hogy magasabb vagy alacsonyabb varrás miatt lehet több vízhólyag – a magasabb varrás nagyobb súrlódást jelent, így ez is elfogadható, alacsonyabb varrás esetén viszont még erősebben kell rámarkolni a labdára, hogy ugyanazt a forgásszámot kihozzák a dobásból, tehát emiatt is lehetne ez a jelenség.

Ezek után kérdéses, hogy valaha kiderül-e, mi okozta és okozza 2015 közepe óta a rengeteg hazafutást. Egyelőre az marad, hogy élvezzük a minden korábbinál eredményesebb játékot.”


Forrás: https://index.hu/sport/2017/07/14/baseball_doppingolt_labdak/

 

VAGYIS?

A statisztikát használják a bírósági döntések befolyásolására is tárgyalások alkalmával, piackutatásban, a társadalomtudományokban és a természettudományokban. Mitől olyan egyetemleges a statisztika? Nem biztos, hogy ez a legoptimistább válasz: talán mert nincs más eszköz a kezünkben a valóság hiteles újrabemutatására és ellenőrzésére. Nem kell sok statisztikai számolást megtekinteni ahhoz, hogy lássuk a statisztika bizonyos mértékig remek módszer, majd egy bizonyos szint felett már csak a véletlen és véletlen között próbál igazságot tenni.

Ilyen szempontból már a legelemibb szinteken találkozhatunk olyan jelenségekkel, melyre a statisztikusok többsége is csak megrándítja a vállát és azt mondja, hogy ezzel kapcsolatban ők sem tudnak többet mondani. A szignifikanciapróbák, korrelációk és ingadozó értékek világában azt hihetnénk, hogy maradéktalanul hihetünk az adatoknak és eredményeknek, azonban ez koránt sincs így. Amennyiben például egyszerű modellalkotás következtében mért kutatás eredményeit vesszük szemügyre, mondhatjuk, hogy kevés a hibázás lehetősége, ugyanis az egyszerű modellünk kevés változóval rendelkezik az ok-okozati kapcsolatok pedig közöttük, éppen az alacsony változók számával magyarázva, alig megküzdhetőek. De mi történik akkor, amikor a modell egyszerűsége rejti a buktatót is? Felmerülhet, hogy számos olyan tényezővel nem számolunk vagy egyáltalán nem is tudunk róla, amely befolyásolhatja a modellünket és vele együtt a statisztikánkat. A helyzet a fordítottja akkor, ha nagyon sok változó hatását próbáljuk felderíteni és magyarázatot szolgáltatni egy jelenségre. A jól ismert mondás kicsavart változata illene ide: nem látja az erdőtől a fát. Sajnos sosem tudunk maradéktalanul tökéletes statisztikát alkalmazni, de törekedhetünk arra, hogy a saját részünkről kiszűrjük a mérési és értelmezési hibákat és csökkentjük a véletlenből származó tényezőket. A véletlen és a köré épülő statisztika igencsak jó becslést adhat számunkra.

Olyan kutatással is találkozhatunk majd, ahol bár érezzük, hogy az általunk vizsgálni kívánt jelenség valamilyen jó irányt mutat és vélhetően létezik, mégsem tudjuk bizonyítani. Mit tehetünk? Vagy lecseréljük az általunk használt változókat vagy újrafogalmazzuk a kutatásunkat, végezetül fel is adhatjuk a mérést és a kutatást. A változók újrafogalmazása és cseréje jelen esetben tartalmazza az adatok szigorúbb szűrését és olyan szintű transzformációját is, amely végül szintén torzíthat a valóságon. Egy egyszerű példával élve: látjuk, hogy a vizsgált populációnk az általunk vizsgált jelenséget nem támasztja alá, a metrikus változóink mindegyike követi a normalitást, összegészében semmilyen oka nincs annak, hogy kizárjunk bizonyos elemeket a kutatásból. Mindazonáltal a kutatási eredményeink 30 főt tartalmaznak és találomra kivett 5 ember - annak ellenére, hogy nem lógnak ki a mintából - mégis szignifikánssá teszik a kutatási modellt! Vélhetően az adathalmazok tengerében valahol van egy olyan hatás, amivel még nem számolunk, de mozgatja a kutatásunk értékeit. Ha mégsem akarunk több energiát eltölteni annak a felderítésével így felhasználjuk a megmaradó 25 emberre kalibrált statisztikánkat, annak ellenére, hogy általában a nagyobb minta támogatja például a meglévő hatások felerősödését és vélhetően kiegyenlíti a különbségeket, amit az alacsony mintánk tartalmaz. 

Ez azonban felvet egy újabb problémát:

A szignifikancia kifejezés bár nagyon populáris a kutatásink során, mégsem egyértelmű fogalom. Amennyiben 5%-os szignifikancia szint mellett kapunk pozitív eredményt, akkor a kutatásunk szignifikáns lehet. Ennek értelmezése alapján a mintánk 5%-a esik egy olyan eseménytérbe, mely a véletlenségen alapul, a maradék 95% mögött rendszeresség húzódhat meg.  Érzékelhetjük, hogy minél alacsonyabb ez az érték, annál biztosabb, szignifikánsabb valamilyen eredmény. Ám hogy lehet, hogy valami csak ennyire, más pedig annyira szignifikáns? Mit tehetünk akkor, ha egy változó ki- és bekapcsolásával változnak a szignifikancia értékek? Ki kell-e őket vennünk azért, hogy sikeres legyen a kutatás? Egy másik jelenség az "együttjárási" mutatók esetében jelenik meg: korrelációt fedezhetünk fel logikailag értelmetlen tényezők között, míg a nyilvánvalónak tűnő adatsorok között a korreláció szintje hallatlanul gyenge lehet. Ezek olyan jellegű alapproblémák, melyet a statisztika és eszköztára orvosolni tud. Ennek ellenére mégis lesznek olyan eredményeink, amelyekkel nehezen tudjuk majd meglágyítani azok szívét, akik hatalmas eredményekre számítanak egy-egy kutatást illetően. Illetve itt megint szubjektív megítélésünkre kell támaszkodnunk, hogy mire van szükségünk: egy korrekt tudományos munkára vagy egy verseny helyezésre. Az ún. szignifikanciavadászat jelensége ma is sok problémát okoz a tudományos világban. Ennek a problémának az orvosolására néhány szaklap már előre bekéri a publikálni kívánt kutatás módszertani leírását, hogy a készülő kutatást az elsődleges terveknek megfelelően végezzék el, ne történjen rajtuk utólagos manipuláció.

Mindazonáltal, hogy a statisztika néhány alapproblémáját szemügyre vettük, szeretnénk jelezni, hogy ettől még a statisztika igenis remek dolog, ám megvannak a maga korlátai. Ennek fényében érdemes űzni és átgondolni a vele kapcsolatos teendőket.