Pradinis » Apie statistiką » Ar atskirtumėte kitokią arbatą?

Ar atskirtumėte kitokią arbatą?

– Nusikalstamų veikų šį mėnesį, palyginti su praėjusiu, padaugėjo, bet tai nėra statistiškai reikšmingas pokytis, – žurnalistui kalbėjo statistikas.

– Jūs norite nuo visuomenės nuslėpti, kad nusikaltimų skaičius auga? – iš karto padarė išvadas žurnalistas.

Esate girdėję ką nors panašaus?

Statistikams bendraujant su žiniasklaida tai išgirsti pasitaiko gan dažnai. Todėl bandysime paaiškinti, kas tas reikšmingumas statistikoje. Jį puikiai iliustruoja Beno Ambridge pasakojimas knygoje „Psy-Q“. Beje, rekomenduojame paskaityti šią knygą. Joje su puikiu humoru aprašomi ir analizuojami įvairūs moksliniai, psichologiniai ir socialiniai tyrimai. Atskleidžiama, kaip kartais dėl įvairių priežasčių paskelbiamos visiškai klaidingos išvados. Puiki akiratį praplečianti ir kritinį mąstymą ugdanti literatūra.

Arbatos testas*

Photo by Burst on Pexels.com

Kai augau pietryčių Anglijoje, mūsų namuose dažnai pasigirsdavo: Benai, prašyčiau puodelį arbatos; tik pirmiau įpilk pieno. Iki pat šios dienos motina dievagojasi, kad arbata kur kas skanesnė, jei pieno įpilame prieš pildami arbatą, o ne po to, ir nuolat įtariai gurkšnoja kiekvieną jai pasiūlytą puodelį arbatos, siekdama išsiaiškinti, ar jos pageidavimo buvo paisoma. Nors mano motina paprastai pastebi mano pastangas ją pergudrauti pateikiant arbatą, į kurią pieno įpilta vėliau (veikiausiai dėl mano prasikaltusios veido išraiškos), aš gana skeptiškai žiūrėjau į jos tvirtinimą, esą ji iš tiesų gali pastebėti skirtumą. Garsus biologas seras Ronaldas Fisheris (1890–1962) patyrė panašią situaciją su savo kolege daktare Muriel Bristol-Roach ir tai jam taip pat kėlė įtarimų. Užuot bambėjęs po nosimi ir atsisakęs ruošti arbatą, Fisheris sukūrė statistinį testą, kuriuo kartą ir visiems laikams galėjo išspręsti šį klausimą, taigi jis sukūrė tikslųjį Fišerio testą. Fischeris pateikė Bristol-Roach aštuonis puodelius arbatos, teigdamas, kad keturiuose iš jų pieno buvo įpilta prieš įpilant arbatą, o keturiuose po, ir paprašė jos pasakyti, kuriame puodelyje kaip yra.
Viskas labai gerai, bet kur čia ta statistinė duomenų analizė? Tarkim mūsų ragautoja keturis puodelius atspėjo, o keturių ne (t. y. 50 proc. tikslumu). Ar galėtume padaryti išvadą, kad ji gali atskirti, į kurią arbatą pieno buvo įpilama iš pradžių, o į kurią vėliau? Žinoma, ne. Nesunku įsitikinti, kad žmogus, kuris paprasčiausiai metė monetą dėl kiekvieno puodelio, gali pusę atspėti grynai atsitiktinai. Kas, jei ji atspėjo penkis, o dėl trijų suklydo? Tokiu atveju ir vėl nepultume galvos guldyti, kad ji iš tiesų gali atskirti, nes mūsų monetų mėtytojui reikėtų šiek tiek didesnės nei vidutinės sėkmės, kad gautų tą patį rezultatą. O jei šeši teisingai, o du ne? Septyni teisingi, o vienas ne? Visi aštuoni teisingi?
Kelis puodelius mūsų ragautoja turi nurodyti teisingai, kad padarytume išvadą, jog ji tikrai gali atskirti ir tai nėra sėkmingas atsitiktinumas?
Fišerio testas kaip tik ir yra skirtas atsakyti į šį klausimą. Pasirodo, tikimybė visus aštuonis visiškai atsitiktinai atspėti teisingai, pasitelkus monetos mėtymo metodą yra 1 iš 70**. Mokslininkai tai vadina p (angl. probability „tikimybė“ trumpinys) reikšme. Mes niekada negalime visiškai atmesti galimybės, kad konkretų rezultatą – pavyzdžiui, kad teisingai įvardinami visi aštuoni puodeliai – nulėmė vien atsitiktinumas; mūsų monetos mėtytoją galbūt lydėjo neįtikėtina reikšmė. Taigi, mokslininkai sutarė dėl „nykščio taisyklės“, tai yra kad p<0,05: jei (a) tikimybė, kad konkretus rezultatas (pavyzdžiui, kad visus aštuonis puodelius atspės teisingai) įvyks vien dėl atsitiktinumo, yra mažesnė nei 1 iš 20 (t. y. 0,05) ir (b) šis rezultatas gaunamas, o mes laikomės prielaidos, kad jis beveik neabejotinai įvyko ne dėl atsitiktinumo. Tai yra mes laikome, kad rezultatas yra statistiškai reikšmingas.

Metas apibendrinti mūsų arbatos ragavimo pavyzdį. Ogi nutiko taip, kad daktarė Bristol-Roach iš tiesų teisingai įvardino visus aštuonis puodelius. Kadangi tikimybė visus aštuonis grynai atsitiktinai įvardinti teisingai yra 1 iš 7 (p=0,014) yra akivaizdžiai mažesnė nei mūsų galutinė riba – 1 iš 20 (t. y. p<0,05), sutinkame, kad tokie rezultatai negalėjo būti gauti visiškai atsitiktinai ir, kad… prašom iškilmingai mušti būgnais… ji iš tiesų galėjo atskirti, ar pienas buvo įpiltas prieš arbatą, ar po to. Vienas nulis mano mamos naudai.

Dabar, kai jau viską žinote, galite surengti savo arbatos ragavimo turnyrą namuose. Nemėgstate arbatos? Na, galbūt norėtumėte išsiaiškinti, ar galite atskirti „Pepsi“ nuo „Coke“, dietinius gėrimus nuo įprastų, garsių gamintojų bakalėjos prekes nuo parduotuvių tinklų užsakymu pagamintų atitikmenų ar net – pasiūlymas tik suaugusiems – atskirti raudonąjį vyną nuo baltojo (nepaprastai sudėtinga, ypač jei abu atšaldyti). Tik nepamirškite, turite pataikyti aštuonis kartus iš aštuonių, kad statistiškai reikšmingai įveiktumėte atsitiktinumo galimybę. Jei esate labai ištroškę ir padidinsite bandymų skaičių iki dešimties, jums pakaks teisingai pataikyti 9/10 (taip pat prireiks labai daug kokakolos ir stiprios šlapimo pūslės).

Galiausiai svarbu įsisąmoninti, kad sumanymas testuoti, ar aiškiai reikšmingi skirtumai tarp grupių galėjo atsirasti visiškai atsitiktinai – o tai, savaime suprantama, yra daroma visose mokslo srityse – dar nepasiekė visuomenės sąmonės. Laikraščiai visada kaip reikšmingus pateikia menkučius skirtumus tarp grupių, kurie, labai tikėtina, yra visiškai atsitiktiniai. Dar blogiau, teko matyti laikraščiuose straipsnius, kuriuose tyrėjų pareiškimas, kad, pavyzdžiui, labai mažas nusikalstamumo lygio padidėjimas nėra „statistiškai reikšmingas“, vaizduojamas kaip neobjektyvi vienašališka mokslininko,. Pasiryžusio nuslėpti tiesą, argumentacija. Tiesa ta, kad jei nusikalstamumo lygio „padidėjimas“ nėra statistiškai reikšmingas, nėra priežasties manyti, kad nusikalstamumo lygis apskritai pasikeitė.

Taigi, pasak vyraujančių stereotipų, visur vien melas, prakeiktas melas ir statistika. Tačiau bjauriausias melas pateikiamas ne pasitelkus statistiką, bet kai jos nepaisoma.

*Ben Ambridge „PSI-Q“

** Kodėl 1 iš 70? Nes egzistuoja septyniasdešimt skirtingų būdų išsirinkti keturis puodelius iš aštuonių ir tik vienas jų leidžia teisingai įvardyti keturis puodelius, kur pienas buvo įpiltas iš pradžių.

Parašykite komentarą

Įveskite savo duomenis žemiau arba prisijunkite per socialinį tinklą:

WordPress.com Logo

Jūs komentuojate naudodamiesi savo WordPress.com paskyra. Atsijungti /  Pakeisti )

Google photo

Jūs komentuojate naudodamiesi savo Google paskyra. Atsijungti /  Pakeisti )

Twitter picture

Jūs komentuojate naudodamiesi savo Twitter paskyra. Atsijungti /  Pakeisti )

Facebook photo

Jūs komentuojate naudodamiesi savo Facebook paskyra. Atsijungti /  Pakeisti )

Connecting to %s