Hipotezių tikrinimas yra būtina procedūra statistikoje. Hipotezių testas įvertina du vienas kitą paneigiančius teiginius, kad nustatytų, kurį teiginį geriausiai patvirtina imties duomenys. Kai teigiama, kad radinys yra statistiškai reikšmingas, tai yra dėl hipotezės testo.
Patikrinimo metodai
Statistinių hipotezių tikrinimo metodai yra statistinės analizės metodai. Paprastai lyginami du statistikos rinkiniai arba atrinktų duomenų rinkinys lyginamas su sintetinių duomenų rinkiniu iš idealizuoto modelio. Duomenys turi būti interpretuojami taip, kad jiems būtų suteikta naujų reikšmių. Galite juos interpretuoti darydami prielaidą tam tikrą galutinio rezultato struktūrą ir naudodami statistinius metodus prielaidai patvirtinti arba atmesti. Prielaida vadinama hipoteze, o šiam tikslui naudojami statistiniai testai – statistinėmis hipotezėmis.
H0 ir H1 hipotezės
Yra dvi pagrindinėsstatistinio hipotezių tikrinimo sąvokos – vadinamoji „pagrindinė arba nulinė hipotezė“ir „ alternatyvioji hipotezė“. Jie taip pat vadinami Neyman-Pearson hipotezėmis. Statistinio testo prielaida vadinama nuline hipoteze, pagrindine hipoteze arba sutrumpintai H0. Tai dažnai vadinama numatytosiomis prielaidomis arba prielaida, kad niekas nepasikeitė. Testo prielaidos pažeidimas dažnai vadinamas pirmąja hipoteze, alternatyvia hipoteze arba H1. H1 yra kai kurios kitos hipotezės trumpinys, nes apie ją žinome tik tiek, kad H0 duomenis galima atmesti.
Prieš atmetant arba neatmetant nulinę hipotezę, testo rezultatas turi būti interpretuojamas. Palyginimas laikomas statistiškai reikšmingu, jei mažai tikėtina, kad ryšys tarp duomenų rinkinių bus nulinės hipotezės įgyvendinimas pagal slenkstinę tikimybę – reikšmingumo lygį. Taip pat yra statistinių hipotezių tikrinimo tinkamumo kriterijai. Taip vadinamas hipotezės tikrinimo kriterijus, siejamas su tariamu nežinomo skirstinio dėsniu. Tai yra skaitmeninis empirinio ir teorinio skirstinio neatitikimo matas.
Statistinių hipotezių tikrinimo tvarka ir kriterijai
Dažniausi hipotezių atrankos metodai yra pagrįsti arba Akaike informacijos kriterijumi, arba Bajeso koeficientu. Statistinių hipotezių tikrinimas yra pagrindinis išvadų ir Bajeso išvadų metodas, nors šie du tipai turi reikšmingų skirtumų. Statistinių hipotezių testaiapibrėžti procedūrą, kuri kontroliuoja klaidingo sprendimo dėl neteisingo įsipareigojimų neįvykdymo arba nulinės hipotezės tikimybę. Procedūra grindžiama tikimybe, kad ji veiks. Ši klaidingo sprendimo priėmimo tikimybė yra tikimybė, kad nulinė hipotezė yra teisinga ir kad nėra jokios konkrečios alternatyvios hipotezės. Testas negali parodyti, ar tai tiesa, ar klaidinga.
Alternatyvūs sprendimų teorijos metodai
Egzistuoja alternatyvūs sprendimų teorijos metodai, kuriuose nulinės ir pirmosios hipotezės vertinamos vienodesnėmis sąlygomis. Kiti sprendimų priėmimo metodai, tokie kaip Bajeso teorija, bando subalansuoti blogų sprendimų pasekmes visose galimybėse, o ne sutelkti dėmesį į vieną nulinę hipotezę. Nemažai kitų būdų, kaip nuspręsti, kuri iš hipotezių yra teisinga, yra pagrįsti duomenimis, kurios iš jų turi norimas savybes. Tačiau hipotezių tikrinimas yra dominuojantis duomenų analizės metodas daugelyje mokslo sričių.
Statistinės hipotezės tikrinimas
Kai vienas rezultatų rinkinys skiriasi nuo kito rinkinio, reikia pasikliauti statistinių hipotezių arba statistinių hipotezių testais. Jų aiškinimui reikia tinkamai suprasti p reikšmes ir kritines vertes. Taip pat svarbu suprasti, kad, nepaisant reikšmingumo lygio, testuose vis tiek gali būti klaidų. Todėl išvada gali būti neteisinga.
Bandymo procesą sudarokeli žingsniai:
- Tyrimui kuriama pradinė hipotezė.
- Nurodomos atitinkamos nulinės ir alternatyvios hipotezės.
- Paaiškina statistines prielaidas apie bandymo imtį.
- Nustatymas, kuris testas yra tinkamas.
- Pasirinkite reikšmingumo lygį ir tikimybės slenkstį, žemiau kurio nulinė hipotezė bus atmesta.
- Nulinės hipotezės testo statistikos skirstinys parodo galimas reikšmes, kurioms esant nulinė hipotezė atmetama.
- Vykdomas skaičiavimas.
- Priimamas sprendimas atmesti arba priimti nulinę hipotezę alternatyvos naudai.
Yra alternatyva, kurioje naudojama p reikšmė.
Svarbumo testai
Gryni duomenys be aiškinimo praktiškai nenaudingi. Statistikoje, kai reikia užduoti klausimus apie duomenis ir interpretuoti rezultatus, atsakymų tikslumui ar tikimybei užtikrinti naudojami statistiniai metodai. Tikrinant statistines hipotezes, ši metodų klasė vadinama statistiniu testavimu arba reikšmingumo testais. Sąvoka „hipotezė“primena mokslinius metodus, kai tiriamos hipotezės ir teorijos. Statistikoje hipotezės testas lemia kiekį, pateiktą tam tikra prielaida. Tai leidžia interpretuoti, ar prielaida yra teisinga, ar buvo padarytas pažeidimas.
Statistinis testų aiškinimas
Hipotezių testaiyra naudojami siekiant nustatyti, kurie tyrimo rezultatai lems nulinės hipotezės atmetimą iš anksto nustatytam reikšmingumo lygiui. Statistinės hipotezės testo rezultatai turi būti interpretuojami taip, kad būtų galima tęsti darbą. Yra dvi įprastos statistinių hipotezių tikrinimo kriterijų formos. Tai yra p vertė ir kritinės reikšmės. Priklausomai nuo pasirinkto kriterijaus, gauti rezultatai turi būti interpretuojami skirtingai.
Kas yra p reikšmė
Išvestis apibūdinama kaip statistiškai reikšminga interpretuojant p reikšmę. Tiesą sakant, šis rodiklis reiškia klaidos tikimybę, jei nulinė hipotezė bus atmesta. Kitaip tariant, jis gali būti naudojamas norint įvardyti reikšmę, kurią galima naudoti norint interpretuoti arba kiekybiškai įvertinti testo rezultatą, ir nustatyti klaidos tikimybę atmetant nulinę hipotezę. Pavyzdžiui, galite atlikti duomenų pavyzdžio normalumo testą ir pastebėti, kad iškrypimo tikimybė yra maža. Tačiau nulinės hipotezės nereikia atmesti. Statistinės hipotezės testas gali grąžinti p reikšmę. Tai atliekama lyginant p reikšmę su iš anksto nustatyta slenksčio verte, vadinama reikšmingumo lygiu.
Svarbumo lygis
Svarbumo lygis dažnai rašomas mažąja graikiška raide „alfa“. Bendroji alfa vertė yra 5 % arba 0,05. Mažesnė alfa reikšmė rodo patikimesnį nulinės hipotezės aiškinimą. P reikšmė lyginama suiš anksto pasirinkta alfa reikšmė. Rezultatas yra statistiškai reikšmingas, jei p reikšmė mažesnė už alfa. Reikšmingumo lygį galima apversti atimant jį iš vieno. Tai daroma siekiant nustatyti hipotezės patikimumo lygį, atsižvelgiant į stebimus imties duomenis. Taikant šį statistinių hipotezių tikrinimo metodą, P reikšmė yra tikimybinė. Tai reiškia, kad interpretuojant statistinio testo rezultatą, nežinoma, kas tiesa ar klaidinga.
Statistinės hipotezių tikrinimo teorija
Nulinės hipotezės atmetimas reiškia, kad yra pakankamai statistinių įrodymų, kad ji atrodo tikėtina. Priešingu atveju tai reiškia, kad nėra pakankamai statistikos, kad būtų galima jį atmesti. Galima galvoti apie statistinius testus nulinės hipotezės atmetimo ir priėmimo dichotomijos požiūriu. Nulinės hipotezės statistinio patikrinimo pavojus yra tas, kad jei ji bus priimta, ji gali pasirodyti teisinga. Vietoj to būtų teisingiau sakyti, kad nulinė hipotezė nėra atmesta, nes nėra pakankamai statistinių įrodymų jai atmesti.
Ši akimirka dažnai supainioja pradedančiuosius priedus. Tokiu atveju svarbu priminti sau, kad rezultatas yra tikimybinis ir kad net ir priimant nulinę hipotezę vis tiek yra nedidelė klaidos tikimybė.
Tiesa ar klaidinga nulinė hipotezė
P reikšmės aiškinimas nereiškia, kad nulishipotezė teisinga ar klaidinga. Tai reiškia, kad, remiantis empiriniais duomenimis ir pasirinktu statistiniu testu, buvo nuspręsta atmesti ar neatmesti nulinę hipotezę esant tam tikram statistinio reikšmingumo lygiui. Todėl p reikšmė gali būti laikoma duomenų, pateiktų pagal iš anksto nustatytą prielaidą, įterptą į statistinius testus, tikimybę. P reikšmė yra matas, nurodantis, kokia tikimybė, kad duomenų pavyzdys bus stebimas, jei nulinė hipotezė yra teisinga.
Kritinių verčių aiškinimas
Kai kurie testai negrąžina p. Vietoj to jie gali grąžinti kritinių verčių sąrašą. Tokio tyrimo rezultatai interpretuojami panašiai. Užuot lyginę vieną p reikšmę su iš anksto nustatytu reikšmingumo lygiu, testo statistika lyginama su kritine reikšme. Jei paaiškėja, kad jis yra mažesnis, tai reiškia, kad nulinės hipotezės nebuvo įmanoma atmesti. Jei didesnis arba lygus, nulinė hipotezė turėtų būti atmesta. Statistinės hipotezės tikrinimo algoritmo reikšmė ir jo rezultato interpretacija yra panaši į p reikšmę. Pasirinktas reikšmingumo lygis yra tikimybinis sprendimas atmesti arba neatmesti bazinės testo prielaidos, atsižvelgiant į duomenis.
Klaidos statistiniuose testuose
Statistinės hipotezės testo interpretacija yra tikimybinė. Statistinių hipotezių tikrinimo užduotis nėra rasti teisingą ar klaidingą teiginį. Testo įrodymai gali būti klaidingi. Pavyzdžiui, jei alfa buvo 5%, tai reiškia, kad dažniausiai 1 iš 20nulinė hipotezė bus atmesta per klaidą. Arba to nebus dėl statistinio triukšmo duomenų pavyzdyje. Atsižvelgiant į tai, maža p reikšmė, kuriai esant nulinės hipotezės atmetimas, gali reikšti, kad ji klaidinga arba kad buvo padaryta klaida. Jei padaroma tokio tipo klaida, rezultatas vadinamas klaidingai teigiamu. Ir tokia klaida yra pirmos rūšies klaida tikrinant statistines hipotezes. Kita vertus, jei p reikšmė yra pakankamai didelė, kad reikštų nulinės hipotezės atmetimą, tai gali reikšti, kad tai tiesa. Arba neteisinga ir įvyko koks nors mažai tikėtinas įvykis, dėl kurio buvo padaryta klaida. Tokio tipo klaida vadinama klaidinga neigiama.
Klaidų tikimybė
Tikrinant statistines hipotezes, vis tiek yra galimybė padaryti bet kurią iš šių klaidų. Labai tikėtina, kad klaidingi duomenys ar klaidingos išvados. Idealiu atveju reikėtų pasirinkti tokį reikšmingumo lygį, kuris sumažintų vienos iš šių klaidų tikimybę. Pavyzdžiui, statistinis nulinių hipotezių tikrinimas gali turėti labai mažą reikšmingumo lygį. Nors reikšmingumo lygiai, tokie kaip 0,05 ir 0,01, yra įprasti daugelyje mokslo sričių, dažniausiai naudojamas reikšmingumo lygis yra 310^-7 arba 0,0000003. Jis dažnai vadinamas „5 sigma“. Tai reiškia, kad išvada buvo atsitiktinė su 1 iš 3,5 milijono nepriklausomų eksperimentų pakartojimų tikimybe. Statistinių hipotezių tikrinimo pavyzdžiai dažnai turi tokių klaidų. Tai taip pat yra priežastis, kodėl svarbu turėti nepriklausomus rezultatus.patvirtinimas.
Statistinės patikros naudojimo pavyzdžiai
Yra keli įprasti hipotezių tikrinimo praktikoje pavyzdžiai. Vienas iš populiariausių yra žinomas kaip „Arbatos degustacija“. Dr. Muriel Bristol, biometrinių duomenų įkūrėjo Roberto Fisherio kolega, tvirtino, kad gali tiksliai pasakyti, ar jis pirmiausia buvo dedamas į arbatos ar pieno puodelį. Fisher pasiūlė jai atsitiktinai duoti aštuonis puodelius (po keturis kiekvienos veislės). Testo statistika buvo paprasta: skaičiuoti sėkmingų taurės pasirinkimą. Kritinis regionas buvo vienintelis sėkmingas iš 4, galbūt remiantis įprastu tikimybės kriterijumi (< 5 %; 1 iš 70 ≈ 1,4 %). Fisheris teigė, kad alternatyvi hipotezė nereikalinga. Ponia teisingai identifikavo kiekvieną puodelį, o tai buvo laikoma statistiškai reikšmingu rezultatu. Ši patirtis paskatino Fisherio knygą Statistiniai metodai tyrinėtojams.
Atsakovo pavyzdys
Statistinė teismo procedūra yra panaši į baudžiamojo teismo procesą, kai k altinamasis laikomas nek altu, kol jo k altė neįrodyta. Prokuroras bando įrodyti k altinamojo k altę. K altinamasis gali būti pripažintas k altu tik tada, kai pakanka k altinimo įrodymų. Procedūros pradžioje keliamos dvi hipotezės: „k altinamasis nek altas“ir „k altinamasis k altas“. Nek altumo hipotezę galima atmesti tik tada, kai klaida yra labai mažai tikėtina, nes nenorima nuteisti nek alto k altinamojo. Tokia klaida vadinama I tipo klaida ir jos atsiradimuretai kontroliuojamas. Dėl tokio asimetriško elgesio dažniau pasitaiko II tipo klaida, t. y. k altininko išteisinimas.
Statistika naudinga analizuojant didelius duomenų kiekius. Tai taip pat taikoma hipotezių tikrinimui, kurios gali pagrįsti išvadas, net jei nėra jokios mokslinės teorijos. Arbatos ragavimo pavyzdyje buvo „akivaizdu“, kad nebuvo skirtumo, ar pilti pieną į arbatą, ar pilti arbatą į pieną.
Tikras praktinis hipotezių tikrinimo pritaikymas apima:
- tikrinama, ar vyrai sapnuoja daugiau košmarų nei moterys;
- dokumento priskyrimas;
- Mėnulio pilnaties įtakos elgesiui vertinimas;
- nustatyti diapazoną, kuriame šikšnosparnis gali aptikti vabzdį naudodamas aidą;
- geriausių priemonių mesti rūkyti pasirinkimas;
- Tikrinimas, ar buferio lipdukai atspindi automobilio savininko elgesį.
Statistinių hipotezių tikrinimas atlieka svarbų vaidmenį statistikoje apskritai ir atliekant statistines išvadas. Vertės testavimas naudojamas kaip tradicinio numatomos vertės ir eksperimentinio rezultato palyginimo pakaitalas, kuris yra mokslinio metodo pagrindas. Kai teorija gali nuspėti tik ryšio ženklą, nukreiptų hipotezių testai gali būti sukonfigūruoti taip, kad teoriją patvirtintų tik statistiškai reikšmingas rezultatas. Ši vertinimo teorijos forma yra pati griežčiausiakritika dėl hipotezių tikrinimo naudojimo.