Matematinė statistika – tai metodika, leidžianti priimti pagrįstus sprendimus esant neaiškioms sąlygoms. Ši matematikos šaka tiria duomenų rinkimo ir sisteminimo metodus, apdoroja galutinius eksperimentų ir eksperimentų su masiniu atsitiktinumu rezultatus ir atranda bet kokius modelius. Apsvarstykite pagrindines matematinės statistikos sąvokas.
Skirtumas su tikimybių teorija
Matematinės statistikos metodai glaudžiai susikerta su tikimybių teorija. Abi matematikos šakos nagrinėja daugybę atsitiktinių reiškinių. Abi disciplinos yra sujungtos ribinėmis teoremomis. Tačiau tarp šių mokslų yra didelis skirtumas. Jei tikimybių teorija nustato proceso charakteristikas realiame pasaulyje remdamasi matematiniu modeliu, tai matematinė statistika daro priešingai – nustato modelio savybesremiantis pastebėta informacija.
Žingsniai
Matematinės statistikos taikymas gali būti atliekamas tik atsižvelgiant į atsitiktinius įvykius ar procesus, tiksliau, su duomenimis, gautais juos stebint. Ir tai vyksta keliais etapais. Pirma, eksperimentų ir eksperimentų duomenys yra tam tikru būdu apdorojami. Jie užsakomi dėl aiškumo ir analizės patogumo. Tada tiksliai arba apytiksliai įvertinami būtini stebimo atsitiktinio proceso parametrai. Jie gali būti:
- įvykio tikimybės įvertinimas (jo tikimybė iš pradžių nežinoma);
- neapibrėžtos paskirstymo funkcijos elgesio tyrimas;
- laukimų sąmata;
- variacijos įvertinimas
- irtt.
Trečias etapas – bet kokių hipotezių, iškeltų prieš analizę, patikrinimas, t.y., atsakymo į klausimą, kaip eksperimentų rezultatai atitinka teorinius skaičiavimus, gavimas. Tiesą sakant, tai yra pagrindinis matematinės statistikos etapas. Pavyzdys būtų apsvarstyti, ar stebimo atsitiktinio proceso elgsena yra normaliojo pasiskirstymo ribose.
Gyventojai
Pagrindinės matematinės statistikos sąvokos apima bendrąsias ir imties populiacijas. Ši disciplina yra susijusi su tam tikrų objektų rinkinio tyrimu tam tikros savybės atžvilgiu. Pavyzdys – taksisto darbas. Apsvarstykite šiuos atsitiktinius kintamuosius:
- apkrova arba klientų skaičius: per dieną, prieš pietus, po pietų, …;
- vidutinis kelionės laikas;
- gaunamų paraiškų ar jų priedų prie miesto rajonų skaičius ir dar daugiau.
Taip pat verta paminėti, kad galima ištirti panašių atsitiktinių procesų rinkinį, kuris taip pat bus atsitiktinis kintamasis, kurį galima stebėti.
Taigi, taikant matematinės statistikos metodus, visas tiriamų objektų rinkinys arba įvairių stebėjimų, atliekamų tomis pačiomis sąlygomis tam tikram objektui, rezultatai vadinami bendrąja visuma. Kitaip tariant, matematiškai griežčiau, tai atsitiktinis dydis, apibrėžiamas elementariųjų įvykių erdvėje, joje pažymėta poaibių klasė, kurios elementų tikimybė yra žinoma.
Pavyzdinė populiacija
Būna atvejų, kai dėl kokių nors priežasčių (kaina, laikas) neįmanoma arba nepraktiška atlikti nuolatinį kiekvieno objekto tyrimą. Pavyzdžiui, atidaryti kiekvieną sandariai uždarytos uogienės stiklainį, norint patikrinti jo kokybę, yra abejotinas sprendimas, o bandyti įvertinti kiekvienos oro molekulės trajektoriją kubiniame metre neįmanoma. Tokiais atvejais naudojamas selektyvaus stebėjimo metodas: iš bendrosios populiacijos (dažniausiai atsitiktinai) atrenkamas tam tikras objektų skaičius ir atliekama jų analizė.
Šios sąvokos iš pradžių gali atrodyti sudėtingos. Todėl, norint iki galo suprasti temą, reikia perskaityti V. E. Gmurmano vadovėlį „Tikimybių teorija ir matematinė statistika“. Taigi atrankos rinkinys arba pavyzdys yra objektų, atsitiktinai atrinktų iš bendrosios rinkinio, serija. Griežtai matematiškai kalbant, tai yra nepriklausomų, tolygiai paskirstytų atsitiktinių dydžių seka, kurių kiekvieno pasiskirstymas sutampa su nurodytu bendrajam atsitiktiniam dydžiui.
Pagrindinės sąvokos
Trumpai panagrinėkime keletą kitų pagrindinių matematinės statistikos sąvokų. Objektų skaičius bendrojoje aibėje arba imtyje vadinamas tūriu. Eksperimento metu gautos imties vertės vadinamos imties realizavimu. Kad imtimi pagrįstas bendrosios visumos įvertinimas būtų patikimas, svarbu turėti vadinamąją reprezentatyviąją arba reprezentacinę imtį. Tai reiškia, kad imtis turi visiškai reprezentuoti populiaciją. Tai galima pasiekti tik tuo atveju, jei visi populiacijos elementai turi vienodą tikimybę būti imtyje.
Pavyzdžiuose išskiriamas grąžinimas ir negrąžinimas. Pirmuoju atveju imties turinyje kartojamas elementas grąžinamas į bendrąją aibę, antruoju – ne. Paprastai praktiškai naudojamas mėginių ėmimas be pakaitalų. Taip pat reikėtų pažymėti, kad bendrosios populiacijos dydis visada gerokai viršija imties dydį. Egzistuotidaug atrankos proceso parinkčių:
- paprasta – elementai parenkami atsitiktinai po vieną;
- įvesta - bendroji populiacija skirstoma į tipus ir pasirenkama iš kiekvieno; pavyzdys – gyventojų apklausa: vyrai ir moterys atskirai;
- mechaninis – pavyzdžiui, pasirinkite kas 10 elementą;
- serijinis – pasirinkimas atliekamas elementų serijomis.
Statistikos paskirstymas
Pasak Gmurmano, tikimybių teorija ir matematinė statistika yra nepaprastai svarbios mokslo pasaulio disciplinos, ypač praktinėje jos dalyje. Apsvarstykite statistinį imties pasiskirstymą.
Tarkime, kad turime grupę mokinių, kuriems buvo atliktas matematikos testas. Dėl to turime įverčių rinkinį: 5, 3, 1, 4, 3, 4, 2, 5, 4, 4, 5 – tai mūsų pagrindinė statistinė medžiaga.
Pirmiausia turime ją surūšiuoti arba atlikti reitingavimo operaciją: 1, 2, 3, 3, 4, 4, 4, 4, 5, 5, 5 – ir taip gauti variacinę eilutę. Kiekvieno įvertinimo pakartojimų skaičius vadinamas vertinimo dažnumu, o jų santykis su imties dydžiu – santykiniu dažniu. Padarykite imties statistinio pasiskirstymo lentelę arba tiesiog statistinę eilutę:
ai | 1 | 2 | 3 | 4 | 5 |
pi | 1 | 1 | 2 | 4 | 3 |
arba
ai | 1 | 2 | 3 | 4 | 5 |
pi | 1/11 | 1/11 | 2/11 | 4/11 | 3/11 |
Turime atsitiktinį kintamąjį, su kuriuo atliksime eksperimentų seriją ir pamatysime, kokią reikšmę šis kintamasis įgyja. Tarkime, ji paėmė reikšmę a1 - m1 kartų; a2 - m2 kartų ir kt. Šios imties dydis bus m1 + … + mk=m. Aibė ai, kur i kinta nuo 1 iki k, yra statistinė eilutė.
Intervalinis pasiskirstymas
VE Gmurmano knygoje „Tikimybių teorija ir matematinė statistika“taip pat pateikiama intervalinė statistinė eilutė. Jo sudarymas įmanomas, kai tiriamos savybės reikšmė yra ištisinė tam tikru intervalu, o reikšmių skaičius yra didelis. Apsvarstykite studentų grupę, tiksliau, jų ūgį: 163, 180, 185, 172, 161, 171, 189, 157, 165, 174, 180, 181, 175, 182, 167, 159, 173, 61 179, 160, 180, 166, 178, 156, 180, 189, 173, 174, 175 - iš viso 30 mokinių. Akivaizdu, kad žmogaus ūgis yra nuolatinė reikšmė. Turime apibrėžti intervalo žingsnį. Tam naudojama Sturges formulė.
h= | maks. – min. | = | 190–156 | = | 33 | = | 5, 59 |
1+log2m | 1+log230 | 5, 9 |
Taigi intervalo dydžiu galima laikyti reikšmę 6. Taip pat reikėtų pasakyti, kad reikšmė 1+log2m yra formulėintervalų skaičiaus nustatymas (žinoma, su apvalinimu). Taigi pagal formules gaunami 6 intervalai, kurių kiekvieno dydis yra 6. Ir pirmoji pradinio intervalo reikšmė bus skaičius, nustatytas pagal formulę: min - h / 2=156 - 6/2=153. Padarykime lentelę, kurioje bus intervalai ir mokinių, kurių augimas pateko į tam tikrą intervalą, skaičius.
H | [153; 159) | [159; 165) | [165; 171) | [171; 177) | [177; 183) | [183; 189) |
P | 2 | 5 | 3 | 9 | 8 | 3 |
P | 0, 06 | 0, 17 | 0, 1 | 0, 3 | 0, 27 | 0, 1 |
Žinoma, tai dar ne viskas, nes matematinėje statistikoje yra daug daugiau formulių. Mes apsvarstėme tik keletą pagrindinių sąvokų.
Platinimo grafikas
Pagrindinės matematinės statistikos sąvokos taip pat apima grafinį pasiskirstymo vaizdą, kuris išsiskiria aiškumu. Yra dviejų tipų grafikai: daugiakampis ir histograma. Pirmasis naudojamas atskiroms statistinėms eilutėms. Ir nuolatiniam platinimui atitinkamai antrasis.