Statistika on pikka aega olnud elu lahutamatu osa. Inimesed seisavad sellega igal pool silmitsi. Statistika põhjal tehakse järeldused, kus ja millised haigused on levinud, mille järele on konkreetses piirkonnas või teatud elanikkonnarühmas rohkem nõudlust. Isegi valitsusorganite kandidaatide poliitiliste programmide koostamine põhineb statistilistel andmetel. Neid kasutavad ka jaeketid kaupade ostmisel ja tootjad juhinduvad nendest andmetest oma ettepanekutes.
Statistika mängib ühiskonnaelus olulist rolli ja mõjutab iga üksikut liiget isegi pisiasjades. Näiteks kui statistika järgi eelistab enamik inimesi konkreetses linnas või piirkonnas riietes tumedaid värve, siis lillelise trükiga erkkollase vihmamantli leidmine kohalikest müügipunktidest on äärmiselt keeruline. Aga mis kogusedkas nendel andmetel on kokkuvõttes selline mõju? Näiteks, mis on "statistiliselt oluline"? Mida see määratlus täpselt tähendab?
Mis see on?
Statistika kui teadus koosneb erinevate suuruste ja mõistete kombinatsioonist. Üks neist on mõiste "statistiline tähtsus". See on muutujate väärtuse nimi, milles muude näitajate ilmnemise tõenäosus on tühine.
Näiteks 9 inimest 10-st paneb pärast vihmast ööd sügiseses metsas seenelkäigul jalga kummikingad. Tõenäosus, et mingil hetkel panevad neist 8 lõuendist mokassiinid selga, on kaduvväike. Seega on selles konkreetses näites number 9 see, mida nimetatakse "statistiliseks olulisuseks".
Seega, kui antud praktilist näidet edasi arendada, ostavad kingapoed suvehooaja lõpuks kummikuid suuremas koguses kui muul aastaajal. Seega mõjutab statistilise väärtuse suurus tavaelu.
Muidugi võetakse keerulistes arvutustes, näiteks viiruste leviku ennustamisel, arvesse suurt hulka muutujaid. Kuid statistiliste andmete olulise näitaja määramise olemus on sarnane, sõltumata arvutuste keerukusest ja muutuvate väärtuste arvust.
Kuidas see arvutatakse?
Kasutatakse võrrandi "statistilise olulisuse" indikaatori väärtuse arvutamisel. See tähendab, et võib väita, et antud juhul otsustab kõik matemaatika. Lihtsaim arvutusvõimalus on matemaatiliste toimingute ahel, mis hõlmab järgmisi parameetreid:
- kahte tüüpi uuringutest või objektiivsete andmete (nt ostude summa) uurimisest saadud tulemusi, mis on tähistatud a ja b-ga;
- proovi suuruse indikaator mõlema rühma jaoks – n;
- ühendvalimi osa väärtus - p;
- standardviga – SE.
Järgmine samm on määrata testi üldskoor – t, selle väärtust võrreldakse arvuga 1,96. 1,96 on keskmine väärtus, mis annab vahemikku 95%, vastav alt Studenti t-jaotuse funktsioonile.
Tihti kerkib küsimus, mis vahe on n ja p väärtustel. Seda nüanssi on lihtne näitega selgitada. Oletame, et arvutatakse välja meeste ja naiste mis tahes tootele või kaubamärgile lojaalsuse statistiline olulisus.
Sel juhul järgneb tähtedele järgmine:
- n - vastajate arv;
- p – tootega rahulolevate arv.
Intervjueeritud naiste arv on sel juhul n1. Vastav alt sellele mehed - n2. Samal väärtusel on sümboli p. numbrid "1" ja "2"
Testi skoori võrdlemine Studenti tabelite keskmisega muutub nn statistiliseks olulisuseks.
Mida tähendab kinnitamine?
Iga matemaatilise arvutuse tulemusi saab alati kontrollida, seda õpetatakse lastele algkoolis. Loogiline on eeldadaet kuna statistika määratakse arvutuste ahela abil, siis seda kontrollitakse.
Siiski, statistilise olulisuse testimine ei ole ainult matemaatika. Statistika käsitleb suurt hulka muutujaid ja erinevaid tõenäosusi, mida pole kaugeltki alati võimalik arvutada. See tähendab, et kui pöörduda tagasi artikli alguses toodud kummijalatsite näite juurde, siis võib statistiliste andmete loogilist ülesehitust, millele kaupluste kaupade ostjad loodavad, segada sügisele ebatüüpiline kuiv ja kuum ilm.. Selle nähtuse tulemusena väheneb kummikuid ostvate inimeste arv ja müügipunktid kannavad kahju. Muidugi ei suuda matemaatiline valem ilmaanomaaliat ette näha. Seda hetke nimetatakse "veaks".
See on lihts alt selliste vigade tõenäosus ja see võtab arvesse arvutatud olulisuse taseme kontrollimist. See võtab arvesse nii arvutatud näitajaid ja aktsepteeritud olulisuse tasemeid kui ka koguseid, mida tinglikult nimetatakse hüpoteesideks.
Mis on olulisuse tase?
Mõte "tase" sisaldub statistilise olulisuse peamistes kriteeriumides. Seda kasutatakse rakendus- ja praktilises statistikas. See on teatud tüüpi väärtus, mis võtab arvesse võimalike kõrvalekallete või vigade tõenäosust.
Tase põhineb valmisproovide erinevuste tuvastamisel, see võimaldab kindlaks teha nende olulisuse või vastupidi juhuslikkuse. Sellel mõistel pole mitte ainult digitaalseid tähendusi, vaid ka nende omapäraseid tõlgendusi. Nad selgitavadkuidas peate väärtusest aru saama ja tase ise määratakse tulemuse võrdlemisel keskmise indeksiga, see näitab erinevuste usaldusväärsust.
Seega võime taseme mõistet ette kujutada lihts alt – see näitab vastuvõetavat, tõenäolist viga või viga saadud statistiliste andmete põhjal tehtud järeldustes.
Milliseid olulisuse tasemeid kasutatakse?
Veatõenäosuste koefitsientide statistiline olulisus praktikas põhineb kolmel põhitasemel.
Esimene tase on lävi, mille juures väärtus on 5%. See tähendab, et vea tõenäosus ei ületa 5% olulisuse taset. See tähendab, et kindlus statistiliste uuringute andmete põhjal tehtud järelduste laitmatuse ja eksimatuse suhtes on 95%.
Teine tase on 1% lävi. Seega tähendab see arv, et statistiliste arvutuste käigus saadud andmetest saab juhinduda 99% kindlusega.
Kolmas tase – 0,1%. Selle väärtuse korral on vea tõenäosus võrdne protsendi murdosaga, see tähendab, et vead on praktiliselt välistatud.
Mis on statistika hüpotees?
Vead kui mõiste jagunevad kahte valdkonda, mis puudutavad nullhüpoteesi aktsepteerimist või tagasilükkamist. Hüpotees on mõiste, mille taga definitsiooni kohaselt on peidetud küsitlustulemuste, muude andmete või väidete kogum. See tähendab statistilise arvestuse ainega seotud millegi tõenäosusjaotuse kirjeldust.
Lihtsates arvutustes on kaks hüpoteesi – null ja alternatiiv. Nende erinevus seisneb selles, et nullhüpotees põhineb ideel, et statistilise olulisuse määramisel osalevate valimite vahel pole põhimõttelisi erinevusi ning alternatiivne on sellele täiesti vastupidine. See tähendab, et alternatiivne hüpotees põhineb nende proovide olulise erinevuse olemasolul.
Mis on vead?
Vead kui statistika mõiste on otseses proportsioonis selle või teise hüpoteesi tõeseks tunnistamisega. Neid saab jagada kahte suunda või tüüpi:
- esimene tüüp on tingitud nullhüpoteesi aktsepteerimisest, mis osutus valeks;
- sekund – põhjustatud alternatiivi järgimisest.
Esimest tüüpi vigu nimetatakse valepositiivseks ja see on üsna levinud kõigis valdkondades, kus statistikat kasutatakse. Sellest lähtuv alt nimetatakse teist tüüpi viga valenegatiivseks.
Miks vajame statistikas regressiooni?
Regressiooni statistiline olulisus seisneb selles, et selle abil on võimalik kindlaks teha, kui palju vastab andmete põhjal arvutatud erinevate sõltuvuste mudel tegelikkusele; võimaldab tuvastada arvestuse ja järelduste tegemiseks vajalike tegurite piisavust või puudumist.
Regressiooniväärtus määratakse tulemuste võrdlemisel Fisheri tabelites loetletud andmetega. Või dispersioonanalüüsi kasutades. Regressiooninäitajad on olulised, kuikeerukad statistilised uuringud ja arvutused, mis hõlmavad suurt hulka muutujaid, juhuslikke andmeid ja tõenäolisi muutusi.