Hipotēžu pārbaude ir nepieciešama procedūra statistikā. Hipotēžu testā tiek novērtēti divi viens otru izslēdzoši apgalvojumi, lai noteiktu, kurš apgalvojums vislabāk atbilst izlases datiem. Ja konstatējums ir statistiski nozīmīgs, tas ir saistīts ar hipotēzes pārbaudi.
Pārbaudes metodes
Statistisko hipotēžu pārbaudes metodes ir statistiskās analīzes metodes. Parasti tiek salīdzinātas divas statistikas kopas vai izlases datu kopa tiek salīdzināta ar sintētisko datu kopu no idealizēta modeļa. Dati jāinterpretē tā, lai tie pievienotu jaunas nozīmes. Jūs varat tos interpretēt, pieņemot noteiktu gala rezultāta struktūru un izmantojot statistikas metodes, lai apstiprinātu vai noraidītu pieņēmumu. Pieņēmumu sauc par hipotēzi, un šim nolūkam izmantotos statistikas testus sauc par statistikas hipotēzēm.
H0 un H1 hipotēzes
Ir divi galveniehipotēžu statistiskās pārbaudes jēdzieni - tā sauktā "galvenā jeb nulles hipotēze" un " alternatīvā hipotēze". Tās sauc arī par Neimana-Pīrsona hipotēzēm. Statistiskā testa pieņēmumu sauc par nulles hipotēzi, galveno hipotēzi vai saīsināti H0. To bieži dēvē par noklusējuma pieņēmumu vai pieņēmumu, ka nekas nav mainījies. Pārbaudes pieņēmuma pārkāpumu bieži sauc par pirmo hipotēzi, alternatīvo hipotēzi vai H1. H1 ir saīsinājums kādai citai hipotēzei, jo mēs par to zinām tikai to, ka H0 datus var izmest.
Pirms nulles hipotēzes noraidīšanas vai nenoraidīšanas testa rezultāts ir jāinterpretē. Salīdzinājums tiek uzskatīts par statistiski nozīmīgu, ja sakarība starp datu kopām, visticamāk, nebūs nulles hipotēzes realizācija atbilstoši sliekšņa varbūtībai – nozīmīguma līmenim. Statistisko hipotēžu pārbaudei ir arī piemērotības kritēriji. Šis ir hipotēzes pārbaudes kritērija nosaukums, kas saistīts ar šķietamo nezināmā sadalījuma likumu. Šis ir skaitlisks mērs neatbilstībai starp empīrisko un teorētisko sadalījumu.
Statistisko hipotēžu pārbaudes procedūra un kritēriji
Visizplatītākās hipotēžu izvēles metodes ir balstītas vai nu uz Akaike informācijas kritēriju, vai uz Bajesa koeficientu. Statistisko hipotēžu pārbaude ir galvenais paņēmiens gan secinājumos, gan Beijesa secinājumos, lai gan abiem veidiem ir ievērojamas atšķirības. Statistisko hipotēžu testidefinēt procedūru, kas kontrolē iespējamību kļūdaini pieņemt lēmumu par nepareizu saistību nepildīšanas vai nulles hipotēzi. Procedūra ir balstīta uz to, cik iespējams, ka tā darbosies. Šī nepareiza lēmuma pieņemšanas varbūtība ir varbūtība, ka nulles hipotēze ir patiesa un ka nepastāv īpaša alternatīva hipotēze. Pārbaude nevar parādīt, vai tā ir patiesa vai nepatiesa.
Alternatīvas lēmumu pieņemšanas teorijas metodes
Pastāv alternatīvas lēmumu teorijas metodes, kurās nulles un pirmā hipotēze tiek izskatīta uz vienlīdzīgākiem pamatiem. Citas lēmumu pieņemšanas pieejas, piemēram, Beijesa teorija, mēģina līdzsvarot sliktu lēmumu sekas visās iespējās, nevis koncentrējas uz vienu nulles hipotēzi. Vairākas citas pieejas, lai izlemtu, kura no hipotēzēm ir pareiza, ir balstītas uz datiem, kurām no tām ir vēlamās īpašības. Taču hipotēžu pārbaude ir dominējošā pieeja datu analīzei daudzās zinātnes jomās.
Statistikas hipotēzes pārbaude
Kad viena rezultātu kopa atšķiras no citas, ir jāpaļaujas uz statistisko hipotēžu pārbaudi vai statistisko hipotēžu testiem. To interpretācijai ir nepieciešama pareiza p-vērtību un kritisko vērtību izpratne. Ir arī svarīgi saprast, ka neatkarīgi no nozīmīguma līmeņa pārbaudēs joprojām var būt kļūdas. Tāpēc secinājums var nebūt pareizs.
Testēšanas process sastāv novairākas darbības:
- Izpētei tiek veidota sākotnējā hipotēze.
- Norādītas atbilstošās nulles un alternatīvās hipotēzes.
- Izskaidro statistiskos pieņēmumus par testā iekļauto izlasi.
- Atbilstošā testa noteikšana.
- Atlasiet nozīmīguma līmeni un varbūtības slieksni, zem kura nulles hipotēze tiks noraidīta.
- Nulles hipotēzes pārbaudes statistikas sadalījums parāda iespējamās vērtības, pie kurām nulles hipotēze tiek noraidīta.
- Notiek aprēķins.
- Tiek pieņemts lēmums noraidīt vai pieņemt nulles hipotēzi par labu alternatīvai.
Ir alternatīva, kas izmanto p-vērtību.
Nozīmīguma testi
Tīriem datiem bez interpretācijas praktiski nav nozīmes. Statistikā, uzdodot jautājumus par datiem un interpretējot rezultātus, tiek izmantotas statistikas metodes, lai nodrošinātu atbilžu precizitāti vai iespējamību. Pārbaudot statistiskās hipotēzes, šo metožu klasi sauc par statistisko testēšanu jeb nozīmīguma testiem. Termins “hipotēze” atgādina zinātniskas metodes, kurās tiek pētītas hipotēzes un teorijas. Statistikā hipotēzes pārbaudes rezultāts ir daudzums, ņemot vērā doto pieņēmumu. Tas ļauj interpretēt, vai pieņēmums ir patiess vai ir izdarīts pārkāpums.
Pārbaudījumu statistiskā interpretācija
Hipotēžu pārbaudestiek izmantoti, lai noteiktu, kuri pētījuma rezultāti novedīs pie nulles hipotēzes noraidīšanas iepriekš noteiktai nozīmīguma pakāpei. Statistiskās hipotēzes pārbaudes rezultāti ir jāinterpretē, lai varētu turpināt darbu pie tā. Pastāv divas izplatītas statistisko hipotēžu pārbaudes kritēriju formas. Tās ir p-vērtība un kritiskās vērtības. Atkarībā no izvēlētā kritērija iegūtie rezultāti jāinterpretē dažādi.
Kas ir p-vērtība
Izvade tiek raksturota kā statistiski nozīmīga, interpretējot p vērtību. Faktiski šis rādītājs nozīmē kļūdas iespējamību, ja nulles hipotēze tiek noraidīta. Citiem vārdiem sakot, to var izmantot, lai nosauktu vērtību, ko var izmantot, lai interpretētu vai kvantitatīvi noteiktu testa rezultātu, un lai noteiktu kļūdas varbūtību, noraidot nulles hipotēzi. Piemēram, varat veikt datu parauga normalitātes testu un konstatēt, ka ir maza izņēmuma iespēja. Tomēr nulles hipotēze nav jānoraida. Statistiskās hipotēzes pārbaude var atgriezt p vērtību. To dara, salīdzinot p vērtību ar iepriekš noteiktu sliekšņa vērtību, ko sauc par nozīmīguma līmeni.
Nozīmīguma līmenis
Nozīmīguma līmeni bieži raksta ar grieķu mazo burtu "alfa". Vispārīgā alfa vērtība ir 5% jeb 0,05. Mazāka alfa vērtība liecina par ticamāku nulles hipotēzes interpretāciju. P vērtība tiek salīdzināta ariepriekš atlasītā alfa vērtība. Rezultāts ir statistiski nozīmīgs, ja p vērtība ir mazāka par alfa. Nozīmīguma līmeni var apgriezt, atņemot to no viena. Tas tiek darīts, lai noteiktu hipotēzes ticamības līmeni, ņemot vērā novērotos izlases datus. Izmantojot šo statistisko hipotēžu pārbaudes metodi, P vērtība ir varbūtība. Tas nozīmē, ka statistiskās pārbaudes rezultāta interpretācijas procesā nav zināms, kas ir patiess vai nepatiess.
Statistikas hipotēžu pārbaudes teorija
Nulles hipotēzes noraidīšana nozīmē, ka ir pietiekami daudz statistikas pierādījumu, ka tā šķiet iespējama. Pretējā gadījumā tas nozīmē, ka nav pietiekami daudz statistikas, lai to noraidītu. Statistiskos testus var uzskatīt par nulles hipotēzes noraidīšanas un pieņemšanas dihotomiju. Nulles hipotēzes statistiskās pārbaudes briesmas ir tādas, ka, ja tā tiek pieņemta, tā var šķist patiesa. Tā vietā pareizāk būtu teikt, ka nulles hipotēze netiek noraidīta, jo nav pietiekami daudz statistikas pierādījumu, lai to noraidītu.
Šis brīdis bieži mulsina iesācēju ekstras. Šādā gadījumā ir svarīgi sev atgādināt, ka rezultāts ir ticams un ka pat pieņemot nulles hipotēzi joprojām ir neliela kļūdas iespēja.
Patiesa vai nepatiesa nulles hipotēze
P vērtības interpretācija nenozīmē, ka tā ir nullehipotēze ir patiesa vai nepatiesa. Tas nozīmē, ka ir izdarīta izvēle noraidīt vai nenoraidīt nulles hipotēzi noteiktā statistiskā nozīmīguma līmenī, pamatojoties uz empīriskajiem datiem un izvēlēto statistisko testu. Tāpēc p-vērtību var uzskatīt par datu varbūtību, kas sniegta saskaņā ar iepriekš noteiktu pieņēmumu, kas iegults statistikas pārbaudēs. P-vērtība ir mērs, cik iespējams, ka datu paraugs tiks novērots, ja nulles hipotēze ir patiesa.
Kritisko vērtību interpretācija
Daži testi neatgriež p. Tā vietā viņi var atgriezt kritisko vērtību sarakstu. Šāda pētījuma rezultāti tiek interpretēti līdzīgi. Tā vietā, lai salīdzinātu vienu p-vērtību ar iepriekš noteiktu nozīmīguma līmeni, testa statistika tiek salīdzināta ar kritisko vērtību. Ja tas izrādās mazāks, tas nozīmē, ka nebija iespējams noraidīt nulles hipotēzi. Ja ir lielāka par vai vienāda, nulles hipotēze ir jānoraida. Statistiskās hipotēzes pārbaudes algoritma nozīme un tā rezultāta interpretācija ir līdzīga p-vērtībai. Izvēlētais nozīmīguma līmenis ir varbūtības lēmums noraidīt vai nenoraidīt bāzes testa pieņēmumu, ņemot vērā datus.
Kļūdas statistikas pārbaudēs
Statistisko hipotēžu testa interpretācija ir varbūtība. Statistisko hipotēžu pārbaudes uzdevums nav atrast patiesu vai nepatiesu apgalvojumu. Pārbaudes pierādījumi var būt kļūdaini. Piemēram, ja alfa bija 5%, tas nozīmē, ka lielākoties 1 no 20nulles hipotēze tiks noraidīta kļūdas dēļ. Vai arī tas nenotiks statistikas trokšņa dēļ datu paraugā. Ņemot vērā šo punktu, neliela p vērtība, pie kuras var noraidīt nulles hipotēzi, var nozīmēt, ka tā ir nepatiesa vai ir pieļauta kļūda. Ja tiek pieļauta šāda veida kļūda, rezultātu sauc par viltus pozitīvu. Un šāda kļūda ir pirmā veida kļūda, pārbaudot statistiskās hipotēzes. No otras puses, ja p vērtība ir pietiekami liela, lai nozīmētu nulles hipotēzes noraidīšanu, tas var nozīmēt, ka tā ir patiesa. Vai arī tā nav pareiza, un ir noticis kāds maz ticams notikums, kura dēļ tika pieļauta kļūda. Šāda veida kļūdu sauc par viltus negatīvu.
Kļūdu iespējamība
Pārbaudot statistikas hipotēzes, joprojām pastāv iespēja pieļaut kādu no šāda veida kļūdām. Visticamāk, ir nepatiesi dati vai nepatiesi secinājumi. Ideālā gadījumā ir jāizvēlas nozīmīguma līmenis, kas samazina vienas no šīm kļūdām iespējamību. Piemēram, nulles hipotēžu statistiskajai pārbaudei var būt ļoti zems nozīmīguma līmenis. Lai gan nozīmīguma līmeņi, piemēram, 0,05 un 0,01, ir izplatīti daudzās zinātnes jomās, visbiežāk izmantotais nozīmīguma līmenis ir 310^-7 jeb 0,0000003. To bieži dēvē par “5 sigmu”. Tas nozīmē, ka secinājums bija nejaušs ar varbūtību 1 no 3,5 miljoniem neatkarīgu eksperimentu atkārtojumu. Statistisko hipotēžu pārbaudes piemēri bieži satur šādas kļūdas. Tas ir arī iemesls, kāpēc ir svarīgi iegūt neatkarīgus rezultātus.verifikācija.
Statistikas verifikācijas izmantošanas piemēri
Ir vairāki izplatīti hipotēžu pārbaudes piemēri praksē. Viena no populārākajām ir pazīstama kā “Tējas degustācija”. Dr Muriel Bristol, biometrijas dibinātāja Roberta Fišera kolēģis, apgalvoja, ka var droši pateikt, vai tas vispirms tika pievienots tējas vai piena tasei. Fišere piedāvāja viņai pēc nejaušības principa iedot astoņas krūzes (četras no katras šķirnes). Pārbaudes statistika bija vienkārša: skaitīt panākumus kausa izvēlē. Kritiskais apgabals bija vienīgais panākums no 4, iespējams, pamatojoties uz parasto varbūtības kritēriju (< 5%; 1 no 70 ≈ 1,4%). Fišers apgalvoja, ka alternatīva hipotēze nav nepieciešama. Dāma pareizi identificēja katru kausu, kas tika uzskatīts par statistiski nozīmīgu rezultātu. Šī pieredze noveda pie Fišera grāmatas Statistical Methods for Researchers.
Atbildētāja piemērs
Statistisko tiesas procesu var salīdzināt ar krimināltiesu, kurā apsūdzētais tiek uzskatīts par nevainīgu, kamēr viņa vaina nav pierādīta. Prokurors cenšas pierādīt apsūdzētā vainu. Tikai tad, ja ir pietiekami pierādījumi apsūdzības izvirzīšanai, apsūdzēto var atzīt par vainīgu. Procedūras sākumā ir divas hipotēzes: "Apsūdzētais nav vainīgs" un "Apsūdzētais ir vainīgs". Nevainīguma hipotēzi var noraidīt tikai tad, ja kļūda ir ļoti maz ticama, jo nevēlas notiesāt nevainīgu apsūdzēto. Šādu kļūdu sauc par I tipa kļūdu un tās rašanosreti kontrolēts. Šīs asimetriskās uzvedības rezultātā biežāk sastopama II tipa kļūda, t.i., vainīgā attaisnošana.
Statistika ir noderīga, analizējot lielu datu apjomu. Tas vienlīdz attiecas arī uz hipotēžu pārbaudi, kas var pamatot secinājumus pat tad, ja nepastāv zinātniska teorija. Tējas degustācijas piemērā bija "acīmredzami", ka nebija atšķirības starp ieliet pienu tējā vai ieliet tēju pienā.
Reāla hipotēžu pārbaudes praktiskā pielietošana ietver:
- pārbaude, vai vīrieši vairāk murgo nekā sievietes;
- dokumenta attiecinājums;
- Pilnmēness ietekmes uz uzvedību novērtēšana;
- nosaka diapazonu, kurā sikspārnis var noteikt kukaini, izmantojot atbalsi;
- labāko līdzekļu izvēle smēķēšanas atmešanai;
- Pārbauda, vai bufera uzlīmes atspoguļo automašīnas īpašnieka uzvedību.
Statistisko hipotēžu pārbaudei ir svarīga loma statistikā kopumā un statistiskajos secinājumos. Vērtību testēšana tiek izmantota kā aizstājējs tradicionālajam prognozētās vērtības un eksperimentālā rezultāta salīdzinājumam zinātniskās metodes pamatā. Ja teorija spēj paredzēt tikai attiecības zīmi, virzītu hipotēžu testus var konfigurēt tā, lai teoriju atbalstītu tikai statistiski nozīmīgs rezultāts. Šī vērtēšanas teorijas forma ir visstingrākākritika par hipotēžu pārbaudes izmantošanu.