Statistikas informācija: apkopošana, apstrāde, analīze

Satura rādītājs:

Statistikas informācija: apkopošana, apstrāde, analīze
Statistikas informācija: apkopošana, apstrāde, analīze
Anonim

Visā statistikas vēsturē ir bijuši dažādi mēģinājumi izveidot mērījumu līmeņu taksonomiju. Psihofiziķis Stenlijs Smits Stīvenss definēja nominālās, kārtas, intervāla un proporcionālās skalas.

Nominālajiem mērījumiem nav nozīmīgas vērtību secības, un tie pieļauj jebkādu reklāmguvumu viens pret vienu.

Parastajām dimensijām ir neprecīzas atšķirības starp secīgām vērtībām, taču tām ir noteikta šo vērtību secība, un tās pieļauj jebkādas secības saglabāšanas transformācijas.

Intervāla mērījumiem ir nozīmīgi attālumi starp punktiem, taču nulles vērtība ir patvaļīga (tāpat kā garuma un temperatūras mērījumiem pēc Celsija vai Fārenheita) un pieļauj jebkādu lineāru transformāciju.

Attiecību izmēriem ir gan nozīmīga nulles vērtība, gan attālumi starp dažādiem izmēriem, un tie ļauj veikt jebkādas mērogošanas transformācijas.

Image
Image

Mainīgie un informācijas klasifikācija

Jo mainīgiekas atbilst tikai nominālajiem vai kārtas mērījumiem, nevar saprātīgi izmērīt skaitliski, un dažreiz tie tiek grupēti kā kategoriski mainīgie. Attiecības un intervālu mērījumi tiek grupēti kā kvantitatīvi mainīgie, kas var būt diskrēti vai nepārtraukti to skaitliskā rakstura dēļ. Šādas atšķirības bieži vien ir vāji saistītas ar datu tipu datorzinātnēs, jo dihotomus kategoriskos mainīgos var attēlot ar Būla vērtībām, politomiskiem kategoriskiem mainīgajiem ar patvaļīgiem veseliem skaitļiem integrālā datu tipā un nepārtrauktiem mainīgajiem ar reāliem komponentiem, kas ietver aprēķinu ar peldošā komata palīdzību. Taču statistiskās informācijas datu tipu attēlošana ir atkarīga no piemērotās klasifikācijas.

Statistikas informācija par strādniekiem
Statistikas informācija par strādniekiem

Citas klasifikācijas

Izveidotas arī citas statistikas datu (informācijas) klasifikācijas. Piemēram, Mosteller un Tukey nošķīra pakāpes, pakāpes, skaitītās daļas, skaitu, summas un atlikumus. Nelders savulaik aprakstīja nepārtrauktas skaitīšanas, nepārtrauktas attiecības, skaitīšanas korelāciju un kategoriskus datu pārraides veidus. Visas šīs klasifikācijas metodes tiek izmantotas statistikas informācijas vākšanā.

Problēmas

Jautājumu par to, vai ir lietderīgi piemērot dažāda veida statistikas metodes datiem, kas iegūti, izmantojot dažādas mērīšanas (savākšanas) procedūras, sarežģī problēmas, kas saistītas ar mainīgo lielumu konvertēšanu un precīzu jautājumu interpretāciju.pētījumiem. Saistība starp datiem un to, ko tie apraksta, vienkārši atspoguļo faktu, ka noteikta veida statistikas paziņojumiem var būt patiesības vērtības, kas nav nemainīgas noteiktās transformācijās. Tas, vai transformāciju ir vērts apsvērt, ir atkarīgs no jautājuma, uz kuru mēģināt atbildēt.

Statistiskās informācijas piemērs
Statistiskās informācijas piemērs

Kas ir datu tips

Datu tips ir mainīgā semantiskā satura pamatkomponents, un tas nosaka, kāda veida varbūtības sadalījumus var loģiski izmantot, lai aprakstītu mainīgo, ar to atļautās darbības, tā prognozēšanai izmantotās regresijas analīzes veidu. uc Datu tipa jēdziens mērījumu līmeņa jēdzienā ir līdzīgs, taču konkrētāks - piemēram, datu uzskaitei ir nepieciešams atšķirīgs sadalījums (Puasona vai binomiāls) nekā nenegatīvām reālajām vērtībām, taču abi ir vienādi. mērījumu līmenis (koeficientu skala).

Statistiskā informācija par tiesnešiem
Statistiskā informācija par tiesnešiem

Svari

Ir veikti dažādi mēģinājumi izveidot mērījumu līmeņu taksonomiju statistikas informācijas apstrādei. Psihofiziķis Stenlijs Smits Stīvenss definēja nominālās, kārtas, intervāla un proporcionālās skalas. Nominālajiem mērījumiem nav nozīmīgas rindu secības starp vērtībām, un tie pieļauj jebkādu konvertēšanu viens pret vienu. Parastajiem mērījumiem ir neprecīzas atšķirības starp secīgām vērtībām, taču tās atšķiras šo vērtību nozīmīgajā secībā un ļaujjebkura kārtību saglabājoša transformācija. Intervālu mērījumiem ir nozīmīgi attālumi starp mērījumiem, taču nulles vērtība ir patvaļīga (tāpat kā garuma un temperatūras mērījumiem pēc Celsija vai Fārenheita) un pieļauj jebkādu lineāru transformāciju. Attiecību izmēriem ir gan nozīmīga nulles vērtība, gan attālumi starp dažādiem definētiem izmēriem, un tie ļauj veikt jebkādas mērogošanas transformācijas.

Diagrammas modelis
Diagrammas modelis

Dati, kurus nevar aprakstīt, izmantojot vienu skaitli, bieži tiek iekļauti reālu gadījuma lielumu gadījuma vektoros, lai gan pieaug tendence tos apstrādāt pašiem. Šādi piemēri tiks apspriesti tālāk.

Nejauši vektori

Atsevišķi elementi var būt vai nav saistīti. Sadalījumu piemēri, ko izmanto, lai aprakstītu korelētus nejaušības vektorus, ir daudzfaktoru normālais sadalījums un daudzfaktoru t sadalījums. Parasti starp jebkuriem elementiem var būt patvaļīgas korelācijas, taču tās bieži vien kļūst nekontrolējamas, pārsniedzot noteiktu lielumu, un ir nepieciešami papildu ierobežojumi korelētajiem komponentiem.

statistikas atribūti
statistikas atribūti

Nejaušas matricas

Nejaušas matricas var sakārtot lineāri un uzskatīt par nejaušiem vektoriem, tomēr tas var nebūt efektīvs veids, kā attēlot korelācijas starp dažādiem elementiem. Daži varbūtības sadalījumi ir īpaši izstrādāti nejaušām matricām, piemēram, parastajai matricaiizplatīšana un Wishart izplatīšana.

Nejaušas secības

Dažreiz tos uzskata par tādiem pašiem kā nejaušības vektoriem, bet citos gadījumos šis termins tiek lietots īpaši gadījumiem, kad katrs nejaušais mainīgais korelē tikai ar blakus esošajiem mainīgajiem (kā Markova modelī). Šis ir īpašs Bajesa tīkla gadījums, un to izmanto ļoti garām sekvencēm, piemēram, gēnu ķēdēm vai gariem teksta dokumentiem. Vairāki modeļi ir īpaši izstrādāti šādām sekvencēm, piemēram, slēptajām Markova sekvencēm.

Tipiska diagramma
Tipiska diagramma

Nejauši procesi

Tās ir līdzīgas nejaušām sekvencēm, taču tikai tad, ja secības garums ir nenoteikts vai bezgalīgs un secības elementi tiek apstrādāti pa vienam. To bieži izmanto datiem, ko var raksturot kā laikrindas. Tas attiecas, piemēram, uz akciju cenu nākamajā dienā.

Secinājums

Statistikas informācijas analīze ir pilnībā atkarīga no tās vākšanas kvalitātes. Pēdējais savukārt ir cieši saistīts ar tā klasifikācijas iespējām. Protams, ir daudz statistiskās informācijas klasifikācijas veidu, par ko lasītājs varēja pārliecināties, izlasot šo rakstu. Neskatoties uz to, efektīvu rīku klātbūtne un labas matemātikas zināšanas, kā arī zināšanas socioloģijas jomā darīs savu darbu, ļaujot veikt jebkuru aptauju vai pētījumu bez būtiskiem kļūdu labojumiem. Statistiskās informācijas avoti formācilvēki, organizācijas un citi socioloģijas priekšmeti, par laimi, ir pārstāvēti ļoti bagātīgi. Un nekādas grūtības nevar stāties ceļā īstam pētniekam.

Ieteicams: