Tilastovirhe

Jotta voidaan puuttua virhelähteitä vuonna tilastoissa , otamme esimerkki kyselyn siitä kansanäänestyksen. Yhtäältä, koska se koskee kaikkia kansalaisia, ja toisaalta mahdollisten vastausten määrä, joka on yhtä suuri kuin kaksi, yksinkertaistaa tutkimusta huomattavasti.

Tilastovirheet

Jos kysely kyselee vain yhtä henkilöä, kyselytulos osoittaa 100%: n tuloksen valitessaan ainoan vastaajan. Mikä on järjetöntä. Emme voi ekstrapoloida pienen otoksen tulosta koko väestölle. Vain kaikkien äänestäjien kuuleminen antaa mahdollisuuden tietää todellinen jakauma. Valitettavasti käytännössä voidaan tutkia vain otos tästä väestöstä. Tutkimuksen tulosta heikentää epävarmuus, joka ilmaistaan tilastovirheeksi kutsuttuun alueeseen tai luottamusväliin . Tämä virhe on pienempi, koska vastaajien määrä suuntautuu koko väestöön. Huomaa, että fyysistä mittausta varten ihanteellinen lukumäärä on ääretön.

Kansanäänestys koostuu vastaamisesta kyllä tai ei. Joko kaksi mahdollisuutta. Siksi voimme mallintaa kansanäänestystä binomisella lailla. Kuvittele, että r = 255 vastaajaa vastasi kyllä kaikista n = 500 kyselyyn osallistuneista. Sitten saadaan todennäköisyys kyllä . R: n varianssi on arvoinen . Joten p: n varianssi on . Matemaattiselta kannalta löydämme edellisen intuitiivisen käyttäytymisen. Jos n = 1, varianssi on suurin, jos n on ääretön, varianssista tulee nolla. Meidän tapauksessamme keskihajonta on 2,2%, jos todennäköisyys kyllä on 51%, ts. Todennäköisyys välillä 48,8% ja 53,2% kyllä, ja 46,8% ja 51,2%, jos ei. Tästä kyselystä ei siis voida tehdä päteviä johtopäätöksiä, sillä vastaajien määrä on selvästi valittu liian pieneksi. ${\ displaystyle p = {\ frac {r} {n}} = 0,51}$ ${\ displaystyle V (r) = np (1-p)}$ ${\ displaystyle V (p) = {\ frac {p (1-p)} {n}}}$

Systemaattiset virheet

Olemme havainneet, että tutkimuksen suurin vaikeus on valita riittävä otos. Mutta tämä ei ole ainoa virhelähde. Myös järjestelmälliset ennakkoluulot on otettava huomioon. Kyselyn tapauksessa voimme luetella seuraavat virhelähteet:

otos ei edusta väestöä
äänestäjä valehtii valitsemastaan häpeästä
vastaaja vastaa mihin tahansa päästäksesi eroon äänimerkistä mahdollisimman nopeasti

Ensimmäinen on mielenkiintoinen, koska se häiritsee tilastovirheitä. Tilastovirheet johtuvat populaation otannan tilastollisista vaihteluista. Toisin sanoen tilastovirheet ovat seurausta kyvyttömyydestä valita täydellinen otos. Toinen tapa tutkia tätä ilmiötä olisi laskea todennäköisyys täydellisen näytteen saastumiseksi kääntämällä yksi, kaksi, kolme jne. Kyllä ja ei. Kuvittele marmorisäiliö, joka sisältää 51% punaista ja 49% sinistä marmoria. Mikä olisi pallopussin kokoonpano sen koon mukaan, täytettynä pienestä astian osasta? Tämä on kuitenkin toisen asteen vaikutus. Äänestäjän on oltava varovainen, ettet kysele vain ryhmää yksilöitä, jotka haluavat kyllä tai ei, muuten tulos olisi täysin puolueellinen. Tämä ei kuitenkaan ole niin helppoa käytännössä.

Tämäntyyppisiä virheitä on paljon vaikeampaa arvioida. Mikä saa meidät epäilemään entisestään kyselymme edellistä tulosta.

Katso myös

Virhemarginaali

Aiheeseen liittyvät artikkelit

Virhe (metrologia)
Luottamusväli
Sanan " virhe " muut merkitykset