Kako oceniti statistično pomembnost

Avtor: Randy Alexander
Datum Ustvarjanja: 2 April 2021
Datum Posodobitve: 26 Junij 2024
Anonim
Statistical Programming with R by Connor Harris
Video.: Statistical Programming with R by Connor Harris

Vsebina

Preizkušanje hipotez vodi statistična analiza. Statistično pomembno zaupanje se izračuna z uporabo vrednosti p - kar kaže na verjetnost opazovanega rezultata, če določena trditev (nična hipoteza) drži. Če je vrednost p manjša od ravni pomembnosti (običajno 0,05), lahko eksperimentator ugotovi, da obstaja dovolj dokazov, da zavrne nično hipotezo in prizna obratno hipotezo. S preprostim t-testom lahko izračunate p-vrednost in določite pomembnost med dvema različnima skupinama podatkov.

Koraki

1. del od 3: Nastavite svoje preizkuse

  1. Ugotovite svojo hipotezo. Prvi korak pri ocenjevanju statistične pomembnosti je določitev vprašanj, na katera boste odgovorili, in razglasitev vaše hipoteze. Hipoteza je navedba empiričnih podatkov in možnih razlik v populaciji. Vsak poskus ima nično hipotezo in obratno hipotezo. Na splošno boste primerjali dve skupini in ugotovili, ali sta enaki ali različni.
    • Na splošno hipoteza ni (H0) potrjujejo, da med obema skupinama podatkov ni razlike. Primer: Učenci, ki gradivo preberejo pred poukom, ne dobijo boljših končnih ocen.
    • Inverzna hipoteza (Ha) je v nasprotju z nično hipotezo in je izjava, ki jo poskušate podkrepiti s svojimi empiričnimi podatki. Primer: Učenci, ki gradivo preberejo pred poukom, dejansko dobijo boljše končne ocene.

  2. Izberite stopnjo pomembnosti, da določite stopnjo razlike, ki je v podatkih lahko pomembna. Raven pomembnosti (znana tudi kot alfa) je prag, ki ga izberete za določitev pomena. Če je vrednost p manjša ali enaka dani stopnji pomembnosti, se podatki štejejo za statistično pomembne.
    • Praviloma je raven pomembnosti (ali alfa) običajno izbrana na ravni 0,05 - kar pomeni, da je verjetnost opazovanja razlike, ki jo vidimo na podatkih, naključna le 5%.
    • Višja kot je stopnja zaupanja (in zato nižja je p-vrednost), bolj pomembni so rezultati.
    • Če je potrebno več zaupanja, znižajte vrednost p na 0,01. V proizvodnji se pogosto uporablja nizka vrednost p za odkrivanje napak na izdelku. Visoka stopnja zanesljivosti je ključnega pomena za sprejetje dejstva, da bo vsak del deloval, kot bi moral biti.
    • Za večino eksperimentov, ki temeljijo na hipotezah, je sprejemljiva raven pomembnosti 0,05.

  3. Odločite se, ali boste uporabili enostranski ali dvostranski test. Ena od predpostavk t-testa je, da so vaši podatki v običajni distribuciji. Normalna porazdelitev bo tvorila zvončno krivuljo z večino opazovanj v središču. T-test je matematični test, ki preverja, ali vaši podatki spadajo na zunanjo stran običajne porazdelitve, zgoraj ali spodaj, v "zgornjem" delu krivulje.
    • Če niste prepričani, ali so podatki nad ali pod kontrolno skupino, uporabite dvostranski test. Omogoča vam preverjanje pomembnosti v obe smeri.
    • Če veste, kakšna je pričakovana smer vaših podatkov, uporabite enostranski test. V zgornjem primeru pričakujete, da se bodo študentovi rezultati izboljšali. Zato uporabljate enosmerni test.

  4. Z analizo sile določite velikost vzorca. Sila testa je sposobnost opazovanja pričakovanega rezultata z dano velikostjo vzorca. Skupni prag sile (ali β) je 80%. Analiza sile je lahko precej zapletena brez predhodnih podatkov, ker potrebujete nekaj informacij o pričakovani srednji vrednosti med skupinami in njihovih standardnih odmikih. S spletno analizo sile določite optimalno velikost vzorca za vaše podatke.
    • Raziskovalci pogosto opravijo majhno predpostavko za informiranje analize sile in odločitev o velikosti vzorca, ki je potrebna za obsežno in obsežno študijo.
    • Če ni mogoče opraviti zapletenih preiskav, ocenite možno povprečje na podlagi branja člankov in raziskav, ki so jih morda opravili drugi posamezniki. Lahko vam da dober začetek pri določanju velikosti vzorcev.
    oglas

2. del od 3: Izračunajte standardni odklon

  1. Določite formulo za standardni odklon. Standardni odklon meri razpršenost podatkov. Daje vam informacije o identiteti posamezne podatkovne točke v vzorcu. Ko prvič začnemo, so enačbe videti precej zapletene. Vendar vam bodo spodnji koraki pomagali lažje razumeti postopek izračuna. Formula je s = √∑ ((xjaz - µ) / (N - 1)).
    • s je standardni odklon.
    • ∑ pomeni, da boste morali sešteti vsa zbrana opažanja.
    • xjaz vsak predstavlja vašo vrednost podatkov.
    • µ je povprečje podatkov za vsako skupino.
    • N je skupno število opazovanj.
  2. Povprečno število opazovanj v vsaki skupini. Za izračun standardnega odklona morate najprej izračunati povprečje opazovanj za vsako posamezno skupino. Ta vrednost je simbolizirana z grško črko mu ali µ. Če želite to narediti, preprosto dodajte opažanja in jih delite s skupnim številom opazovanj.
    • Če želimo na primer poiskati povprečno oceno skupine, ki je dokument brala pred poukom, si oglejmo nekaj podatkov. Za poenostavitev bomo uporabili nabor podatkov s 5 točkami: 90, 91, 85, 83 in 94 (na 100-stopenjski lestvici).
    • Seštejte vsa opažanja: 90 + 91 + 85 + 83 + 94 = 443.
    • Zgornjo vsoto delimo s številom opazovanj N (N = 5): 443/5 = 88,6.
    • Povprečna ocena za to skupino je 88,6.
  3. Od vsake opažene vrednosti odštejemo povprečje. Naslednji korak vključuje del (xjaz - µ) enačbe. Od vsake opažene vrednosti odštejemo povprečno vrednost. Z zgornjim primerom imamo pet odštevanj.
    • (90 - 88,6), (91 - 88,6), (85 - 88,6), (83 - 88,6) in (94 - 88,6).
    • Izračunana vrednost je 1,4; 2,4; -3,6; -5,6 in 5,4.
  4. Zgornje razlike poravnaj in seštej. Vsaka nova izračunana vrednost bo zdaj na kvadrat. Tu bo odstranjen tudi negativni znak. Če se po tem koraku ali na koncu izračuna pojavi negativni znak, ste morda pozabili narediti zgornji korak.
    • V našem primeru bomo zdaj delali z 1,96; 5,76; 12,96; 31.36 in 29.16.
    • Sestavite ta kvadrat skupaj: 1,96 + 5,76 + 12,96 + 31,36 + 29,16 = 81,2.
  5. Delite s skupnim številom opazovanj minus 1. Delitev z N - 1 pomaga nadomestiti izračun, ki se ne opravi na populaciji kot celoti, ampak temelji na vzorcu vseh študentov.
    • Odštej: N - 1 = 5 - 1 = 4
    • Delitev: 81,2 / 4 = 20,3
  6. Pridobite kvadratni koren. Ko ga delimo s številom opazovanj minus 1, vzamemo kvadratni koren dobljene vrednosti. To je zadnji korak pri izračunu standardnega odklona. Nekateri statistični programi vam bodo pomagali pri izračunu po uvozu izvirnih podatkov.
    • Z zgornjim primerom je standardni odklon ocene ob koncu semestra študentov, ki berejo dokument pred poukom, s: = 20,3 = 4,51.
    oglas

Del 3 od 3: Določitev statistične pomembnosti

  1. Izračunajte varianco med obema skupinama opazovanj. Do tega trenutka je primer obravnaval le eno skupino opažanj. Za primerjavo dveh skupin očitno potrebujete podatke iz obeh. Izračunajte standardni odklon druge skupine opazovanj in z njim izračunajte varianco med obema eksperimentalnima skupinama. Formula za izračun variance je: sd = √ ((s1/ N1) + (s2/ N2)).
    • Sd je varianca med skupinami.
    • S1 je standardni odklon skupin 1 in N1 je velikost skupine 1.
    • S2 je standardni odklon skupin 2 in N2 je velikost 2. skupine.
    • V našem primeru recimo, da imajo podatki iz 2. skupine (učenci, ki besedila niso prebrali pred poukom) velikost 5 in standardni odklon 5,81. Variacija je:
      • Sd = √ ((s1) / N1) + ((s2) / N2))
      • Sd = √(((4.51)/5) + ((5.81)/5)) = √((20.34/5) + (33.76/5)) = √(4.07 + 6.75) = √10.82 = 3.29.
  2. Izračunajte t-rezultat podatkov. T-statistika vam omogoča pretvorbo podatkov v obliko, ki je primerljiva z drugimi podatki. Vrednost t vam omogoča tudi izvedbo t-testa, testa, ki vam omogoča izračun verjetnosti statistično pomembne razlike med obema skupinama. Formula za izračun t-statistike je: t = (µ1 – µ2) / Sd.
    • µ1 je povprečje prve skupine.
    • µ2 je povprečje druge skupine.
    • Sd je varianca med opazovanji.
    • Uporabite večjo sredino kot µ1 da ne bi dobili negativne t-statistike.
    • Denimo, da je za naš primer ugotovljena srednja vrednost za skupino 2 (ki ni prebrala prejšnjega članka) 80. T-rezultat je: t = (µ1 – µ2) / Sd = (88,6 – 80)/3,29 = 2,61.
  3. Določite stopnjo svobode vzorca. Pri uporabi t-statistike se stopnje svobode določijo glede na velikost vzorca. Seštejte število opazovanj za vsako skupino in nato odštejte dve. V zgornjem primeru je stopnja svobode (d.f.) 8, ker je v prvi skupini 5 opazovanj, v drugi pa 5 vzorcev ((5 + 5) - 2 = 8).
  4. Za oceno pomembnosti uporabite tabelo t. Tabele vrednosti t in stopenj svobode lahko najdete v standardni statistični knjigi ali na spletu. Poiščite vrstico, ki vsebuje stopnje svobode podatkov in p-vrednost, ki ustreza t-statistiki, ki jo imate.
    • Pri stopnjah svobode 8 in t = 2,61 je vrednost p za enostranski test med 0,01 in 0,025. Ker je izbrana stopnja pomembnosti manjša ali enaka 0,05, so naši podatki statistično pomembni. S temi podatki zavrnemo nično hipotezo in sprejmemo obratno hipotezo: učenci, ki gradivo preberejo pred poukom, imajo višje končne ocene.
  5. Razmislite o nadaljnjih raziskavah. Mnogi raziskovalci izvajajo predpostavke z več meritvami, da bi razumeli, kako oblikovati večjo študijo. Če izvedete druge raziskave z več meritvami, boste povečali zaupanje v svoje sklepe. oglas

Nasvet

  • Statistika je obsežno in zapleteno področje. Za razumevanje statistične pomembnosti opravite tečaj preizkušanja statističnih hipotez v srednji šoli ali na univerzi (ali višji).

Opozorilo

  • Ta analiza se osredotoča na t-test za preverjanje razlike med obema populacijama običajne porazdelitve. Glede na zapletenost podatkov boste morda potrebovali še en statistični test.