Kako izračunati emisije

Avtor: Janice Evans
Datum Ustvarjanja: 23 Julij. 2021
Datum Posodobitve: 1 Julij. 2024
Anonim
Kako izracunati nutritivni unos | Proteina - Masti i Ugljikohidrata | Procjena vaseg Body Fat-a
Video.: Kako izracunati nutritivni unos | Proteina - Masti i Ugljikohidrata | Procjena vaseg Body Fat-a

Vsebina

V statistiki so odstopanja vrednosti, ki se močno razlikujejo od drugih vrednosti v zbranem naboru podatkov. Odstotek lahko kaže na nepravilnosti pri distribuciji podatkov ali napakah pri merjenju, zato so odstopanja pogosto izključena iz nabora podatkov. Z odstranitvijo odstopanj iz nabora podatkov lahko pridete do nepričakovanih ali natančnejših zaključkov. Zato je treba znati izračunati in oceniti odstopanja, da se zagotovi pravilno razumevanje statistike.

Koraki

  1. 1 Naučite se prepoznati potencialne odstopke. Pred izključitvijo odstopanja iz nabora podatkov je treba ugotoviti možne odstopanja. Odstopanja so vrednosti, ki se zelo razlikujejo od večine vrednosti v naboru podatkov; z drugimi besedami, odstopanja so zunaj trenda večine vrednot. To je enostavno najti v tabelah vrednosti ali (zlasti) v grafih. Če so vrednosti v nizu podatkov narisane, bodo odstopanja daleč od večine drugih vrednosti. Če na primer večina vrednosti pade na ravno črto, potem odstopanja ležijo na obeh straneh take ravne črte.
    • Na primer, razmislite o nizu podatkov, ki predstavlja temperature 12 različnih predmetov v sobi. Če je 11 predmetov približno 70 stopinj, vendar je dvanajsti predmet (po možnosti peč) 300 stopinj, lahko hiter pogled na vrednosti pokaže, da je peč verjetno izpihovanje.
  2. 2 Podatke razvrstite po naraščajočem vrstnem redu. Prvi korak pri določanju odstopanj je izračun mediane nabora podatkov. Ta naloga je zelo poenostavljena, če so vrednosti v naboru podatkov razporejene po naraščajočem vrstnem redu (od najmanjšega do največjega).
    • Nadaljujemo z zgornjim primerom in razmislimo o naslednjem nizu podatkov, ki predstavlja temperature več predmetov: {71, 70, 73, 70, 70, 69, 70, 72, 71, 300, 71, 69}. Ta niz je treba naročiti na naslednji način: {69, 69, 70, 70, 70, 70, 71, 71, 71, 72, 73, 300}.
  3. 3 Izračunajte mediano nabora podatkov. Mediana nabora podatkov je vrednost na sredini nabora podatkov. Če nabor podatkov vsebuje liho število vrednosti, je mediana vrednost pred in po kateri je v naboru podatkov enako število vrednosti. Če pa nabor podatkov vsebuje sodo število vrednosti, morate najti aritmetično sredino obeh sredin. Upoštevajte, da se pri izračunu odstopanja mediana običajno imenuje Q2, saj leži med Q1 in Q3, spodnjim in zgornjim kvartilom, kar bomo opredelili kasneje.
    • Ne bojte se delati z nabori podatkov, ki imajo sodo število vrednosti- aritmetična sredina obeh sredin bo število, ki ni v naboru podatkov; to je normalno. Če pa sta dve srednji vrednosti isto število, potem je aritmetična sredina enaka temu številu; to je tudi v vrstnem redu stvari.
    • V zgornjem primeru sta srednji 2 vrednosti 70 in 71, zato je mediana ((70 + 71) / 2) = 70,5.
  4. 4 Izračunajte spodnji kvartil. Ta vrednost, imenovana Q1, je pod 25% vrednosti nabora podatkov. Z drugimi besedami, to je polovica vrednosti do mediane. Če je pred mediano sodo število vrednosti iz nabora podatkov, morate za izračun Q1 poiskati aritmetično sredino obeh srednjih vrednosti (to je podobno kot izračun mediane).
    • V našem primeru se 6 vrednosti nahaja za mediano in 6 vrednosti- pred njo. To pomeni, da moramo za izračun spodnjega kvartila najti aritmetično sredino dveh sredin šestih vrednosti, ki ležita pred mediano. Tu sta povprečni vrednosti 70 in 70. Tako je Q1 = ((70 + 70) / 2) = 70.
  5. 5 Izračunajte zgornji kvartil. Ta vrednost, imenovana Q3, je višja od 25% vrednosti nabora podatkov. Postopek za izračun Q3 je podoben postopku za izračun Q1, vendar so tukaj upoštevane vrednosti po mediani.
    • V zgornjem primeru sta povprečja šestih po mediani 71 in 72. Torej je Q3 = ((71 + 72) / 2) = 71,5.
  6. 6 Izračunajte interkvartilni razpon. Po izračunu Q1 in Q3 je treba najti razdaljo med temi vrednostmi. Če želite to narediti, odštejte Q1 od Q3. Vrednost interkvartilnega območja je izredno pomembna za določanje meja vrednot, ki niso odstopanja.
    • V našem primeru je Q1 = 70 in Q3 = 71,5. Interkvartilno območje je 71,5 - 70 = 1,5.
    • Upoštevajte, da to velja tudi za negativne vrednosti Q1 in Q3. Na primer, če je Q1 = -70, je interkvartilno območje 71,5 -(-70) = 141,5.
  7. 7 Poiščite "notranje meje" vrednosti v naboru podatkov. Odstopanja se določijo z analizo vrednot- ne glede na to, ali spadajo v tako imenovane "notranje meje" in "zunanje meje". Vrednost zunaj "notranjih meja" je razvrščena kot "manjša odstopanja", vrednost zunaj "zunanjih meja" pa kot "pomembna zunanja meja". Če želite najti notranje meje, morate medkvartilno območje pomnožiti z 1,5; rezultat je treba dodati v Q3 in odšteti od Q1. Dve najdeni številki sta notranji meji nabora podatkov.
    • V našem primeru je interkvartilno območje (71,5 - 70) = 1,5. Nadalje: 1,5 * 1,5 = 2,25. To številko je treba dodati Q3 in odšteti od Q1, da bi našli notranje meje:
      • 71,5 + 2,25 = 73,75
      • 70 - 2,25 = 67,75
      • Tako so notranje meje 67,75 in 73,75.
    • V našem primeru je le temperatura peči - 300 stopinj - zunaj teh meja in se lahko šteje za zanemarljivo emisijo. Toda ne sklepajte prehitro - ugotoviti moramo, ali je ta temperatura pomemben odstop.
  8. 8 Poiščite "zunanje meje" nabora podatkov. To se naredi na enak način kot pri notranjih mejah, le da se interkvartilni razpon pomnoži s 3 namesto s 1,5. Rezultat je treba dodati v Q3 in odšteti od Q1. Dve najdeni številki sta zunanji meji nabora podatkov.
    • V našem primeru pomnožite interkvartilno območje s 3: 1,5 * 3 = 4,5. Izračunajte zunanje meje:
      • 71,5 + 4,5 = 76
      • 70 - 4,5 = 65,5
      • Zunanji meji sta torej 65,5 in 76.
    • Vse vrednosti, ki presegajo zunanje meje, se štejejo za pomembne emisije. V našem primeru je temperatura peči 300 stopinj pomemben izpuh.
  9. 9 Uporabite kvalitativno oceno, da ugotovite, ali je treba iz zbirke podatkov izključiti odstopanja. Zgoraj opisana metoda vam omogoča, da ugotovite, ali so nekatere vrednosti odmične (manjše ali pomembne). Da ne bo pomote - vrednost, ki je razvrščena kot odstopanje, je le "kandidat" za izjemo, kar pomeni, da je ni treba izključiti. Vzrok za odstopanje je glavni dejavnik, ki vpliva na odločitev o izključitvi odstopanja. Praviloma so izločki, ki nastanejo zaradi napak (pri meritvah, posnetkih itd.), Izključeni. Po drugi strani pa v zbirki podatkov običajno ostanejo odstopanja, ki niso povezana z napakami, ampak z novimi informacijami ali trendom.
    • Enako pomembno je oceniti učinek odstopanj na mediano nabora podatkov (ne glede na to, ali ga popačijo ali ne). To je še posebej pomembno, ko sklepate na podlagi mediane nabora podatkov.
    • V našem primeru je zelo malo verjetno, da se bo pečica segrela na temperaturo 300 stopinj (razen če upoštevamo naravne nepravilnosti). Zato je mogoče z visoko stopnjo gotovosti sklepati, da je takšna temperatura merilna napaka, ki jo je treba izključiti iz nabora podatkov. Poleg tega, če ne izključite odstopanja, bo mediana nabora podatkov (69 + 69 + 70 + 70 + 70 + 70 + 71 + 71 + 71 + 72 + 73 + 300) / 12 = 89,67 stopinj, če pa izključite odstopanje, bo mediana (69 + 69 + 70 + 70 + 70 + 70 + 71 + 71 + 71 + 72 + 73) / 11 = 70,55 stopinj.
      • Odstopanja so običajno posledica človeške napake, zato jih je treba izključiti iz naborov podatkov.
  10. 10 Razumeti pomen (včasih) odstopanj v naboru podatkov. Nekatere odstopanja je treba izključiti iz nabora podatkov, ker so posledica napak in tehničnih težav; druge odstopanja je treba pustiti v naboru podatkov. Če na primer odstopanje ni posledica napake in / ali zagotavlja novo razumevanje preizkušenega pojava, ga je treba pustiti v naboru podatkov. Znanstveni poskusi so še posebej občutljivi na odstopanja - če pomotoma odstranite odstopanje, boste morda zamudili kakšen nov trend ali odkritje.
    • Na primer, razvijamo novo zdravilo za povečanje velikosti rib v ribištvu. Uporabili bomo stari nabor podatkov ({71, 70, 73, 70, 70, 69, 70, 72, 71, 300, 71, 69}), vendar bo tokrat vsaka vrednost predstavljala težo ribe (v gramih) po zaužitju eksperimentalnega zdravila. Z drugimi besedami, prvo zdravilo vodi do povečanja teže rib do 71 g, drugo zdravilo - do 70 g itd. V tem primeru je 300 pomemben odstopalec, vendar ga ne smemo izključiti; če predpostavimo, da ni bilo merilnih napak, potem je takšen odstotek pomemben uspeh v poskusu. Zdravilo, ki je povečalo težo rib na 300 gramov, deluje veliko bolje kot druga zdravila; zato je 300 najpomembnejša vrednost v naboru podatkov.

Nasveti

  • Ko odkrijete odstopanja, poskusite razložiti njihovo prisotnost, preden jih izključite iz nabora podatkov. Lahko nakazujejo napake pri merjenju ali porazdelitvene nepravilnosti.

Kaj potrebujete

  • Kalkulator