Izračunaj kovarianco

Avtor: Judy Howell
Datum Ustvarjanja: 2 Julij. 2021
Datum Posodobitve: 1 Julij. 2024
Anonim
Izračunaj kovarianco - Nasveti
Izračunaj kovarianco - Nasveti

Vsebina

Kovarianca je statistični izračun, s katerim je razmerje med dvema naboroma podatkov bolj pregledno. Denimo, da antropologi preučujejo višino in težo populacije znotraj določene kulture. Za vsako osebo v študiji lahko višino in težo prikažemo s pari podatkov (x, y). Te vrednosti lahko uporabimo v standardni formuli za izračun kovariančne relacije. V tem članku so najprej pojasnjeni izračuni za določanje kovarijance nabora podatkov. Nato bomo razpravljali o dveh drugih avtomatiziranih načinih določanja rezultata.

Stopati

Metoda 1 od 4: Kovarianco izračunamo z roko po standardni formuli

  1. Spoznajte standardno kovariančno formulo in njene dele. Standardna formula za izračun kovariacije je Σ(XjazXpovprečno)(yjazypovprečno)/(n1){ displaystyle Sigma (x_ {i} -x _ { text {avg}}) (y_ {i} -y _ { text {avg}}) / (n-1)}Sestavite svojo podatkovno tabelo. Preden začnete, je koristno zbrati svoje podatke. Ustvarite tabelo, sestavljeno iz petih stolpcev. Vsak stolpec morate prijaviti na naslednji način:
    • X{ displaystyle x}Izračunajte sredino x podatkovnih točk. Ta vzorec nabora podatkov vsebuje 9 številk. Če želite najti povprečje, jih zberite in vsoto delite z 9. Tako dobite rezultat 1 + 3 + 2 + 5 + 8 + 7 + 12 + 2 + 4 = 44. Ko to delite z 9, dobite povprečje 4.89. To je vrednost, ki jo boste uporabili kot x (povprečno) za prihajajoče izračune.
    • Izračunajte srednjo vrednost podatkovnih točk y. Ta stolpec y mora vsebovati tudi 9 podatkovnih točk, ki sovpadajo s podatkovnimi točkami x. Določite povprečje teh. Za ta vzorec nabora podatkov to postane 8 + 6 + 9 + 4 + 3 + 3 + 2 + 7 + 7 = 49. Delite to skupno z 9, da dobite povprečje 5,44. Kot vrednost y (povprečje) boste uporabili 5,44 za prihajajoče izračune.
    • Izračunajte vrednosti (XjazXpovprečno){ displaystyle (x_ {i} -x _ { text {avg}})}}Izračunajte vrednosti (yjazypovprečno){ displaystyle (y_ {i} -y _ { text {avg}})}}Izračunajte izdelke za vsako podatkovno vrstico. Vrstice zadnjega stolpca izpolnite tako, da pomnožite številke, ki ste jih izračunali v prejšnjih stolpcih (XjazXpovprečno){ displaystyle (x_ {i} -x _ { text {avg}})}}Poiščite vsoto vrednosti v zadnjem stolpcu. Tu pride simbol Σ. Ko opravite vse dosedanje izračune, dodajte rezultate. Za ta vzorec nabora podatkov bi morali imeti v zadnjem stolpcu devet vrednosti. Seštejte teh devet števil. Pazite, ali je število pozitivno ali negativno.
      • Vsota tega vzorčnega nabora podatkov naj bi znašala -64,57. To skupno število zapišite v prostor na dnu stolpca. To je vrednost števca standardne kovariančne formule.
    • Izračunajte imenovalec kovariančne formule. Števnik standardne kovariančne formule je vrednost, ki ste jo pravkar izračunali. Imenovalec je predstavljen z (n-1) in je za eno manj kot število parov podatkov v vašem naboru podatkov.
      • V tem primeru problema je devet parov podatkov, torej je n 9. Zato je vrednost (n-1) enaka 8.
    • Števnik delimo z imenovalcem. Zadnji korak pri izračunu kovarijance je razdelitev števca, Σ(XjazXpovprečno)(yjazypovprečno){ displaystyle Sigma (x_ {i} -x _ { text {avg}}) (y_ {i} -y _ { text {avg}})}Opazite, kakšni so ponavljajoči se izračuni. Kovarianca je izračun, ki ga morate nekajkrat narediti ročno, da boste razumeli pomen rezultata. Če pa boste za interpretacijo podatkov rutinsko uporabljali kovarianco, potem potrebujete hitrejši in bolj avtomatiziran način za doseganje rezultatov. Zdaj ste že opazili, da so bili pri našem sorazmerno majhnem naboru podatkov, ki obsega le devet podatkovnih parov, izračuni sestavljeni iz dveh sredin, osemnajstih ločenih odštevanj, devetih množenj, enega seštevanja in nazadnje drugega deljenja. To je 31 razmeroma majhnih izračunov za iskanje rešitve. Med potjo tvegate, da boste zamudili negativne znake ali napačno kopirali rezultate, tako da odgovor ne bo več pravi.
    • Ustvarite delovni list za izračun kovarijance. Če poznate Excel (ali drug program za izračun), lahko enostavno ustvarite tabelo za določanje kovariacije. Označite naslove petih stolpcev tako kot pri izračunih ročno: x, y, (x (i) -x (avg)), (y (i) -y (avg)) in Product.
      • Če želite poenostaviti poimenovanje, pokličite tretji stolpec na primer »x razlika« in četrti stolpec »y razlika«, če se spomnite pomena podatkov.
      • Če se tabela začne v zgornjem levem kotu delovnega lista, bo celica A1 označena z x, druge oznake pa se nadaljujejo do celice E1.
    • Vnesite podatkovne točke. Vnesite vrednosti podatkov v dva stolpca x in y. Ne pozabite, da je vrstni red podatkovnih točk pomemben, zato morate vsak y povezati z ustrezno vrednostjo x.
      • Vrednosti x se začnejo v celici A2 in se nadaljujejo do števila podatkovnih točk, ki jih potrebujete.
      • Vrednosti y se začnejo v celici B2 in se nadaljujejo do števila podatkovnih točk, ki jih potrebujete.
    • Določite povprečje vrednosti x in y. Excel vam zelo hitro izračuna povprečja. V prvo prazno celico pod vsakim stolpcem podatkov vnesite formulo = AVERAGE (A2: A ___). V prazen prostor vnesite številko celice, ki ustreza vaši zadnji podatkovni točki.
      • Če imate na primer 100 podatkovnih točk, so celice od A2 do A101 zapolnjene, zato v celico vtipkate = AVERAGE (A2: A101).
      • Za podatke y vnesite formulo = AVERAGE (B2: B101).
      • Ne pozabite, da se formula v Excelu začne z znakom "=".
    • Vnesite formulo za stolpec (x (i) -x (avg)). V celico C2 vnesite formulo za izračun prvega odštevanja. Ta formula postane: = A2 -___. V prazen prostor vnesite naslov celice, ki vsebuje sredino podatkov x.
      • Na primer, od 100 podatkovnih točk bo povprečje v celici A103, zato vaša formula postane: = A2-A103.
    • Ponovite formulo za podatkovne točke (y (i) -y (avg)). Po istem primeru vstopi v celico D2. Formula postane: = B2-B103.
    • Vnesite formulo za stolpec "Izdelek". V peti stolpec vnesite v celico E2 formulo za izračun zmnožka dveh predhodnih celic. To nato postane: = C2 * D2.
    • Kopirajte formule, da zapolnite tabelo. Do zdaj ste programirali le prvih nekaj podatkovnih točk v 2. vrstici. Z miško označite celice C2, D2 in E2. Kazalec postavite na majhno polje v spodnjem desnem kotu, dokler se ne prikaže znak plus. Kliknite in pridržite gumb miške ter povlecite miško navzdol, da razširite izbor in zapolnite celotno podatkovno tabelo. Ta korak bo samodejno kopiral tri formule iz celic C2, D2 in E2 v celotno tabelo. Tabelo je treba samodejno izpolniti z vsemi izračuni.
    • Programirajte vsoto zadnjega stolpca. Potrebujete vsoto izdelkov v stolpcu "Izdelek". V prazno celico tik pod zadnjo podatkovno točko v tem stolpcu vnesite formulo: = SUM (E2: E ___). V prazen prostor vnesite naslov celice zadnje podatkovne točke.
      • V primeru s 100 podatkovnimi točkami ta formula preide v celico E103. Tip: = SUM (E2: E102).
    • Določite kovarianco. Lahko tudi naročite, da Excel opravi končni izračun namesto vas. Zadnji izračun v celici E103 v našem primeru predstavlja števec formule kovariacije. Tik pod to celico vnesite formulo: = E103 / ___. V prazen prostor vnesite število podatkovnih točk, ki jih imate. V našem primeru je to 100. Rezultat je kovarianca vaših podatkov.

Metoda 3 od 4: Uporaba spletnih kovariančnih kalkulatorjev

  1. V spletu poiščite kovariančne kalkulatorje. Različne šole, podjetja ali drugi viri imajo spletna mesta, ki za vas zelo enostavno izračunajo vrednosti kovariacije. V iskalniku uporabite iskalni izraz "kalkulator kovariacije".
  2. Vnesite svoje podatke. Natančno preberite navodila na spletnem mestu, da se prepričate, da ste podatke pravilno vnesli. Pomembno je, da so vaši podatkovni pari v redu, sicer bo ustvarjeni rezultat napačna kovarianca. Spletna mesta imajo različne sloge vnosa podatkov.
    • Na spletnem mestu http://ncalculators.com/statistics/covariance-calculator.htm je na primer vodoravno polje za vnos vrednosti x in drugo vodoravno polje za vnos vrednosti y. Podatke morate vnesti ločeno z vejicami. Tako je treba nabor podatkov x, izračunan prej v tem članku, vnesti kot 1,3,2,5,8,7,12,2,4. Podatki o y kot 8,6,9,4,3,3,2,7,7.
    • Na drugem spletnem mestu, https://www.thecalculator.co/math/Covariance-Calculator-705.html, boste morali v prvo polje vnesti podatke x. Podatki se vnesejo navpično, z enim elementom v vrstico. Zato je vnos na tej spletni strani videti tako:
    • 1
    • 3
    • 2
    • 5
    • 8
    • 7
    • 12
    • 2
    • 4
  3. Izračunajte svoje rezultate. Privlačnost teh spletnih izračunov je, da morate po vnosu podatkov ponavadi samo klikniti gumb "Izračunaj" in rezultati se bodo prikazali samodejno. Večina spletnih mest vam bo zagotovila vmesne izračune x (povprečje), y (povprečje) in n.

Metoda 4 od 4: Razlaga rezultatov kovarijance

  1. Poiščite pozitiven ali negativen odnos. Kovarianca je eno statistično število, ki označuje razmerje med enim naborom podatkov in drugim. V uvodno omenjenem primeru se izmeri višina in teža. Pričakovali bi, da se bo z naraščanjem ljudi povečala tudi njihova teža, kar bo privedlo do pozitivnega kovariančnega pogleda. Drug primer: Recimo, da se zbirajo podatki, ki kažejo, koliko ur nekdo vadi golf in rezultat, ki ga doseže. V tem primeru pričakujete negativno kovarianco, kar pomeni, da se bo s povečanjem števila ur treninga rezultat golfa zmanjšal. (Pri golfu je boljši nižji rezultat).
    • Razmislite o vzorčnem naboru podatkov, izračunanem zgoraj. Nastala kovarianca je -8,07. Znak minus pomeni, da se z naraščanjem vrednosti x vrednosti y ponavadi zmanjšujejo. To je res, če pogledate nekatere vrednote. Na primer, vrednosti x 1 in 2 ustrezajo vrednostim y 7, 8 in 9. Vrednosti x 8 in 12 so povezane z vrednostmi y 3 in 2 .
  2. Interpretirajte velikost kovarijance. Če je število kovariančnih ocen veliko, bodisi veliko pozitivno število bodisi veliko negativno število, lahko to razlagate kot dva podatkovna elementa, ki sta močno povezana, bodisi pozitivno bodisi negativno.
    • Kovarianca vzorčnega nabora podatkov -8,07 je precej velika. Upoštevajte, da se podatki gibljejo od 1 do 12. Torej je 8 precej veliko število. To kaže na dokaj močno povezavo med nabori podatkov x in y.
  3. Razumevanje pomanjkanja odnosa. Če je vaš rezultat kovarianca, ki je enaka ali zelo blizu 0, lahko ugotovite, da podatkovne točke niso povezane. To pomeni, da lahko povečanje ene vrednosti povzroči, vendar ni nujno, da se poveča druga. Izraza sta povezana skoraj naključno.
    • Recimo, da velikost čevljev povežete z ocenami izpitov. Ker na dejavnike študentskega izpita vpliva toliko dejavnikov, lahko pričakujemo kovariančno oceno blizu 0. To kaže, da med obema vrednostma skoraj ni povezave.
  4. Oglejte si odnos grafično. Če želite vizualno razumeti kovarianco, lahko svoje podatkovne točke narišete na graf x, y. Ko to storite, bi lahko zlahka videli, da se točke, čeprav ne ravno v ravni črti, ponavadi približujejo kopici v diagonalni črti od zgoraj levo navzdol desno. To je opis negativne kovarijance. Prav tako lahko vidite, da je vrednost kovariacije enaka -8,07. To je precej veliko število v primerjavi s podatkovnimi točkami. Veliko število kaže na to, da je kovarianca precej močna, kar lahko ugotovite iz linearne oblike podatkovnih točk.
    • Če želite še enkrat iti skozi to, preberite članke o risanju točk v koordinatnem sistemu na wikiHow.

Opozorila

  • Kovarianca ima omejeno uporabo v statistiki. Pogosto gre za izračun korelacijskih koeficientov ali drugih konceptov. Bodite previdni pri preveč drznih interpretacijah na podlagi kovariančne ocene.