Določite korelacijski koeficient

Avtor: Morris Wright
Datum Ustvarjanja: 28 April 2021
Datum Posodobitve: 19 Junij 2024
Anonim
Spearmanov koeficijent korelacije ranga. Izračunavanje i interpretacija. Primjer u Excelu.
Video.: Spearmanov koeficijent korelacije ranga. Izračunavanje i interpretacija. Primjer u Excelu.

Vsebina

Korelacijski koeficient, označen z r ali ρ, je merilo linearne korelacije (razmerja tako po jakosti kot smeri) med dvema spremenljivkama. V razponu je od -1 do +1, pri čemer se z znaki plus in minus predstavlja pozitivna in negativna korelacija. Če je korelacijski koeficient natančno -1, je razmerje med obema spremenljivkama popolnoma negativno; če je korelacijski koeficient natančno +1, potem je razmerje popolnoma pozitivno. Dve spremenljivki imata lahko pozitivno, negativno korelacijo ali pa je sploh ne. Korelacijo lahko izračunate ročno, z uporabo nekaterih brezplačnih izračunov korelacije, ki so na voljo na spletu, ali z uporabo statističnih funkcij dobrega grafičnega kalkulatorja.

Stopati

Metoda 1 od 4: Ročni izračun korelacijskega koeficienta

  1. Najprej zberite svoje podatke. Za začetek izračuna učinkovite korelacije najprej preglejte podatkovne pare. Koristno jih je postaviti v tabelo, tako navpično kot vodoravno. Označite vsako vrstico ali stolpec x in y.
    • Recimo, da imate na primer štiri podatkovne pare za X in y. Tabela je potem lahko videti tako:
      • x || y
      • 1 || 1
      • 2 || 3
      • 4 || 5
      • 5 || 7
  2. Izračunaj srednjo vrednost X. Za izračun srednje vrednosti potrebujete vse vrednosti X dodajte in nato delite s številom vrednosti.
    • Na zgornjem primeru opazite, da imate štiri vrednosti za X. Za izračun srednje vrednosti seštejete vse vrednosti X in ga razdelite na 4. Izračun je videti tako:
    • μX=(1+2+4+5)/4{ displaystyle mu _ {x} = (1 + 2 + 4 + 5) / 4}Poiščite povprečje y. V povprečju y Če ga želite najti, sledite istim korakom, seštejte vse vrednosti y in nato delite s številom vrednosti.
      • V zgornjem primeru imate tudi štiri vrednosti za y. Vse te vrednosti seštejte skupaj in jih nato delite s 4. Izračuni bodo videti tako:
      • μy=(1+3+5+7)/4{ displaystyle mu _ {y} = (1 + 3 + 5 + 7) / 4}Določite standardni odklon X. Ko imate sredstva, lahko izračunate standardni odklon. Če želite to narediti, uporabite formulo:
        • σX=1n1Σ(XμX)2{ displaystyle sigma _ {x} = { sqrt {{ frac {1} {n-1}} Sigma (x- mu _ {x}) ^ {2}}}}Izračunajte standardni odklon y. Z enakimi osnovnimi koraki poiščite standardni odklon y. Uporabili boste isto formulo z uporabo podatkovnih točk za y.
          • Z vzorčnimi podatki bodo vaši izračuni videti tako:
          • σy=141((14)2+(34)2+(54)2+(74)2){ displaystyle sigma _ {y} = { sqrt {{ frac {1} {4-1}} * ((1-4) ^ {2} + (3-4) ^ {2} + ( 5-4) ^ {2} + (7-4) ^ {2})}}}Preglejte osnovno formulo za določanje korelacijskega koeficienta. Formula za izračun korelacijskega koeficienta uporablja sredstva, standardne deviacije in število parov v naboru podatkov (predstavljen z n). Sam korelacijski koeficient predstavlja mala črka r ali grška črka ρ (rho). Za ta članek bomo uporabili formulo, znano kot Pearsonov korelacijski koeficient, kot je prikazano spodaj:
            • ρ=(1n1)Σ(XμXσX)(yμyσy){ displaystyle rho = levo ({ frac {1} {n-1}} desno) Sigma levo ({ frac {x- mu _ {x}} { sigma _ {x}} } desno) * levo ({ frac {y- mu _ {y}} { sigma _ {y}}} desno)}Določite korelacijski koeficient. Zdaj imate sredstva in standardna odstopanja za svoje spremenljivke, tako da lahko preidete na formulo korelacijskega koeficienta. Zapomni si to n predstavlja število vrednosti, ki jih imate. Druge pomembne informacije ste že obdelali v zgornjih korakih.
              • Z uporabo vzorčnih podatkov lahko podatke vnesete v formulo korelacijskega koeficienta in jih izračunate na naslednji način:
              • ρ=(1n1)Σ(XμXσX)(yμyσy){ displaystyle rho = levo ({ frac {1} {n-1}} desno) Sigma levo ({ frac {x- mu _ {x}} { sigma _ {x}} } desno) * levo ({ frac {y- mu _ {y}} { sigma _ {y}}} desno)}Interpretirajte rezultat. Za ta nabor podatkov je korelacijski koeficient 0,988. Ta številka vam pove dve stvari o podatkih. Poglejte znak številke in velikost številke.
                • Ker je korelacijski koeficient pozitiven, lahko rečemo, da obstaja pozitivna korelacija med podatki x in podatki y. To pomeni, da če se vrednosti x povečajo, pričakujete, da se bodo povečale tudi vrednosti y.
                • Ker je korelacijski koeficient zelo blizu +1, so podatki x in y podatki zelo povezani. Če bi grafično prikazali te točke, bi videli, da so zelo dober približek ravni črti.

Metoda 2 od 4: Uporaba spletnih korelacijskih kalkulatorjev

  1. V spletu poiščite korelacijske kalkulatorje. Merjenje korelacije je za statistike dokaj standarden izračun. Izračun lahko postane zelo dolgočasen za velike nabore podatkov, če ga opravite ročno. Zato so številni viri na spletu objavili skupne korelacijske izračune. Uporabite kateri koli iskalnik in vnesite iskalni izraz "korelacijski kalkulator".
  2. Vnesite podatke. Natančno preberite navodila na spletnem mestu, da boste lahko pravilno vnesli podatke. Pomembno je, da se podatkovni pari vodijo v redu, sicer boste dobili napačen korelacijski rezultat. Različna spletna mesta uporabljajo različne oblike za vnos podatkov.
    • Na spletnem mestu http://ncalculators.com/statistics/correlation-coefficient-calculator.htm boste na primer našli vodoravno polje za vnos vrednosti x in drugo vodoravno polje za vnos vrednosti y. Pogoje vnesete ločeno le z vejicami. Tako je treba x podatkovni niz, izračunan prej v tem članku, vnesti kot 1,2,4,5. Nabor podatkov y je vpisan kot 1,3,5,7.
    • Na drugem spletnem mestu, http://www.alcula.com/calculators/statistics/correlation-coefficient/, lahko podatke vnašate vodoravno ali navpično, če podatke ohranjate v redu.
  3. Izračunajte rezultate. Ta spletna mesta za izračun so priljubljena, ker po vnosu podatkov na splošno morate samo klikniti gumb "Izračunaj" - rezultat se bo prikazal samodejno.

3. metoda od 4: Uporaba grafičnega kalkulatorja

  1. Vnesite svoje podatke. Na vašem grafičnem kalkulatorju omogočite funkcijo statistike in nato izberite ukaz "Uredi".
    • Vsak kalkulator ima nekoliko drugačne ukaze s tipkami. Ta članek vsebuje posebna navodila za Texas Instruments TI-86.
    • Za dostop do funkcije Stat pritisnite [2nd] -Stat (nad tipko "+") in nato pritisnite F2-Edit.
  2. Izbrišite vse stare shranjene podatke. Večina kalkulatorjev bo hranila statistične podatke, dokler jih ne izbrišete. Da ne boste zamenjali starih podatkov z novimi, najprej izbrišite vse prej shranjene podatke.
    • S puščičnimi tipkami premaknite kazalec, da označite kategorijo "xStat". Nato pritisnite "Clear" in "Enter. To bi moralo počistiti vse vrednosti v stolpcu xStat.
    • S puščičnimi tipkami označite kategorijo "yStat". Pritisnite "Clear" in "Enter", da počistite tudi podatke za ta stolpec.
  3. Vnesite svoje podatkovne vrednosti. S puščičnimi tipkami premaknite kazalec na prvi presledek pod glavo xStat. Vnesite svojo prvo podatkovno vrednost in pritisnite Enter. Na dnu zaslona bi morali videti presledek "xStat (1) = __", kjer vaša vrednost zapolni prazen prostor. Ko pritisnete Enter, bodo podatki zapolnili tabelo, kazalka se bo premaknila v naslednjo vrstico, vrstica na dnu zaslona pa naj se zdaj glasi "xStat (2) = __".
    • Nadaljujte z vnašanjem vseh vrednosti x.
    • Ko vnesete vrednosti x, se s puščičnimi tipkami pomaknite do stolpca yStat in vnesite vrednosti y.
    • Ko so vneseni vsi podatki, pritisnite Izhod, da počistite zaslon in zaprete meni Stat.
  4. Izračunajte linearno regresijsko statistiko. Korelacijski koeficient je merilo, kako natančno se podatki približujejo ravni črti. Grafični kalkulator s statističnimi funkcijami lahko zelo hitro izračuna najustreznejšo linijo in korelacijski koeficient.
    • Vnesite funkcijo Stat in pritisnite gumb Calc. Na TI-86 je to [2.] [Stat] [F1].
    • Izberite Izračun linearne regresije. Na TI-86 je to [F3] z oznako "LinR." Grafični zaslon bo nato z utripajočo kazalko prikazal vrstico "LinR _".
    • Zdaj morate vnesti imena dveh spremenljivk, ki jih želite izračunati. To sta xStat in yStat.
      • Na TI-86 izberite seznam imen ("Imena") s pritiskom na [2nd] [List] [F3].
      • Spodnja vrstica zaslona mora zdaj prikazovati razpoložljive spremenljivke. Izberite [xStat] (to je verjetno gumb F1 ali F2), nato vnesite vejico in nato [yStat].
      • Pritisnite Enter za izračun podatkov
  5. Interpretirajte rezultate. Ko pritisnete Enter, bo kalkulator takoj izračunal naslednje podatke za vnesene podatke:
    • y=a+bX{ displaystyle y = a + bx}Razumevanje koncepta korelacije. Korelacija se nanaša na statistično razmerje med dvema veličinama. Korelacijski koeficient je eno število, ki ga lahko izračunate za dva niza podatkovnih točk. Število je vedno nekaj med -1 in +1 in označuje, kako tesno sta oba nabora podatkov.
      • Če ste na primer izmerili višino in starost otrok do približno 12 let, bi pričakovali, da boste našli močno pozitivno povezavo. Ko se otroci starajo, so ponavadi višji.
      • Primer negativne korelacije je primerjava časa, ko nekdo preživi vadbo golfa, z rezultatom golfa te osebe. Ko bo praksa napredovala, se mora rezultat zniževati.
      • Na koncu bi pričakovali malo korelacije, pozitivne ali negativne, na primer med velikostjo čevljev osebe in ocenami izpita.
    • Izračunaj srednjo vrednost. Aritmetična sredina ali "srednja vrednost" niza podatkov se izračuna tako, da se seštejejo vse vrednosti podatkov in nato deli s številom vrednosti v nizu. Če želite določiti koeficient korelacije za svoje podatke, morate izračunati povprečje vsakega nabora podatkov.
      • Srednjo vrednost spremenljivke označuje spremenljivka z vodoravno črto nad njo. To se za nabore podatkov x in y pogosto imenuje "x-bar" ali "y-bar". Lahko pa srednjo vrednost označimo z malimi grškimi črkami μ (mu). Na primer, če želite navesti sredino podatkovnih točk x, lahko uporabite μX ali μ (x).
      • Če imate na primer nabor x (1,2,5,6,9,10), se povprečje teh podatkov izračuna na naslednji način:
        • μX=(1+2+5+6+9+10)/6{ displaystyle mu _ {x} = (1 + 2 + 5 + 6 + 9 + 10) / 6}Spoznajte pomen standardnega odklona. V statistiki standardni odklon meri variacije, ki prikazujejo razpršenost števil od povprečja. Skupina števil z nizkim standardnim odklonom je precej blizu. Skupina števil z visokim standardnim odklonom je bolj razpršena.
          • Kot simbol je standardni odklon izražen z uporabo male črke s ali grške črke σ (sigma). Tako je standardni odklon podatkov x zapisan kot sX ali σX.
        • Prepoznajte zapis seštevanja. Operator seštevanja je eden najpogostejših operatorjev v matematiki in označuje vsoto vrednosti. Predstavlja ga grška velika črka, sigma ali ∑.
          • Če imate na primer zbirko podatkovnih točk x (1,2,5,6,9,10), potem ∑x pomeni:
            • 1+2+5+6+9+10 = 33

Nasveti

  • Korelacijski koeficient se včasih imenuje "Pearsonov koeficient korelacije produkt-moment" v čast Karla Pearsona, njegovega razvijalca.
  • Na splošno korelacijski koeficient, večji od 0,8 (pozitiven ali negativen), predstavlja močno korelacijo; korelacijski koeficient, nižji od 0,5 (spet pozitiven ali negativen), predstavlja šibek korelacijski koeficient.

Opozorila

  • Korelacija kaže, da sta dva nabora podatkov na nek način povezana. Vendar pazite, da tega ne razlagate kot vzročno zvezo. Na primer, če primerjate velikost čevljev in njihovo višino, boste verjetno našli močno pozitivno povezavo. Večji ljudje imajo na splošno večje noge. Vendar to ne pomeni, da boste zaradi visokih nog zrasli ali da boste z velikimi stopali postali visoki. Preprosto se zgodijo skupaj.