Kako izračunati linearni korelacijski koeficient

Avtor: Eric Farmer
Datum Ustvarjanja: 7 Pohod 2021
Datum Posodobitve: 1 Julij. 2024
Anonim
Korelacija Primjer 7.1
Video.: Korelacija Primjer 7.1

Vsebina

Korelacijski koeficient (ali linearni korelacijski koeficient) je označen kot "r" (v redkih primerih kot "ρ") in označuje linearno korelacijo (to je razmerje, ki je podano z neko vrednostjo in smerjo) dveh ali več spremenljivk. Vrednost koeficienta je med -1 in +1, to pomeni, da je korelacija lahko pozitivna in negativna. Če je korelacijski koeficient -1, obstaja popolna negativna korelacija; če je korelacijski koeficient +1, obstaja popolna pozitivna korelacija. V nasprotnem primeru obstaja pozitivna korelacija med obema spremenljivkama, negativna korelacija ali pa korelacije ni. Korelacijski koeficient je mogoče izračunati ročno, z brezplačnimi spletnimi kalkulatorji ali z dobrim grafičnim kalkulatorjem.

Koraki

Metoda 1 od 4: Ročni izračun koeficienta korelacije

  1. 1 Zberite podatke. Preden začnete izračunavati korelacijski koeficient, preučite te pare števil. Bolje, da jih zapišete v tabelo, ki jo lahko postavite navpično ali vodoravno. Vsako vrstico ali stolpec označite z "x" in "y".
    • Na primer, glede na štiri pare vrednosti (številk) spremenljivk "x" in "y". Ustvarite lahko naslednjo tabelo:
      • x || y
      • 1 || 1
      • 2 || 3
      • 4 || 5
      • 5 || 7
  2. 2 Izračunajte aritmetično sredino "x". Če želite to narediti, seštejte vse vrednosti x, nato pa rezultat delite s številom vrednosti.
    • V našem primeru obstajajo štiri vrednosti za spremenljivko "x". Če želite izračunati aritmetično sredino "x", dodajte te vrednosti in nato vsoto delite s 4. Izračuni so zapisani na naslednji način:
    • μx=(1+2+4+5)/4{ displaystyle mu _ {x} = (1 + 2 + 4 + 5) / 4}
    • μx=12/4{ displaystyle mu _ {x} = 12/4}
    • μx=3{ displaystyle mu _ {x} = 3}
  3. 3 Poiščite aritmetično sredino "y". Če želite to narediti, sledite istim korakom, torej seštejte vse vrednosti y in nato vsoto delite s številom vrednosti.
    • V našem primeru so podane štiri vrednosti spremenljivke "y". Dodajte te vrednosti in nato vsoto delite s 4. Izračuni bodo zapisani na naslednji način:
    • μy=(1+3+5+7)/4{ displaystyle mu _ {y} = (1 + 3 + 5 + 7) / 4}
    • μy=16/4{ displaystyle mu _ {y} = 16/4}
    • μy=4{ displaystyle mu _ {y} = 4}
  4. 4 Izračunajte standardni odklon "x". Po izračunu srednjih vrednosti "x" in "y" poiščite standardna odstopanja teh spremenljivk. Standardni odklon se izračuna po naslednji formuli:
    • σx=1n1Σ(xμx)2{ displaystyle sigma _ {x} = { sqrt {{ frac {1} {n-1}} Sigma (x- mu _ {x}) ^ {2}}}}
    • V našem primeru bodo izračuni zapisani tako:
    • σx=141((13)2+(23)2+(43)2+(53)2){ displaystyle sigma _ {x} = { sqrt {{ frac {1} {4-1}} * ((1-3) ^ {2} + (2-3) ^ {2} + ( 4-3) ^ {2} + (5-3) ^ {2})}}}
    • σx=13(4+1+1+4){ displaystyle sigma _ {x} = { sqrt {{ frac {1} {3}} * (4 + 1 + 1 + 4)}}}
    • σx=13(10){ displaystyle sigma _ {x} = { sqrt {{ frac {1} {3}} * (10)}}}
    • σx=103{ displaystyle sigma _ {x} = { sqrt { frac {10} {3}}}}
    • σx=1,83{ displaystyle sigma _ {x} = 1,83}
  5. 5 Izračunajte standardni odklon "y". Sledite korakom, opisanim v prejšnjem koraku. Uporabite isto formulo, vendar vstavite vrednosti y.
    • V našem primeru bodo izračuni zapisani tako:
    • σy=141((14)2+(34)2+(54)2+(74)2){ displaystyle sigma _ {y} = { sqrt {{ frac {1} {4-1}} * ((1-4) ^ {2} + (3-4) ^ {2} + ( 5-4) ^ {2} + (7-4) ^ {2})}}}
    • σy=13(9+1+1+9){ displaystyle sigma _ {y} = { sqrt {{ frac {1} {3}} * (9 + 1 + 1 + 9)}}}
    • σy=13(20){ displaystyle sigma _ {y} = { sqrt {{ frac {1} {3}} * (20)}}}
    • σy=203{ displaystyle sigma _ {y} = { sqrt { frac {20} {3}}}}
    • σy=2,58{ displaystyle sigma _ {y} = 2,58}
  6. 6 Zapišite osnovno formulo za izračun korelacijskega koeficienta. Ta formula vključuje sredstva, standardna odstopanja in število (n) parov številk obeh spremenljivk. Korelacijski koeficient je označen kot "r" (v redkih primerih kot "ρ"). Ta članek uporablja formulo za izračun Pearsonovega koeficienta korelacije.
    • ρ=(1n1)Σ(xμxσx)(yμyσy){ displaystyle rho = left ({ frac {1} {n-1}} right) Sigma left ({ frac {x- mu _ {x}} { sigma _ {x}} } desno) * levo ({ frac {y- mu _ {y}} { sigma _ {y}}} desno)}
    • Tu in v drugih virih lahko količine označimo na različne načine. Na primer, nekatere formule vsebujejo "ρ" in "σ", druge pa "r" in "s". Nekateri učbeniki dajejo različne formule, vendar so matematični primeri zgornje formule.
  7. 7 Izračunajte korelacijski koeficient. Izračunali ste srednja in standardna odstopanja obeh spremenljivk, zato lahko s formulo izračunate korelacijski koeficient. Spomnite se, da je "n" število parov vrednosti za obe spremenljivki. Druge vrednosti so bile izračunane že prej.
    • V našem primeru bodo izračuni zapisani tako:
    • ρ=(1n1)Σ(xμxσx)(yμyσy){ displaystyle rho = left ({ frac {1} {n-1}} right) Sigma left ({ frac {x- mu _ {x}} { sigma _ {x}} } desno) * levo ({ frac {y- mu _ {y}} { sigma _ {y}}} desno)}
    • ρ=(13){ displaystyle rho = levo ({ frac {1} {3}} desno) *}[(131,83)(142,58)+(231,83)(342,58){ displaystyle left ({ frac {1-3} {1.83}} right) * left ({ frac {1-4} {2.58}} right) + left ({ frac {2 -3} {1,83}} desno) * levo ({ frac {3-4} {2,58}} desno)}
         +(431,83)(542,58)+(531,83)(742,58){ displaystyle + left ({ frac {4-3} {1.83}} right) * left ({ frac {5-4} {2.58}} right) + left ({ frac { 5-3} {1,83}} desno) * levo ({ frac {7-4} {2,58}} desno)}]
    • ρ=(13)(6+1+1+64,721){ displaystyle rho = levo ({ frac {1} {3}} desno) * levo ({ frac {6 + 1 + 1 + 6} {4.721}} desno)}
    • ρ=(13)2,965{ displaystyle rho = levo ({ frac {1} {3}} desno) * 2.965}
    • ρ=(2,9653){ displaystyle rho = levo ({ frac {2,965} {3}} desno)}
    • ρ=0,988{ displaystyle rho = 0,988}
  8. 8 Analizirajte rezultat. V našem primeru je korelacijski koeficient 0,988. Ta vrednost na nek način označuje dani niz parov števil. Bodite pozorni na znak in velikost vrednosti.
    • Ker je vrednost korelacijskega koeficienta pozitivna, obstaja pozitivna korelacija med spremenljivkama "x" in "y". Se pravi, ko se vrednost "x" poveča, se poveča tudi vrednost "y".
    • Ker je vrednost korelacijskega koeficienta zelo blizu +1, so vrednosti spremenljivk "x" in "y" zelo povezane. Če postavite točke na koordinatno ravnino, se bodo nahajale blizu neke ravne črte.

Metoda 2 od 4: Uporaba spletnih kalkulatorjev za izračun korelacijskega koeficienta

  1. 1 Poiščite kalkulator na internetu za izračun korelacijskega koeficienta. Ta koeficient se pogosto izračuna v statistiki. Če obstaja veliko parov številk, je skoraj nemogoče ročno izračunati korelacijski koeficient. Zato obstajajo spletni kalkulatorji za izračun korelacijskega koeficienta. V iskalnik vnesite "kalkulator korelacijskega koeficienta" (brez narekovajev).
  2. 2 Vnesite podatke. Za vnos pravilnih podatkov (parov številk) preberite navodila na spletnem mestu. Nujno morate vnesti ustrezne pare številk; v nasprotnem primeru boste dobili napačen rezultat. Ne pozabite, da imajo različna spletna mesta različne oblike vnosa.
    • Na primer, na http://ncalculators.com/statistics/correlation-coefficient-calculator.htm se vrednosti spremenljivk x in y vneseta v dve vodoravni vrstici. Vrednosti so ločene z vejicami. To pomeni, da so v našem primeru vrednosti "x" vnesene tako: 1,2,4,5, vrednosti "y" pa tako: 1,3,5,7.
    • Na drugem mestu, http://www.alcula.com/calculators/statistics/correlation-coefficient/, se podatki vnesejo navpično; v tem primeru ne zamenjujte ustreznih parov številk.
  3. 3 Izračunajte korelacijski koeficient. Po vnosu podatkov preprosto kliknite gumb "Izračunaj", "Izračunaj" ali podobno, da dobite rezultat.

Metoda 3 od 4: Uporaba grafičnega kalkulatorja

  1. 1 Vnesite podatke. Vzemite grafični kalkulator, pojdite v način statističnega izračuna in izberite ukaz "Uredi".
    • Različni kalkulatorji zahtevajo pritisk na različne tipke. Ta članek obravnava kalkulator Texas Instruments TI-86.
    • Pritisnite [2.] - Stat (nad tipko +) za vstop v način statističnega izračuna. Nato pritisnite F2 - Uredi.
  2. 2 Izbrišite prejšnje shranjene podatke. Večina kalkulatorjev hrani vnesene statistike, dokler jih ne izbrišete. Da ne bi zamenjali starih podatkov z novimi, najprej izbrišite vse shranjene podatke.
    • S puščičnimi tipkami premaknite kazalec in označite naslov »xStat«. Nato pritisnite Počisti in Vnesite, da počistite vse vrednosti, vnesene v stolpec xStat.
    • S puščičnimi tipkami označite naslov 'yStat'. Nato pritisnite Počisti in Vnesite, da počistite vse vrednosti, vnesene v stolpec yStat.
  3. 3 Vnesite začetne podatke. S puščičnimi tipkami premaknite kazalec v prvo celico pod naslovom "xStat". Vnesite prvo vrednost in pritisnite Enter. Na dnu zaslona se prikaže “xStat (1) = __”, pri čemer vnesena vrednost nadomesti presledek. Ko pritisnete Enter, se vnesena vrednost prikaže v tabeli in kazalec se premakne v naslednjo vrstico; to bo prikazalo "xStat (2) = __" na dnu zaslona.
    • Vnesite vse vrednosti spremenljivke "x".
    • Ko vnesete vse vrednosti za x, se s puščičnimi tipkami pomaknite do stolpca yStat in vnesite vrednosti za y.
    • Ko vnesete vse pare številk, pritisnite Izhod, da počistite zaslon in zapustite način združevanja.
  4. 4 Izračunajte korelacijski koeficient. Označuje, kako blizu so podatki določeni ravni črti. Grafični kalkulator lahko hitro določi ustrezno ravno črto in izračuna korelacijski koeficient.
    • Kliknite Stat - Calc. Na TI -86 pritisnite [2.] - [Stat] - [F1].
    • Izberite funkcijo linearne regresije. Na TI-86 pritisnite [F3] z oznako "LinR". Na zaslonu bo prikazana vrstica "LinR _" s utripajočim kazalcem.
    • Zdaj vnesite imena dveh spremenljivk: xStat in yStat.
      • Na TI-86 odprite seznam imen; če želite to narediti, pritisnite [2.] - [Seznam] - [F3].
      • Razpoložljive spremenljivke so prikazane v spodnji vrstici zaslona. Izberite [xStat] (za to boste verjetno morali pritisniti F1 ali F2), vnesite vejico in nato izberite [yStat].
      • Pritisnite Enter za obdelavo vnesenih podatkov.
  5. 5 Analizirajte svoje rezultate. S pritiskom na Enter se na zaslonu prikažejo naslednje informacije:
    • y=a+bx{ displaystyle y = a + bx}: to je funkcija, ki opisuje vrstico. Upoštevajte, da funkcija ni zapisana v standardni obliki (y = kx + b).
    • a={ displaystyle a =}... To je koordinata y presečišča ravne črte z osjo y.
    • b={ displaystyle b =}... To je naklon črte.
    • corr={ displaystyle { text {corr}} =}... To je korelacijski koeficient.
    • n={ displaystyle n =}... To je število parov številk, ki so bili uporabljeni pri izračunih.

Metoda 4 od 4: Razlaga osnovnih konceptov

  1. 1 Razumeti pojem korelacije. Korelacija je statistično razmerje med dvema količinama. Korelacijski koeficient je številska vrednost, ki jo je mogoče izračunati za poljubna dva nabora podatkov. Vrednost korelacijskega koeficienta je vedno v razponu od -1 do +1 in označuje stopnjo razmerja med dvema spremenljivkama.
    • Na primer glede na višino in starost otrok (približno 12 let). Najverjetneje bo prišlo do močne pozitivne korelacije, saj otroci s starostjo postajajo višji.
    • Primer negativne korelacije: kazenske sekunde in čas, porabljen za treninge biatlona, ​​torej več ko športnik trenira, manj kazenskih sekund bo dosojenih.
    • Nazadnje je včasih zelo majhna povezava (pozitivna ali negativna), na primer med velikostjo čevlja in matematičnimi rezultati.
  2. 2 Ne pozabite, kako izračunati aritmetično sredino. Za izračun aritmetične sredine (ali povprečja) morate najti vsoto vseh teh vrednosti in jo nato razdeliti na število vrednosti. Ne pozabite, da je aritmetična sredina potrebna za izračun korelacijskega koeficienta.
    • Povprečna vrednost spremenljivke je označena s črko z vodoravno črto nad njo. Na primer, v primeru spremenljivk "x" in "y" se njune povprečne vrednosti označijo na naslednji način: x̅ in y̅. Povprečje včasih označujemo z grško črko "μ" (mu). Za zapis aritmetične sredine vrednosti spremenljivke "x" uporabite zapis μx ali μ (x).
    • Na primer, glede na naslednje vrednosti za spremenljivko "x": 1,2,5,6,9,10. Aritmetična sredina teh vrednosti se izračuna na naslednji način:
      • μx=(1+2+5+6+9+10)/6{ displaystyle mu _ {x} = (1 + 2 + 5 + 6 + 9 + 10) / 6}
      • μx=33/6{ displaystyle mu _ {x} = 33/6}
      • μx=5,5{ displaystyle mu _ {x} = 5,5}
  3. 3 Upoštevajte pomen standardnega odstopanja. V statistiki standardni odmik označuje stopnjo razpršenosti številk glede na njihovo povprečje. Če je standardni odklon majhen, so številke blizu povprečja; če je standardni odklon velik, so številke daleč od povprečja.
    • Standardno odstopanje je označeno s črko "s" ali grško črko "σ" (sigma). Tako standardni odmik vrednosti spremenljivke "x" označimo na naslednji način: sx ali σx.
  4. 4 Zapomnite si simbol operacije seštevanja. Simbol seštevanja je eden najpogostejših simbolov v matematiki in označuje vsoto vrednosti. Ta simbol je grška črka "Σ" (velika sigma).
    • Na primer, če so podane naslednje vrednosti spremenljivke "x": 1,2,5,6,9,10, potem Σx pomeni:
      • 1 + 2 + 5 + 6 + 9 + 10 = 33.

Nasveti

  • Korelacijski koeficient se včasih imenuje "Pearsonov korelacijski koeficient" po svojem razvijalcu Carlu Pearsonu.
  • V večini primerov, ko je korelacijski koeficient večji od 0,8 (pozitiven ali negativen), obstaja močna korelacija; če je koeficient korelacije manjši od 0,5 (pozitiven ali negativen), opazimo šibko korelacijo.

Opozorila

  • Korelacija označuje razmerje med vrednostmi dveh spremenljivk. Vendar ne pozabite, da korelacija nima nobene zveze z vzročnostjo. Če na primer primerjate višino in velikost čevljev ljudi, boste verjetno našli močno pozitivno korelacijo. Na splošno je višja oseba, večja je velikost čevlja. Toda to ne pomeni, da povečanje višine vodi do samodejnega povečanja velikosti čevljev ali da bodo večja stopala povzročila hitrejšo rast. Te količine so preprosto povezane.