R kvadrāts (R ^ 2) - definīcija, formula, aprēķiniet R kvadrātu

Kas ir R kvadrāts (R2) regresijā?

R kvadrāts (R 2 ) ir svarīgs statistikas mērs, kas ir regresijas modelis, kas statistiskā izteiksmē parāda atšķirības vai dispersijas proporciju atkarīgajam mainīgajam lielumam, ko var izskaidrot ar neatkarīgu mainīgo vai mainīgajiem. Īsāk sakot, tas nosaka, cik labi dati derēs regresijas modelim.

R Formula kvadrātā

Lai aprēķinātu R kvadrātu, jums jānosaka korelācijas koeficients, un pēc tam rezultāts jānosaka kvadrātā.

R kvadrāta formula = r 2

Kur r korelācijas koeficientu var aprēķināt zemāk:

r = n (∑xy) - ∑x ∑y / √ (n * (∑x 2 - (∑x) 2 )) * (n * (∑y 2 - (∑y) 2 ))

Kur,

  • r = korelācijas koeficients
  • n = skaitlis dotajā datu kopā
  • x = pirmais mainīgais kontekstā
  • y = otrais mainīgais

Paskaidrojums

Ja starp šiem diviem mainīgajiem ir kāda sakarība vai korelācija, kas var būt lineāra vai nelineāra, tad tas norāda, vai mainās neatkarīgā mainīgā vērtība, tad otra atkarīgā mainīgā vērtība, visticamāk, mainīsies, teiksim lineāri vai nelineāri.

Formulas skaitītāja daļa veic pārbaudi, vai viņi pārvietojas kopā, un noņem viņu individuālās kustības un abu kustīgo kustību relatīvo spēku, un formulas saucēja daļa mērogo skaitītāju, ņemot kvadrātsakni no starpību reizinājuma. mainīgie no to mainīgajiem lielumiem kvadrātā. Kad jūs kvadrātiet šo rezultātu, mēs iegūstam R kvadrātu, kas ir nekas cits kā noteikšanas koeficients.

Piemēri

1. piemērs

Apsveriet šādus divus mainīgos x un y, jums jāaprēķina R kvadrāts regresijā.

Risinājums:

Izmantojot iepriekš minēto formulu, mums vispirms jāaprēķina korelācijas koeficients.

Mums ir visas iepriekšminētās tabulas vērtības ar n = 4.

Tagad ievadīsim formulas vērtības, lai iegūtu skaitli.

r = (4 * 26 046,25) - (265,18 * 326,89) / √ ((4 * 21 274,94) - (326,89) 2 ) * ((4 * 31 901,89) - (326,89) 2 )

r = 17 501,06 / 17 512,88

Korelācijas koeficients būs

r = 0,99932480

Tātad aprēķins būs šāds,

r 2 = (0,99932480) 2

R kvadrāta formula regresijā

r 2 = 0,998650052

2. piemērs

Jaunattīstības valsts Indija vēlas veikt neatkarīgu analīzi par to, vai jēlnaftas cenu izmaiņas ir ietekmējušas tās rūpijas vērtību. Tālāk ir parādīta Brent jēlnaftas cenas un rūpijas vērtēšanas vēsture gan attiecībā pret dolāriem, kas vidēji šajos gados dominēja zemāk.

Indijas centrālā banka RBI ir vērsusies pie jums, lai nākamajā sanāksmē par to pašu sniegtu prezentāciju. Nosakiet, vai jēlnaftas kustība ietekmē rūpijas kustību par dolāru?

Risinājums:

Izmantojot iepriekšminētās korelācijas formulu, vispirms varam aprēķināt korelācijas koeficientu. Apstrādājot vidējo jēlnaftas cenu kā vienu mainīgo, teiksim x, un rūpiju par dolāru uzskatot par citu mainīgo kā y.

Mums ir visas iepriekšminētās tabulas vērtības ar n = 6.

Tagad ievadīsim formulas vērtības, lai iegūtu skaitli.

r = (6 * 23592,83) - (356,70 * 398,59) / √ ((6 * 22829,36) - (356,70) 2 ) * ((6 * 26529,38) - (398,59) 2 )

r = -620,06 / 1,715,95

Korelācijas koeficients būs

r = -0,3614

Tātad aprēķins būs šāds,

r 2 = (-0,3614) 2

R kvadrāta formula regresijā

r 2 = 0,1306

Analīze. Šķiet, ka starp jēlnaftas cenu izmaiņām un Indijas rūpijas cenas izmaiņām ir neliela saistība. Pieaugot jēlnaftas cenai, ietekmē arī izmaiņas Indijas rūpijā. Bet, tā kā R kvadrāts ir tikai 13%, tad jēlnaftas cenas izmaiņas ļoti maz izskaidro Indijas rūpijas izmaiņas, un Indijas rūpija ir pakļauta arī citu mainīgo lielumu izmaiņām, par kurām jāņem vērā.

3. piemērs

XYZ laboratorija veic auguma un svara izpēti un ir ieinteresēta uzzināt, vai starp šiem mainīgajiem ir kāda veida saistība. Pēc katras kategorijas 5000 cilvēku izlases apkopošanas un nāca klajā ar vidējo svaru un vidējo augstumu šajā konkrētajā grupā.

Tālāk ir sniegta informācija, ko viņi ir apkopojuši.

Jums jāaprēķina R kvadrāts un jāsecina, ja šis modelis izskaidro augstuma dispersijas ietekmē svara variācijas.

Risinājums:

Izmantojot iepriekšminētās korelācijas formulu, vispirms varam aprēķināt korelācijas koeficientu. Apstrādājot augstumu kā vienu mainīgo, teiksim x, un svaru uzskatot par citu mainīgo kā y.

Mums ir visas iepriekšminētās tabulas vērtības ar n = 6.

Tagad ievadīsim formulas vērtības, lai iegūtu skaitli.

r = (7 * 74 058,67) - (1031 * 496,44) / √ ((7 * 153595 - (1031) 2 ) * ((7 * 35793,59) - (496,44) 2 )

r = 6581,05 / 7075,77

Korelācijas koeficients būs

Korelācijas koeficients (r) = 0,9301

Tātad aprēķins būs šāds,

r 2 = 0,8651

Analīze: korelācija ir pozitīva, un šķiet, ka pastāv kāda saistība starp augumu un svaru. Pieaugot augumam, šķiet, ka palielinās arī personas svars. Lai gan R2 norāda, ka 86% auguma izmaiņu ir saistītas ar svara izmaiņām, un 14% ir neizskaidrojamas.

Atbilstība un lietojumi

R kvadrāta atbilstība regresijā ir tā spēja atrast nākotnes notikumu varbūtību dotajos prognozētajos rezultātos vai iznākumos. Ja modelim pievieno vairāk paraugu, koeficients parādīs varbūtību vai varbūtību, ka jauns punkts vai jaunā datu kopa nokritīs uz līnijas. Pat ja abiem mainīgajiem ir cieša saikne, noteikšana nepierāda cēloņsakarību.

Dažas vietas, kur lielākoties tiek izmantots R kvadrāts, ir kopfondu darbības izsekošanai, riska ieguldījumu fondu riska izsekošanai, lai noteiktu, cik labi akcijas pārvietojas ar tirgu, kur R2 ieteiktu, cik lielu daļu no akciju kustībām var izskaidrot. ko nosaka tirgus kustības.

Interesanti raksti...