Regresija (nozīme, veidi) Kas ir regresijas analīze?

Satura rādītājs

Kas ir regresija?

Regresijas analīze ir uz statistiku balstīts mērījums, ko izmanto finansēs, ieguldījumos utt., Kura mērķis ir izveidot saikni starp atkarīgo mainīgo un citām neatkarīgo mainīgo sērijām, un galvenā uzmanība tiek pievērsta iepriekš minēto attiecību stipruma noteikšanai.

Paskaidrojumi

  • Lai paskaidrotu regresijas analīzi nespeciālistiem, pieņemsim, ka uzņēmuma pārdošanas vadītājs ļoti cenšas prognozēt nākamā mēneša pārdošanas apjomus. Produkta pārdošanu veicina daudzi faktori, sākot no laika apstākļiem līdz konkurenta jaunajai stratēģijai, festivālam un patērētāju dzīvesveida maiņai.
  • Šī ir metode, kā saskaņot vairākus faktorus, kas ietekmē pārdošanu, un kuriem ir vislielākā ietekme. Tas var palīdzēt atbildēt uz daudziem jautājumiem, piemēram, kādi ir vissvarīgākie faktori, kādi faktori ir mazāk svarīgi, kāda ir saistība starp šiem faktoriem, un pats galvenais, kāda ir šo faktoru garantija.
  • Šos faktorus sauc par mainīgajiem. Galvenais faktors, kuru mēs cenšamies prognozēt, tiek saukts par atkarīgo mainīgo, bet pārējos faktorus, kas ietekmē atkarīgo mainīgo, sauc par neatkarīgajiem mainīgajiem.

Formula

Vienkāršu lineārās regresijas analīzi programmā Excel var izteikt kā formulu zemāk, un tā mēra saistību starp atkarīgo mainīgo un vienu neatkarīgo mainīgo.

Y = a + bX + ϵ

Šeit:

  • Y - atkarīgais mainīgais
  • X - neatkarīgais (skaidrojošais) mainīgais
  • a - pārtvert
  • b - slīpums
  • ϵ - atlikums (kļūda)

Kā interpretēt regresijas analīzi?

To var interpretēt, pieņemot vienkāršu scenāriju. Šeit mēs ņemam vērā saistību starp izsolē antīko priekšmetu kolekcijas cenām un tā vecuma ilgumu. Jo vairāk antīks priekšmets kļūst vecāks, jo lielāku cenu tas iegūst. Pieņemot, ka esam iestatījuši datus par pēdējiem 50 izsolītajiem priekšmetiem, mēs varam paredzēt, kādas būs turpmākās izsoles cenas, pamatojoties uz preces vecumu. Izmantojot šos datus, mēs varam izveidot regresijas vienādojumu.

Regresijas formula, ar kuru var noteikt attiecību starp vecumu un cenu, ir šāda:

y = β0 + β1 x + kļūda
  • Šeit atkarīgais faktors ir Y. Y apzīmē katra izsolāmā priekšmeta cenu, savukārt neatkarīgais faktors ir X, kas nosaka vecumu.
  • Parametri β0 un β1 ir parametri, kas nav zināmi un tiks novērtēti pēc vienādojuma.
  • β0 ir konstante, ko izmanto, lai definētu lineāro tendenču līniju, kas pārtver Y asi.
  • β1 ir konstante, kas parāda atkarīgā mainīgā vērtības izmaiņu lielumu kā saistīto izmaiņu funkciju, kas domāta neatkarīgajiem mainīgajiem.
  • To pamatā sauc par vienādojuma slīpumu. Kad slīpums ir līnijpārvadātājs, tas nozīmē, ka pastāv proporcionāla attiecība starp vecumu un cenu, un, ja slīpums ir apgriezts, tas nozīmē, ka attiecības ir netieši proporcionālas.
  • Kļūda var definēt kā troksni vai izmaiņas mērķa mainīgo un ir nejauši raksturs.

Reālās dzīves regresijas analīzes piemēri

Pieņemsim, ka mums ir jānosaka saistība starp notikušo pārdošanu un summu, kas iztērēta ar produktu saistītai reklāmai.

Parasti varam novērot pozitīvu saistību starp pārdošanas daudzumu un reklāmai iztērēto summu. Vienkāršā lineārās regresijas vienādojuma pamatā ir:

Y = a + bX

Pieņemsim, ka mēs iegūstam vērtību kā

Y = 500 + 30X

Rezultātu interpretācija:

Paredzētais slīpums 30 palīdz mums izdarīt secinājumu, ka vidējie pārdošanas apjomi pieaug par 30 ASV dolāriem gadā, palielinoties tēriņiem reklāmai.

Regresijas analīzes veidi

# 1 - lineārs

To var izteikt kā formulu zemāk, un tā mēra saistību starp atkarīgo mainīgo un vienu neatkarīgo mainīgo.

# 2 - polinoms

Šajā metodē analīzi izmanto, lai noteiktu saikni starp atsevišķiem atkarīgiem faktoriem un vairākiem neatkarīgiem mainīgajiem.

# 3 - loģistika

Šeit atkarīgais faktors vai mainīgais ir binārā rakstura. Neatkarīgie mainīgie var būt nepārtraukti vai bināri. Daudznomu loģistikas regresijā mēs varam atļauties vairāk nekā divu kategoriju izvēli, izvēloties savu neatkarīgo mainīgo.

# 4 - kvantile

Tas ir lineāras regresijas papildinājums, un to galvenokārt izmanto, ja datos ir izteikti novirzes un šķībums.

# 5 - Elastīgais tīkls

Tas ir noderīgi, ja tiek apstrādāti ļoti korelēti neatkarīgi mainīgie.

# 6 - galveno komponentu regresija (PCR)

Šī ir metode, kas ir piemērojama, ja datos ir pārāk daudz neatkarīgu mainīgo vai daudzkolinearitāte

# 7 - daļēji vismazākie laukumi (PLS)

Tā ir pretēja galvenā komponenta metode, kur mums ir ļoti korelēti neatkarīgi mainīgie. Tas ir piemērojams arī tad, ja ir daudz neatkarīgu mainīgo.

# 8 - Atbalsta vektors

Tas var sniegt risinājumu lineāriem un nelineāriem modeļiem. Lai atrastu optimālu risinājumu nelineāriem modeļiem, tiek izmantotas nelineāras kodola funkcijas.

# 9 - kārtas numurs

Tas ir piemērots ranžēto vērtību prognozēšanai. Būtībā tas ir piemērots, ja atkarīgais mainīgais pēc kārtas ir kārtas numurs

# 10 - Puasons

Tas ir piemērojams, ja atkarīgajam mainīgajam ir skaitīšanas dati.

# 11 - Negatīvs binomālis

Tas attiecas arī uz skaitīšanas datu pārvaldību tikai tad, ja negatīva binomiālā regresija nepieņem skaitļa sadalījumu, kura dispersija ir vienāda ar tā vidējo, savukārt Puasona regresija pieņem dispersiju, kas vienāda ar tās vidējo.

# 12 - Kvazis Puasons

Tas aizstāj negatīvu binomiālo regresiju. Tas ir piemērojams arī izkliedētiem skaitīšanas datiem. Kvazi-Puasona modeļa dispersija ir lineāra vidējā funkcija, savukārt negatīvā binomiālā modeļa dispersija ir kvadrāta vidējā funkcija.

# 13 - Koksa

To vairāk izmanto, lai analizētu datus par laiku līdz notikumam.

Atšķirība starp regresiju un korelāciju

  • Regresija nosaka saikni starp neatkarīgu dispersiju un atkarīgu mainīgo, kur abi mainīgie ir atšķirīgi, savukārt korelācija nosaka divu mainīgo saistību vai atkarību, ja starp abiem mainīgajiem nav atšķirības.
  • Galvenais regresijas mērķis ir izveidot vispiemērotāko līniju, un viena mainīgā novērtēšana tiek veikta, pamatojoties uz citiem, savukārt korelācijā parāda lineāro saistību starp diviem mainīgajiem.
  • Tajā mēs novērtējam zināmo atzītā mainīgā lieluma (X) izmaiņu lielumu aplēstajam mainīgajam (Y), turpretī korelācijā koeficientu izmanto, lai izmērītu, cik lielā mērā abi mainīgie mainās kopā.
  • Tas ir gadījuma neatkarīgu mainīgo lieluma novērtēšanas process, pamatojoties uz statiskā atkarīgā mainīgā lielumu, turpretī korelācija palīdz mums izlemt konkrētu vērtību, lai izteiktu abu mainīgo savstarpējo atkarību.

Secinājums

  • Regresijas analīzē galvenokārt tiek izmantoti dati, lai izveidotu sakarību starp diviem vai vairākiem mainīgajiem. Šeit tiek pieņemts, ka pagātnē pastāvošās attiecības atspoguļosies arī tagadnē vai nākotnē. Tikai nedaudzi uzskata to par laika nobīdi starp pagātni un tagadni / nākotni.
  • Tomēr tā ir plaši izmantota prognozēšanas un novērtēšanas tehnika. Lai gan tas ir saistīts ar matemātiku, kas daudziem lietotājiem var šķist grūta, tehniku ​​ir salīdzinoši viegli izmantot, it īpaši, ja ir pieejams modelis.

Interesanti raksti...