Lineārā regresija (definīcija, piemēri) Kā interpretēt?

Satura rādītājs

Kas ir lineārā regresija?

Lineārā regresija būtībā ir statistikas modelēšanas paņēmiens, ko izmanto, lai parādītu attiecības starp vienu atkarīgo mainīgo un vienu vai vairākiem neatkarīgiem mainīgajiem. Tas ir viens no izplatītākajiem prognozēšanas analīzes veidiem. Šāda veida sadalījums veidojas līnijā, tāpēc to sauc par lineāro regresiju. Šajā rakstā mēs izmantosim lineārās regresijas analīzes piemērus programmā Excel.

Lai vispirms veiktu lineāro regresijas analīzi, mums jāpievieno Excel pievienojumprogrammas, veicot šādas darbības.

Noklikšķiniet uz Fails - Opcijas (tas atvērs Excel opciju uznirstošo logu).

Noklikšķiniet uz Add-ins - atlasiet Excel pievienojumprogrammas programmā Excel pārvaldīt nolaižamo izvēlni, pēc tam noklikšķiniet uz Go.

Tas atvērs pievienojumprogrammu uznirstošo logu. Atlasiet Analysis ToolPak un pēc tam noklikšķiniet uz Labi.

Datu analīzes pievienojumprogramma parādīsies zem cilnes Ievietot.

Ļaujiet mums saprast, izmantojot tālāk redzamos lineārās regresijas analīzes piemērus.

Lineārās regresijas analīzes piemēri

1. piemērs

Pieņemsim, ka mums ir mēneša pārdošanas apjomi un iztērēti mārketingam par pagājušo gadu, un tagad mums ir jāparedz nākotnes pārdošanas apjomi, pamatojoties uz pagājušā gada pārdošanas un mārketinga izdevumiem.

Mēnesis Reklāma Pārdošana
Jan 40937 502729
Februāris 42376 507553
Marts 43355 516885
Apr 44126 528347
Maijs 45060 537298
Jūnijs 49546 544066
Jūl 56105 553664
Aug 59322 563201
Sept 59877 568657
Okt 60481 569384
Nov 62356 573764
Dec 63246 582746

Cilnē Dati noklikšķiniet uz Datu analīze, un tas jums atvērs Datu analīzes uznirstošo logu.

Tagad sarakstā atlasiet Regresija un noklikšķiniet uz Labi.

Atvērsies regresijas uznirstošais logs.

Y ass lodziņā atlasiet Pārdošanas diapazons $ C $ 1: $ C $ 13, jo tas ir atkarīgs mainīgais, un $ B $ 1: $ B $ 14 X ass virzienā, jo iztērētā reklāma ir neatkarīgais mainīgais.

Atzīmējiet izvēles rūtiņu lodziņā Etiķetes, ja datos esat atlasījis galvenes, pretējā gadījumā kļūda tiks parādīta.

Atlasiet Izvades diapazons, ja vēlaties iegūt vērtību konkrētajam darblapas diapazonam, citādi atlasiet Jauns darblapas slānis: un tas pievienos jaunu darblapu un sniegs rezultātu.

Pēc tam atzīmējiet izvēles rūtiņu Atlikumi un noklikšķiniet uz Labi.

Tas pievienos darblapas un sniegs jums šādu rezultātu.

Ļaujiet mums saprast iznākumu.

Kopsavilkuma iznākums

Vairāki R: Tas norāda korelācijas koeficientu. Vērtība 1 parāda pozitīvas attiecības, un vērtība 0 neuzrāda nekādas attiecības.

R kvadrāts: R kvadrāts apzīmē noteikšanas koeficientu. Tas norāda, cik procentus punktu krīt uz regresijas līnijas. 0,49 nozīmē, ka modelim atbilst 49% vērtību

Pielāgots R kvadrāts : Tas ir pielāgots R kvadrāts, kas nepieciešams, ja jums ir vairāk nekā viens X mainīgais.

Standarta kļūda: tas norāda kļūdas standarta novirzes novērtējumu. Šī ir precizitāte, ar kuru mēra regresijas koeficientu.

Novērojumi: Šis ir novērojumu skaits, ko esat veicis izlasē.

ANOVA - Df: Brīvības pakāpes

SS: Kvadrātu summa.

MS: mums ir divas dalībvalstis

  • Regresijas MS ir regresijas SS / regresijas Df.
  • Atlikušais MS ir vidējā kvadrāta kļūda (atlikušais SS / atlikušais Df).

F: F tests nulles hipotēzei.

F nozīmīgums: P nozīmes, kas saistītas ar nozīmīgumu

Koeficients: koeficients sniedz aprēķinu par vismazāko kvadrātu.

T Statistika: T Statistika nulles hipotēzei pret alternatīvo hipotēzi.

P vērtība: tā ir hipotēzes testa p vērtība.

Zemākā 95% un augšējā 95%: tās ir ticamības intervāla apakšējā un augšējā robeža

Atlikumu rezultāts: mums ir 12 novērojumi, pamatojoties uz datiem. 2 nd sleja atspoguļo prognozētās pārdošanas un 3 rd kolonnu atlikumos. Atlikumi būtībā ir paredzamo pārdošanas apjomu atšķirība no faktiskā.

2. piemērs

Atlasiet paredzamo pārdošanas un mārketinga sleju

Dodieties uz diagrammu grupu cilnē Ievietot. Atlasiet izkliedes diagrammas ikonu

Tādējādi Excel tiks ievietots izkliedes grafiks. Skatīt attēlu zemāk

Ar peles labo pogu noklikšķiniet uz jebkura punkta un pēc tam atlasiet Add Trendline in Excel. Tas diagrammai pievienos tendenču līniju.

  • Jūs varat formatēt tendenču līniju, ar peles labo pogu noklikšķiniet jebkurā tendences līnijas vietā un pēc tam atlasiet trendline formāta formātu.
  • Diagrammā varat veikt vairāk uzlabojumu. ti, tendenču līnijas formatēšana, krāsas un nosaukuma maiņa utt
  • Formulu var parādīt arī diagrammā, pārbaudot diagrammā Displeja formulu un parādot diagrammā R kvadrāta vērtību.

Daži citi lineārās regresijas analīzes piemēri:

  1. Prognoze par pārdoto lietussargu, pamatojoties uz lietu, notika apgabalā.
  2. Prognoze par pārdoto maiņstrāvu, pamatojoties uz vasaras temperatūru.
  3. Eksāmenu sezonā palielinājās Stationary pārdošanas apjomi, eksāmenu ceļvežu pārdošanas apjomi.
  4. Pārdošanas prognoze, kad reklāma ir notikusi, pamatojoties uz High TRP sēriju, kur tiek veikta reklāma, zīmola vēstnieka popularitāti un pēdas vietā, kur tiek publicēta reklāma.
  5. Mājas pārdošana, pamatojoties uz atrašanās vietu, platību un cenu.

3. piemērs

Pieņemsim, ka mums ir deviņi studenti ar IQ līmeni un skaitu, ko viņi ieguva testā.

Students Pārbaudes rezultāts IQ
Auns 100 145
Šyam 97 140
Kul 93 130
Kappu 91 125
Radžu 89 115
Vishal 86 110
Vivek 82 100
Vinay 78 95
Kumars 75 90

1. solis: vispirms noskaidrojiet atkarīgos un neatkarīgos mainīgos. Šeit testa rezultāts ir atkarīgs mainīgais, un IQ ir neatkarīgais mainīgais, jo testa rezultāts mainās, mainoties IQ.

2. solis: dodieties uz cilni Dati - noklikšķiniet uz Datu analīze - Atlasiet regresiju - noklikšķiniet uz Labi.

Tas jums atvērs logu Regresija.

3. solis. Ievades testa rezultātu diapazons Ievades Y diapazona lodziņā un IQ Ievades X diapazona lodziņā. (Pārbaudiet etiķetes, ja datu diapazonā ir galvenes. Atlasiet izvades opcijas, pēc tam pārbaudiet vēlamos atlikumus. Noklikšķiniet uz Labi.

Jūs saņemsiet kopsavilkuma rezultātu, kas parādīts zemāk esošajā attēlā.

4. solis: regresijas analīze pēc kopsavilkuma izejas

Kopsavilkuma iznākums

Vairāki R: Šeit korelācijas koeficients ir 0,99, kas ir ļoti tuvu 1, kas nozīmē, ka lineārās attiecības ir ļoti pozitīvas.

R kvadrāts: R kvadrāta vērtība ir 0,983, kas nozīmē, ka modelim atbilst 98,3% vērtību.

P-vērtība: Šeit P-vērtība ir 1,86881E-07, kas ir ļoti mazāka par .1, kas nozīmē, ka IQ ir nozīmīgas paredzamās vērtības.

Skatiet zemāk redzamo diagrammu.

Var redzēt, ka gandrīz visi punkti krīt vienā līnijā vai tuvumā esošai tendencei.

4. piemērs

Mums jāprognozē maiņstrāvas pārdošanas apjomi, pamatojoties uz pārdošanas un temperatūras rādītājiem citam mēnesim.

Mēnesis Temp Pārdošana
Jan 25 38893
Februāris 28 42254
Marts 31 42845
Apr 33 47917
Maijs 37 51243
Jūnijs 40 69588
Jūl 38 56570
Aug 37 50000

Lai iegūtu regresijas rezultātu, veiciet tālāk norādītās darbības.

1. solis: vispirms noskaidrojiet atkarīgos un neatkarīgos mainīgos. Pārdošana ir atkarīgs mainīgais, un temperatūra ir neatkarīgs mainīgais, jo pārdošanas apjomi mainās, mainoties temperatūrai.

2. solis: dodieties uz cilni Dati - noklikšķiniet uz Datu analīze - Atlasiet regresiju - noklikšķiniet uz Labi.

Tas jums atvērs logu Regresija.

3. solis. Ievades pārdošana Y ievades diapazona lodziņā un temperatūra Ievades X diapazona lodziņā. (Pārbaudiet etiķetes, ja datu diapazonā ir galvenes. Atlasiet izvades opcijas, pēc tam pārbaudiet vēlamos atlikumus. Noklikšķiniet uz Labi.

Tas sniegs jums kopsavilkuma izvadi, kā norādīts zemāk.

4. solis: analizējiet rezultātu.

Vairāki R: Šeit korelācijas koeficients ir 0,877, kas ir tuvu 1, kas nozīmē, ka lineārā attiecība ir pozitīva.

R kvadrāts: R kvadrāta vērtība ir 0,770, kas nozīmē, ka modelim atbilst 77% vērtību

P-vērtība: Šeit P-vērtība ir 1,86881E-07, kas ir ļoti mazāka par .1, kas nozīmē, ka IQ ir nozīmīgas prediktīvas vērtības.

5. piemērs

Tagad darīsim vairāku neatkarīgu mainīgo regresijas analīzi:

Jums jāparedz mobilā tālruņa pārdošanas apjomi, kas tiks palaisti nākamajā gadā. Jums ir to valstu cena un iedzīvotāju skaits, kuras ietekmē mobilo tālruņu pārdošanu.

Mobilā versija Pārdošana Daudzums Populācija
ASV 63860 858 823
Lielbritānija 61841 877. lpp 660
KZ 60876 873 631
CH 58188 726 842
HN 52728 864 573
ĀS 52388 680 809
NZ 51075 728 661
RU 49019 689. lpp 778

Lai iegūtu regresijas rezultātu, veiciet tālāk norādītās darbības.

1. solis. Vispirms noskaidro atkarīgos un neatkarīgos mainīgos. Šeit pārdošanas apjoms ir atkarīgs no mainīgā lieluma, daudzuma un populācijas. Abi ir neatkarīgi mainīgie, jo pārdošanas apjomi atšķiras atkarībā no valsts daudzuma un iedzīvotāju skaita.

2. solis. Dodieties uz cilni Dati - noklikšķiniet uz Datu analīze - Atlasiet regresiju - noklikšķiniet uz Labi.

Tas jums atvērs logu Regresija.

3. solis. Ievades pārdošana Ievades Y diapazona lodziņā un lodziņā Ievades X diapazons atlasiet daudzumu un populāciju. (Pārbaudiet etiķetes, ja datu diapazonā ir galvenes. Atlasiet izvades opcijas, pēc tam pārbaudiet vēlamos atlikumus. Noklikšķiniet uz Labi.

Tagad izpildiet regresiju, izmantojot datu analīzi cilnē Dati. Tas dos jums šādu rezultātu.

Kopsavilkuma iznākums

Vairāki R: Šeit korelācijas koeficients ir 0,93, kas ir ļoti tuvu 1, kas nozīmē, ka lineārās attiecības ir ļoti pozitīvas.

R kvadrāts: R kvadrāta vērtība ir 0,866, kas nozīmē, ka modelim atbilst 86,7% vērtību.

F nozīmīgums: nozīmīgums F ir mazāks par .1, kas nozīmē, ka regresijas vienādojumam ir nozīmīga prediktīva vērtība.

P vērtība : aplūkojot P vērtību Kvantitātei un populācijai, var redzēt, ka vērtības ir mazākas par .1, kas nozīmē, ka daudzumam un populācijai ir nozīmīga paredzamā vērtība. Jo mazāk P vērtību nozīmē, ka mainīgajam ir nozīmīgākas prediktīvās vērtības.

Tomēr gan daudzumam, gan populācijai ir nozīmīga prognozējošā vērtība, taču, ja paskatās uz P vērtību kvantitātei un populācijai, nekā jūs varat redzēt, ka daudzumam ir mazāka P vērtība Excel nekā Population. Tas nozīmē, ka daudzumam ir nozīmīgāka paredzamā vērtība nekā populācijai.

Atceramās lietas

  • Vienmēr pārbaudiet mainīgos Mainīgais un Neatkarīgais, kad atlasāt datus.
  • Lineārajā regresijas analīzē tiek ņemta vērā saistība starp mainīgo vidējo.
  • Tas tikai modelē attiecības starp mainīgajiem, kas ir lineāri
  • Dažreiz tas nav vispiemērotākais reālās pasaules problēmai. Piemēram: (Vecums un algas). Lielāko daļu laika, palielinoties vecumam, algas pieaug. Tomēr pēc aiziešanas pensijā vecums palielinās, bet algas samazinās.

Interesanti raksti...