Normāls sadalījums statistikā - definīcija, piemērs, interpretācija

Kas ir normāls sadalījums statistikā?

Normālais sadalījums ir zvana formas frekvences sadalījuma līkne, kas palīdz aprakstīt visas iespējamās vērtības, ko nejaušais mainīgais var iegūt noteiktā diapazonā, un lielākā daļa izplatības laukuma atrodas vidū, un maz ir astes, galējībās. Šim sadalījumam ir divi galvenie parametri: vidējais (µ) un standartnovirze (σ), kam ir galvenā loma aktīvu atdeves aprēķināšanā un riska pārvaldības stratēģijā.

Kā interpretēt normālu izplatību

Iepriekš redzamais attēls parāda, ka statistiskais normālais sadalījums ir zvana formas līkne. Šī sadalījuma iespējamo rezultātu diapazons ir veseli reālie skaitļi, kas atrodas starp-between līdz + ∞. Zvana līknes astes bez ierobežojumiem stiepjas abās diagrammas pusēs (+/-).

  • Aptuveni 68% no visiem novērojumiem ietilpst +/- viena standartnovirze (σ)
  • Aptuveni 95% no visiem novērojumiem ietilpst +/- divās standartnovirzēs (σ)
  • Aptuveni 99% no visiem novērojumiem ietilpst +/- trīs standartnovirzēs (σ)

Tam ir nulles šķībums (sadalījuma simetrija). Ja datu sadalījums ir asimetrisks, tad sadalījums ir nevienmērīgs, ja datu kopas šķībums ir lielāks par nulli vai pozitīvs šķībums. Tad sadalījuma labā aste ir pagarināta nekā kreisā, un negatīva šķībuma gadījumā (mazāk nekā nulle) kreisā aste būs garāka par labo.

Tam ir 3 kurtoze (mēra sadalījuma maksimumu), kas norāda, ka sadalījums nav ne pārāk smails, ne pārāk plānas astes. Ja kurtoze ir lielāka par trim, nekā sadalījums ir vairāk sasniedzams ar resnākām astēm, un, ja kurtoze ir mazāka par trim, tad tai ir plānas astes, un pīķa punkts ir zemāks par parasto sadalījumu.

Raksturlielumi

  • Tie pārstāv sadales saimi, kur vidējā un novirze nosaka sadalījuma formu.
  • Šī sadalījuma vidējais, vidējais un veids ir vienādi.
  • Puse no vērtībām atrodas pa kreisi no centra un otra puse pa labi.
  • Kopējā vērtība zem standarta līknes vienmēr būs viena.
  • Visticamāk, sadalījums ir centrā, un astes galā atrodas mazāk vērtību.

Transformācija (Z)

Šāda sadalījuma nejaušā mainīgā lieluma (X) varbūtības blīvuma funkciju (PDF) sniedz:

kur -∞ <x <∞; -∞ <µ 0

Kur,

  • F (x) = Normāla varbūtības funkcija
  • x = nejaušs mainīgais
  • µ = sadalījuma vidējais lielums
  • σ = sadalījuma standartnovirze
  • π = 3,14159
  • e = 2,71828

Transformācijas formula

Kur,

  • X = nejaušs mainīgais

Normālas izplatības piemēri statistikā

Apspriedīsim šādus piemērus.

1. piemērs

Pieņemsim, ka uzņēmumā ir 10000 darbinieku un vairāku algu struktūra atbilstoši darba lomai, kurā darbinieks strādā. Algas parasti sadala ar iedzīvotāju vidējo vērtību µ = 60 000 USD un iedzīvotāju standartnovirzi σ = 15 000 USD. Kāda būs varbūtība, ka nejauši izvēlēta darbinieka alga ir mazāka par 45 000 USD gadā.

Risinājums

Kā parādīts iepriekšējā attēlā, lai atbildētu uz šo jautājumu, mums jānoskaidro laukums zem normālās līknes no 45 līdz kreisās puses astei. Mums arī jāizmanto Z tabulas vērtība, lai iegūtu pareizo atbildi.

Pirmkārt, izmantojot pārveidošanas formulu, mums jāpārvērš dotais vidējais un standartnovirze normālā normālā sadalījumā ar vidējo (µ) = 0 un standartnovirzi (σ) = 1.

Pēc konvertēšanas mums ir jāmeklē Z- tabula, lai uzzinātu atbilstošo vērtību, kas mums sniegs pareizo atbildi.

Ņemot vērā

  • Vidējais (µ) = 60 000 USD
  • Standarta novirze (σ) = 15000 USD
  • Nejaušais mainīgais (x) = 45 000 USD

Transformācija (z) = (45000 - 60000/15000)

Transformācija (z) = -1

Tagad vērtība, kas Z tabulā ir vienāda ar -1, ir 0,1587, kas apzīmē laukumu zem līknes no 45 līdz ceļam pa kreisi. Tas norādīja, ka tad, kad mēs nejauši izvēlamies darbinieku, varbūtība nopelnīt mazāk nekā 45 000 USD gadā ir 15,87%.

2. piemērs

Tagad saglabājot to pašu scenāriju kā iepriekš, noskaidrojiet varbūtību, ka nejauši izvēlēts darbinieks nopelna vairāk nekā 80 000 USD gadā, izmantojot parasto sadalījumu.

Risinājums

Tāpēc šajā jautājumā mums jānoskaidro ēnotais laukums no 80 līdz labajai astei, izmantojot to pašu formulu.

Ņemot vērā

  • Vidējais (µ) = 60 000 USD
  • Standarta novirze (σ) = 15000 USD
  • Nejaušais mainīgais (X) = 80 000 USD

Pārveidošana (z) = (80000 - 60000/15000)

Transformācija (z) = 1,33

Saskaņā ar Z tabulu ekvivalentā vērtība 1,33 ir 0,9082 vai 90,82%, kas parāda, ka varbūtība nejauši atlasīt darbiniekus, kuri nopelna mazāk nekā 80 000 ASV dolāru gadā, ir 90,82%.

Bet saskaņā ar jautājumu mums jānosaka varbūtība, ka nejauši izvēlētie darbinieki nopelna vairāk nekā 80 000 USD gadā, tāpēc mums jāatņem vērtība no 100.

  • Nejaušais mainīgais (X) = 100% - 90,82%
  • Nejaušais mainīgais (X) = 9,18%

Tātad varbūtība, ka darbinieki nopelna vairāk nekā 80 000 USD gadā, ir 9,18%.

Izmanto

  • Akciju tirgus tehniskā diagramma bieži ir zvana līkne, kas ļauj analītiķiem un investoriem izdarīt statistikas secinājumus par paredzamo peļņu un akciju risku.
  • To izmanto reālajā pasaulē, piemēram, lai noteiktu visticamāko labāko laiku, kādu picu uzņēmumi patērē picu piegādei un daudzām citām reālām lietojumprogrammām.
  • Izmanto, lai salīdzinātu noteiktas populācijas augstumu, kurā lielākajai daļai cilvēku būs vidējs lielums, un ļoti maz cilvēku ar augstumu virs vidējā vai zemāka.
  • Tos izmanto, lai noteiktu studentu vidējo akadēmisko sniegumu, kas palīdz salīdzināt studentu rangu.

Secinājums

Normāls sadalījums atrod lietojumus datu zinātnē un datu analīzē. Uzlabotas tehnoloģijas, piemēram, mākslīgais intelekts un mašīnmācīšanās, ko izmanto kopā ar šo izplatīšanu, var nodrošināt labāku datu kvalitāti, kas palīdzēs personām un uzņēmumiem efektīvi pieņemt lēmumus.

Interesanti raksti...