Comparthing Logo
statistikadatu analīzematemātikaizglītība

Vidējais un standarta novirze

Lai gan abi kalpo kā statistikas pamatpīlāri, tie apraksta pilnīgi atšķirīgas datu kopas īpašības. Vidējais rādītājs identificē centrālo līdzsvarošanas punktu vai vidējo vērtību, savukārt standartnovirze mēra, cik lielā mērā atsevišķi datu punkti novirzās no šī centra, sniedzot būtisku kontekstu par informācijas konsekvenci vai svārstīgumu.

Iezīmes

  • Vidējais rādītājs norāda “ko”, savukārt standartnovirze norāda “cik daudz” attiecībā uz variāciju.
  • Vidējais rādītājs var būt identisks divām grupām, kas vizuāli izskatās pilnīgi atšķirīgas.
  • Standartnovirze būtībā ir katra punkta vidējais attālums no vidējās vērtības.
  • Bez abiem skaitļiem statistisks kopsavilkums bieži vien ir nepilnīgs vai pat maldinošs.

Kas ir Vidējais?

Datu kopas aritmētiskais vidējais, kas aprēķināts, summējot visas vērtības un dalot ar kopējo skaitu.

  • Tas darbojas kā skaitliskā sadalījuma ģeometriskais centrs vai "līdzsvara punkts".
  • Aprēķinā ir iekļauta katra atsevišķā vērtība konkrētajā datu kopā.
  • Novirzes vai ekstremālas vērtības var ievērojami atšķirt rezultātu no vairuma datu.
  • Perfekti simetriskā zvana līknē tā precīzi sakrīt ar mediānu un režīmu.
  • Statistiķi populācijas versiju attēlo ar grieķu burtu mu (μ).

Kas ir Standarta novirze?

Metrika, kas kvantificē variācijas vai izkliedes apjomu datu vērtību kopā.

  • Zemas vērtības norāda, ka datu punkti atrodas ļoti tuvu aprēķinātajam vidējam rādītājam.
  • Tas tiek izteikts tajās pašās fizikālajās vienībās kā sākotnējie dati, kas tiek mērīti.
  • Vērtību iegūst, aprēķinot dispersijas kvadrātsakni.
  • Augstas vērtības liecina par plašu izplatību, kas norāda uz mazāku datu paredzamību.
  • Grieķu burts sigma (σ) ir standarta simbols, ko izmanto populācijas novirzes apzīmēšanai.

Salīdzinājuma tabula

Funkcija Vidējais Standarta novirze
Galvenais mērķis Atrodiet centru Izmēriet starpību
Jutība pret novirzēm Augsts (var viegli sašķiebt) Augsts (galējības palielina vērtību)
Matemātiskais simbols μ (Mu) vai x̄ (x-josla) σ (Sigma) vai s
Mērvienības Tāpat kā dati Tāpat kā dati
Nulles rezultāts Vidējais rādītājs ir nulle Visi datu punkti ir identiski
Galvenais pielietojums Vispārējās veiktspējas noteikšana Riska un konsekvences novērtēšana

Detalizēts salīdzinājums

Centralitāte pret dispersiju

Vidējā vērtība norāda, kur atrodas datu "vidus", sniedzot ātru ieskatu vispārējā līmenī. Turpretī standartnovirze ignorē centra atrašanās vietu, lai pilnībā koncentrētos uz atšķirībām starp skaitļiem. Jums var būt divas grupas ar identisku vidējo vērtību 50, bet, ja viena grupa svārstās no 49 līdz 51, bet otra - no 0 līdz 100, standartnovirze ir vienīgais rīks, kas atklāj šo milzīgo ticamības atšķirību.

Jutība pret ekstremālām vērtībām

Abi rādītāji izjūt noviržu ietekmi, taču tie reaģē atšķirīgi. Ārkārtīgi augsts skaitlis palielinās vidējo vērtību, potenciāli radot maldinošu priekšstatu par “tipisko” pieredzi. Tas pats noviržu rādītājs izraisa standartnovirzes pieaugumu, signalizējot pētniekam, ka dati ir trokšņaini un vidējais rādītājs, iespējams, nav uzticams visas grupas pārstāvis.

Loma normālajā sadalījumā

Aplūkojot zvanveida līkni, šie divi darbojas tandēmā, lai noteiktu formu. Vidējais rādītājs nosaka, kur līknes virsotne atrodas uz horizontālās ass. Standartnovirze kontrolē platumu; neliela novirze rada garu, tievu virsotni, savukārt liela novirze izstiepj līkni īsā, resnā uzkalniņā. Kopā tie ļauj mums paredzēt, ka aptuveni 68% datu atrodas viena "soļa" attālumā no centra.

Praktiska lēmumu pieņemšana

Reālajā pasaulē vidējo vērtību bieži izmanto mērķiem, piemēram, mērķa pārdošanas apjomam. Tomēr standartnovirze ir tas, ko profesionāļi izmanto riska pārvaldībai. Piemēram, pasažieris var izvēlēties autobusa maršrutu ar nedaudz ilgāku vidējo brauciena laiku, ja tam ir ļoti zema standartnovirze, jo tas garantē, ka viņš katru dienu ieradīsies laikā, nevis saskarsies ar neparedzamām svārstībām.

Priekšrocības un trūkumi

Vidējais

Iepriekšējumi

  • + Viegli aprēķināt
  • + Ļoti intuitīvs
  • + Izmanto visus datus
  • + Labi piemērots salīdzinājumiem

Ievietots

  • Neaizsargāti pret izņēmumiem
  • Maldinoši dati sagrozīti
  • Var būt neesoša vērtība
  • Slēpj iekšējo daudzveidību

Standarta novirze

Iepriekšējumi

  • + Parāda datu ticamību
  • + Saglabā oriģinālās vienības
  • + Izšķiroša nozīme varbūtībā
  • + Identificē svārstīgumu

Ievietots

  • Grūtāk aprēķināt manuāli
  • Bezjēdzīgs bez jēgas
  • Ietekmē galējības
  • Nepieciešami lieli paraugi

Biežas maldības

Mīts

Vidējais rādītājs 80 nozīmē, ka lielākā daļa cilvēku ieguva 80 punktus.

Realitāte

Vidējais rādītājs ir tikai līdzsvara punkts; iespējams, ka neviens faktiski neiegūst 80 punktus, ja dati ir sadalīti starp ļoti augstām un ļoti zemām vērtībām.

Mīts

Standartnovirze var būt negatīvs skaitlis.

Realitāte

Tā kā formula ietver starpību kvadrātu no vidējā, rezultāts vienmēr ir nulle vai pozitīvs. Negatīva vērtība matemātiski nav iespējama.

Mīts

Augsta standartnovirze vienmēr ir “slikta” lieta.

Realitāte

Tas vienkārši norāda uz daudzveidību. Klasē augsta interešu standartnovirze ir lieliska, pat ja ražotājam, kurš mēģina izgatavot identiskas skrūves, tas varētu radīt stresu.

Mīts

Standarta novirzi var aprēķināt, nezinot vidējo vērtību.

Realitāte

Vidējais rādītājs ir obligāta formulas sastāvdaļa. Vispirms ir jāzina, kur atrodas centrs, pirms var izmērīt, cik tālu viss atrodas no tā.

Bieži uzdotie jautājumi

Kāpēc mēs izmantojam standartnovirzi, nevis tikai diapazonu?
Diapazons aplūko tikai divas galējās vērtības, kas var būt maldinoši, ja tās ir tikai nejaušas atzīmes. Standartnovirze ir daudz robustāka, jo tā aplūko katra atsevišķā datu punkta atrašanās vietu. Tā sniedz priekšstatu par datu "blīvumu", ne tikai ārējām robežām.
Vai diviem dažādiem datu kopumiem var būt vienāds vidējais rādītājs un atšķirīgas standartnovirzes?
Pilnīgi noteikti, un tas reālajā pasaulē notiek visu laiku. Iedomājieties divas pilsētas ar vidējo temperatūru 70 grādi pēc Celsija. Viena varētu visu gadu saglabāties no 68 līdz 72 grādiem (zema novirze), bet otra svārstās no 20 līdz 120 (augsta novirze). Vidējais rādītājs ir vienāds, bet dzīves pieredze ir pilnīgi atšķirīga.
Vai zema standartnovirze nozīmē, ka dati ir “precīzi”?
Ne obligāti. Tas nozīmē, ka dati ir “precīzi” vai konsekventi. Jums varētu būt svari, kas ir salūzuši un vienmēr sver lietas par 5 mārciņām smagāk. Standartnovirze būtu zema, jo rezultāti ir konsekventi, bet vidējais rādītājs būtu neprecīzs, salīdzinot ar patieso svaru.
Kurš no tiem ir svarīgāks investīcijām?
Investori izmanto abus, taču viņi bieži vien rūpīgāk seko līdzi standartnovirzei, jo tā atspoguļo "risku". Vidējais rādītājs norāda paredzamo ienesīgumu, bet standartnovirze norāda, cik lielā mērā šis ienesīgums varētu svārstīties. Liela novirze nozīmē nelīdzenu ceļu ar lielāku īslaicīgu zaudējumu iespējamību.
Kā novirzes ietekmē šos divus rādītājus?
Anomālijas ir kā magnēts, kas pievelk vidējo vērtību sev klāt. Standartnovirzes gadījumā anomāls lielums darbojas kā pastiprinātājs. Tā kā attālums no vidējās vērtības aprēķinā tiek kāpināts kvadrātā, viens tāls punkts var nesamērīgi palielināt standartnovirzi, signalizējot, ka datu kopa ir ļoti izkliedēta.
Kad man vajadzētu izmantot mediānu vidējās vērtības vietā?
Jums vajadzētu pārslēgties uz mediānu, ja jūsu dati ir “sagrozīti” vai tiem ir ievērojamas novirzes, piemēram, māju cenas vai algas. Šādos gadījumos daži miljardieri var panākt, lai vidējais rādītājs izskatītos daudz augstāks nekā tipiska cilvēka faktiskie ienākumi. Mediāna ir “izturīga” pret šādām galējībām.
Kāds ir noteikums 68-95-99,7?
Šis ir ērts noteikums normāliem sadalījumiem. Tas nosaka, ka 68% jūsu datu atradīsies vienas standartnovirzes robežās no vidējās vērtības, 95% - divu un 99,7% - trīs standartnoviržu robežās. Tas ir spēcīgs veids, kā redzēt, cik "normāls" vai "dīvains" patiesībā ir konkrēts datu punkts.
Vai standartnovirze ir tas pats, kas dispersija?
Tie ir cieši saistīti, bet ne viens un tas pats. Dispersija ir kvadrātveida atšķirību no vidējā rādītāja vidējais lielums, kas rada "kvadrātvienības" (piemēram, kvadrātdolārus), kuras ir grūti vizualizēt. Mēs ņemam dispersijas kvadrātsakni, lai iegūtu standartnovirzi, lai vienības atkal atbilstu mūsu sākotnējiem datiem.

Spriedums

Izvēlieties vidējo vērtību, ja jums ir nepieciešams viens reprezentatīvs skaitlis, lai apkopotu grupas kopējo līmeni. Izmantojiet standartnovirzi, ja jums ir jāizprot šī vidējā rādītāja ticamība vai daudzveidība jūsu izlasē.

Saistītie salīdzinājumi

Absolūtā vērtība pret moduli

Lai gan ievadmatemātikā absolūtā vērtība bieži tiek lietota kā sinonīms, tā parasti attiecas uz reālā skaitļa attālumu no nulles, savukārt modulis paplašina šo jēdzienu, iekļaujot kompleksos skaitļus un vektorus. Abiem ir viens un tas pats pamatmērķis: noņemt virziena zīmes, lai atklātu matemātiskas vienības tīro lielumu.

Algebra pret ģeometriju

Kamēr algebra koncentrējas uz abstraktiem darbību noteikumiem un simbolu manipulācijām, lai atrisinātu nezināmos, ģeometrija pēta telpas fizikālās īpašības, tostarp figūru izmēru, formu un relatīvo novietojumu. Kopā tie veido matemātikas pamatu, pārvēršot loģiskās attiecības vizuālās struktūrās.

Aplis pret elipsi

Lai gan apli nosaka viens centra punkts un nemainīgs rādiuss, elipse paplašina šo koncepciju līdz diviem fokusa punktiem, radot iegarenu formu, kur attālumu summa līdz šiem fokusiem paliek nemainīga. Katrs aplis tehniski ir īpašs elipses veids, kur abi fokusi perfekti pārklājas, padarot tos par visciešāk saistītajām figūrām koordinātu ģeometrijā.

Aritmētiskā pret ģeometrisko secību

Aritmētiskās un ģeometriskās secības būtībā ir divi dažādi veidi, kā palielināt vai samazināt skaitļu sarakstu. Aritmētiskā secība mainās vienmērīgā, lineārā tempā, veicot saskaitīšanu vai atņemšanu, savukārt ģeometriskā secība paātrinās vai palēninās eksponenciāli, veicot reizināšanu vai dalīšanu.

Aritmētiskais vidējais pret svērto vidējo

Aritmētiskais vidējais katru datu punktu uzskata par vienlīdzīgu ieguldījumu galīgajā vidējā vērtībā, savukārt svērtais vidējais piešķir noteiktus svarīguma līmeņus dažādām vērtībām. Šīs atšķirības izpratne ir ļoti svarīga visam, sākot no vienkāršu klases vidējo vērtību aprēķināšanas līdz sarežģītu finanšu portfeļu noteikšanai, kur dažiem aktīviem ir lielāka nozīme nekā citiem.