Comparthing Logo
tilastotdata-analyysimatematiikkakoulutus

Keskiarvo vs. keskihajonta

Vaikka molemmat toimivat tilastotieteen peruspilareina, ne kuvaavat tietojoukon täysin erilaisia ominaisuuksia. Keskiarvo määrittää keskeisen tasapainopisteen tai keskiarvon, kun taas keskihajonta mittaa, kuinka paljon yksittäiset datapisteet poikkeavat tästä keskipisteestä, mikä tarjoaa tärkeää kontekstia tiedon johdonmukaisuudesta tai volatiliteetista.

Korostukset

  • Keskiarvo kertoo, mitä vaihtelua on, kun taas keskihajonta kertoo, kuinka paljon.
  • Keskiarvo voi olla identtinen kahdelle ryhmälle, jotka näyttävät visuaalisesti täysin erilaisilta.
  • Keskihajonta on pohjimmiltaan jokaisen pisteen keskimääräinen etäisyys keskiarvosta.
  • Ilman molempia lukuja tilastollinen yhteenveto on usein epätäydellinen tai jopa harhaanjohtava.

Mikä on Tarkoittaa?

Tietojoukon aritmeettinen keskiarvo, joka lasketaan laskemalla yhteen kaikki arvot ja jakamalla se kokonaismäärällä.

  • Se toimii numeerisen jakauman geometrisena keskuksena tai 'tasapainopisteenä'.
  • Laskelma sisältää jokaisen yksittäisen arvon tietyssä tietojoukossa.
  • Poikkeavat arvot tai ääriarvot voivat merkittävästi vetää tuloksen pois suurimmasta osasta dataa.
  • Täysin symmetrisessä kellokäyrässä se on täsmälleen mediaanin ja moodin linjassa.
  • Tilastotieteilijät esittävät väestöversion kreikkalaisella kirjaimella mu (μ).

Mikä on Keskihajonta?

Mittari, joka ilmaisee vaihtelun tai hajonnan määrän joukon tietoarvoissa.

  • Matalat arvot osoittavat, että datapisteet ovat hyvin lähellä laskettua keskiarvoa.
  • Se ilmaistaan samoissa fyysisissä yksiköissä kuin mitattava alkuperäinen data.
  • Arvo johdetaan ottamalla varianssin neliöjuuri.
  • Korkeat arvot viittaavat laajaan hajontaan, mikä osoittaa datan heikompaa ennustettavuutta.
  • Kreikkalainen kirjain sigma (σ) on populaatiopoikkeaman ilmaisussa käytetty standardisymboli.

Vertailutaulukko

Ominaisuus Tarkoittaa Keskihajonta
Ensisijainen tarkoitus Paikanna keskusta Mittaa leviäminen
Herkkyys poikkeaville arvoille Korkea (voidaan helposti vinottaa) Korkea (ääriarvot nostavat arvoa)
Matemaattinen symboli μ (Mu) tai x̄ (x-palkki) σ (Sigma) tai s
Mittayksiköt Sama kuin data Sama kuin data
Nollan tulos Keskiarvo on nolla Kaikki datapisteet ovat identtisiä
Keskeinen sovellus Yleisen suorituskyvyn määrittäminen Riskien ja johdonmukaisuuden arviointi

Yksityiskohtainen vertailu

Keskeisyys vs. dispersio

Keskiarvo kertoo, missä datasi "keskikohta" sijaitsee, ja tarjoaa nopean tilannekuvan yleisestä tasosta. Keskihajonta sitä vastoin jättää huomiotta keskipisteen sijainnin ja keskittyy kokonaan lukujen välisiin aukkoihin. Sinulla voi olla kaksi ryhmää, joiden keskiarvo on identtinen 50, mutta jos toisen ryhmän arvot vaihtelevat välillä 49–51 ja toisen välillä 0–100, keskihajonta on ainoa työkalu, joka paljastaa tämän valtavan eron luotettavuudessa.

Herkkyys ääriarvoille

Molemmat mittarit kantavat poikkeavien havaintojen painoarvoa, mutta ne reagoivat eri tavoin. Poikkeuksellisen suuri luku nostaa keskiarvoa ylöspäin, mikä voi antaa harhaanjohtavan kuvan "tyypillisestä" kokemuksesta. Sama poikkeava havainto pakottaa keskihajonnan nousemaan, mikä viestii tutkijalle, että data on kohinaista eikä keskiarvo välttämättä edusta luotettavasti koko ryhmää.

Rooli normaalijakaumassa

Kun tarkastellaan kellokäyrää, nämä kaksi toimivat yhdessä ja määrittävät sen muodon. Keskiarvo määrittää, missä käyrän huippu sijaitsee vaakasuoralla akselilla. Keskihajonta kontrolloi leveyttä; pieni poikkeama luo korkean, kapean piikin, kun taas suuri poikkeama venyttää käyrää lyhyeksi, paksuksi kumpuksi. Yhdessä ne antavat meille mahdollisuuden ennustaa, että noin 68 % datasta sijoittuu yhden "askeleen" päähän keskipisteestä.

Käytännön päätöksenteko

Käytännössä keskiarvoa käytetään usein tavoitteiden, kuten myyntitavoitteen, määrittämiseen. Keskihajontaa käytetään kuitenkin ammattilaisten riskienhallintaan. Esimerkiksi työmatkalainen voi valita bussireitin, jolla on hieman pidempi keskimääräinen matka-aika, jos sen keskihajonta on hyvin pieni, koska se takaa, että he saapuvat perille ajoissa joka päivä sen sijaan, että heidän tarvitsisi joutua odottamattomien vaihteluiden kohteeksi.

Hyödyt ja haitat

Tarkoittaa

Plussat

  • + Helppo laskea
  • + Hyvin intuitiivinen
  • + Käyttää kaikkia tietoja
  • + Hyvä vertailuihin

Sisältö

  • Haavoittuvainen poikkeavuuksille
  • Harhaanjohtavaa vinoutuneessa datassa
  • Voi olla olematon arvo
  • Piilottaa sisäisen monimuotoisuuden

Keskihajonta

Plussat

  • + Osoittaa datan luotettavuuden
  • + Säilyttää alkuperäiset yksiköt
  • + Ratkaisevaa todennäköisyyden kannalta
  • + Tunnistaa volatiliteetin

Sisältö

  • Vaikeampi laskea manuaalisesti
  • Merkityksetön ilman keskiarvoa
  • Äärimmäisten tekijöiden vaikutuksesta
  • Vaatii suuria näytteitä

Yleisiä harhaluuloja

Myytti

Keskiarvo 80 tarkoittaa, että useimmat ihmiset saivat 80 pistettä.

Todellisuus

Keskiarvo on vain tasapainopiste; on mahdollista, ettei kukaan ole todellisuudessa saanut 80 pistettä, jos tiedot jakautuvat erittäin korkeisiin ja erittäin mataliin arvoihin.

Myytti

Keskihajonta voi olla negatiivinen luku.

Todellisuus

Koska kaavassa keskiarvosta saatujen erojen neliöinti tapahtuu, tulos on aina nolla tai positiivinen. Negatiivinen arvo on matemaattisesti mahdotonta.

Myytti

Korkea keskihajonta on aina "huono" asia.

Todellisuus

Se yksinkertaisesti osoittaa vaihtelua. Luokkahuoneessa kiinnostuksen kohteiden suuri keskihajonta on hyvä asia, vaikka se saattaisi olla stressaavaa valmistajalle, joka yrittää valmistaa identtisiä pultteja.

Myytti

Voit laskea keskihajonnan tietämättä keskiarvoa.

Todellisuus

Keskiarvo on kaavan pakollinen osa. Sinun on ensin tiedettävä, missä keskipiste sijaitsee, ennen kuin voit mitata, kuinka kaukana kaikki on siitä.

Usein kysytyt kysymykset

Miksi käytämme keskihajontaa pelkän vaihteluvälin sijaan?
Vaihteluväli tarkastelee vain kahta ääriarvoa, mikä voi olla harhaanjohtavaa, jos ne ovat vain satunnaisia onnenpotkuja. Keskihajonta on paljon luotettavampi, koska se tarkastelee jokaisen yksittäisen datapisteen sijaintia. Se antaa käsityksen datan "tiheydestä", ei vain ulkorajoista.
Voiko kahdella eri tietojoukolla olla sama keskiarvo ja eri keskihajonnat?
Ehdottomasti, ja tätä tapahtuu koko ajan todellisessa maailmassa. Kuvittele kaksi kaupunkia, joiden keskilämpötila on 70 astetta. Toinen voi pysyä 68 ja 72 asteen välillä ympäri vuoden (pieni poikkeama), kun taas toinen vaihtelee 20 ja 120 asteen välillä (suuri poikkeama). Keskiarvo on sama, mutta eläminen on täysin erilainen.
Tarkoittaako pieni keskihajonta, että data on "tarkkaa"?
Ei välttämättä. Se tarkoittaa, että tiedot ovat "tarkkia" tai yhdenmukaisia. Sinulla voi olla vaaka, joka on rikki ja painaa aina tavarat 2,5 kiloa liikaa. Keskihajonta olisi pieni, koska tulokset ovat yhdenmukaisia, mutta keskiarvo olisi epätarkka todelliseen painoon verrattuna.
Kumpi on sijoittamisen kannalta tärkeämpi?
Sijoittajat käyttävät molempia, mutta he seuraavat usein keskihajontaa tarkemmin, koska se edustaa "riskiä". Keskiarvo kertoo odotetun tuoton, mutta keskihajonta kertoo, kuinka paljon tuotto voi vaihdella. Suuri poikkeama tarkoittaa kuoppaista matkaa, jossa on suurempi tilapäisten tappioiden mahdollisuus.
Miten poikkeavat arvot vaikuttavat näihin kahteen mittariin?
Poikkeavat arvot vetävät keskiarvoa puoleensa kuin magneetti. Keskihajonnan tapauksessa poikkeava arvo toimii vahvistimena. Koska etäisyys keskiarvosta korotetaan laskennassa neliöön, yksi kaukana oleva piste voi suurentaa keskihajontaa suhteettomasti, mikä viestii siitä, että aineisto on hyvin hajallaan.
Milloin minun pitäisi käyttää mediaania keskiarvon sijaan?
Sinun tulisi siirtyä mediaaniin, kun datasi on "vinoutunut" tai siinä on suuria poikkeamia, kuten asuntojen hinnat tai palkat. Näissä tapauksissa muutama miljardööri voi saada keskiarvon näyttämään paljon korkeammalta kuin mitä tyypillinen henkilö todellisuudessa ansaitsee. Mediaani on "vastustuskykyinen" näille ääripäille.
Mikä on 68-95-99,7-sääntö?
Tämä on kätevä normaalijakaumien sääntö. Sen mukaan 68 % datastasi sijoittuu yhden keskihajonnan sisälle keskiarvosta, 95 % kahden ja 99,7 % kolmen keskihajonnan sisälle. Se on tehokas tapa nähdä, kuinka "normaali" tai "outo" tietty datapiste todellisuudessa on.
Onko keskihajonta sama asia kuin varianssi?
Ne ovat läheistä sukua toisilleen, mutta eivät samoja. Varianssi on keskiarvosta neliöityjen erojen keskiarvo, mikä johtaa "neliöityihin yksiköihin" (kuten neliödollareihin), joita on vaikea visualisoida. Otamme varianssin neliöjuuren saadaksemme keskihajonnan, jotta yksiköt vastaavat jälleen alkuperäisiä tietojamme.

Tuomio

Valitse keskiarvo, kun tarvitset yhden edustavan luvun ryhmän kokonaistason yhteenvetoon. Käytä keskihajontaa, kun sinun on ymmärrettävä kyseisen keskiarvon luotettavuus tai otoksen monimuotoisuus.

Liittyvät vertailut

Absoluuttinen arvo vs. moduuli

Vaikka itseisarvoa käytetään usein synonyymeinä johdantomatematiikassa, se tyypillisesti viittaa reaaliluvun etäisyyteen nollasta, kun taas modulo laajentaa tätä käsitettä kompleksilukuihin ja vektoreihin. Molemmilla on sama perustavanlaatuinen tarkoitus: poistaa suuntamerkit matemaattisen olion puhtaan suuruuden paljastamiseksi.

Algebra vs. geometria

Algebra keskittyy abstrakteihin laskusääntöihin ja symbolien manipulointiin tuntemattomien ratkaisemiseksi, kun taas geometria tutkii avaruuden fysikaalisia ominaisuuksia, kuten kuvioiden kokoa, muotoa ja suhteellista sijaintia. Yhdessä ne muodostavat matematiikan perustan, joka kääntää loogiset suhteet visuaalisiksi rakenteiksi.

Alkuluvut verrattuna yhdistettyihin lukuihin.

Tämä vertailu selittää alkulukujen ja yhdistettyjen lukujen määritelmät, ominaisuudet, esimerkit ja erot. Nämä ovat kaksi perustavanlaatuista luonnollisten lukujen luokkaa. Se selventää, miten ne tunnistetaan, miten ne käyttäytyvät tekijöihin jaoteltaessa ja miksi niiden tunnistaminen on tärkeää peruslukuteoriassa.

Alkutekijöihin jakaminen vs. tekijäpuu

Alkulukujen tekijöihinjako on matemaattinen tavoite jakaa yhdistetty luku sen alkulukuihin, kun taas tekijäpuu on visuaalinen, haarautuva työkalu, jota käytetään tämän tuloksen saavuttamiseen. Toinen on lopullinen numeerinen lauseke, kun taas toinen on vaiheittainen tiekartta sen paljastamiseksi.

Aritmeettinen keskiarvo vs. painotettu keskiarvo

Aritmeettinen keskiarvo käsittelee jokaista datapistettä yhtäläisenä tekijänä lopullisessa keskiarvossa, kun taas painotettu keskiarvo antaa tietyt tärkeystasot eri arvoille. Tämän eron ymmärtäminen on ratkaisevan tärkeää kaikessa yksinkertaisten luokkakeskiarvojen laskemisesta monimutkaisten rahoitussalkkujen määrittämiseen, joissa joillakin omaisuuserillä on suurempi merkitys kuin toisilla.