Hoewel beide fundamentele pijlers van de statistiek vormen, beschrijven ze compleet verschillende kenmerken van een dataset. Het gemiddelde geeft het centrale evenwichtspunt of de gemiddelde waarde aan, terwijl de standaarddeviatie meet hoeveel individuele datapunten van dat centrum afwijken, wat cruciale context biedt met betrekking tot de consistentie of volatiliteit van de informatie.
Uitgelicht
Het gemiddelde geeft aan 'wat' er is, terwijl de standaardafwijking aangeeft 'hoeveel' er is met betrekking tot de variatie.
Het gemiddelde kan identiek zijn voor twee groepen die er visueel totaal verschillend uitzien.
De standaarddeviatie is in feite de gemiddelde afstand van elk punt tot het gemiddelde.
Zonder beide cijfers is een statistische samenvatting vaak onvolledig of zelfs misleidend.
Wat is Gemeen?
Het rekenkundig gemiddelde van een dataset, berekend door alle waarden op te tellen en te delen door het totale aantal.
Het fungeert als het geometrische middelpunt of 'evenwichtspunt' van een numerieke verdeling.
De berekening omvat elke afzonderlijke waarde binnen de specifieke dataset.
Uitschieters of extreme waarden kunnen het resultaat aanzienlijk afwijken van de meerderheid van de gegevens.
In een perfect symmetrische klokvormige curve ligt het precies op één lijn met de mediaan en de modus.
Statistici duiden de populatieversie aan met de Griekse letter mu (μ).
Wat is Standaardafwijking?
Een meetwaarde die de mate van variatie of spreiding binnen een reeks gegevenswaarden kwantificeert.
Lage waarden geven aan dat de datapunten zeer dicht bij het berekende gemiddelde liggen.
Het wordt uitgedrukt in dezelfde fysische eenheden als de oorspronkelijke meetgegevens.
De waarde wordt verkregen door de vierkantswortel van de variantie te nemen.
Hoge waarden duiden op een grote spreiding, wat wijst op een lagere voorspelbaarheid van de gegevens.
De Griekse letter sigma (σ) is het standaardsymbool voor populatieafwijkingen.
Vergelijkingstabel
Functie
Gemeen
Standaardafwijking
Hoofddoel
Zoek het middelpunt
Meet de spreiding
Gevoeligheid voor uitschieters
Hoog (kan gemakkelijk scheefgetrokken worden)
Hoog (extreme waarden verhogen de waarde)
Wiskundig symbool
μ (Mu) of x̄ (x-streepje)
σ (Sigma) of s
Meeteenheden
Hetzelfde als gegevens
Hetzelfde als gegevens
Resultaat van nul
Het gemiddelde is nul.
Alle gegevenspunten zijn identiek.
Belangrijkste toepassing
Het bepalen van de algemene prestaties
Risico- en consistentiebeoordeling
Gedetailleerde vergelijking
Centraliteit versus spreiding
Het gemiddelde geeft aan waar het 'midden' van uw gegevens zich bevindt en biedt een snel overzicht van het algemene niveau. De standaarddeviatie daarentegen negeert de locatie van het centrum en richt zich volledig op de verschillen tussen de getallen. U kunt bijvoorbeeld twee groepen hebben met een identiek gemiddelde van 50, maar als de ene groep varieert van 49 tot 51 en de andere van 0 tot 100, is de standaarddeviatie het enige instrument dat dit enorme verschil in betrouwbaarheid aan het licht brengt.
Gevoeligheid voor extreme waarden
Beide meetmethoden worden beïnvloed door uitschieters, maar ze reageren er op verschillende manieren op. Een uitzonderlijk hoog getal zal het gemiddelde omhoog trekken, waardoor mogelijk een misleidend beeld ontstaat van de 'typische' ervaring. Diezelfde uitschieter zorgt ervoor dat de standaarddeviatie omhoogschiet, wat de onderzoeker erop wijst dat de data ruis bevat en het gemiddelde mogelijk geen betrouwbare representatie is van de hele groep.
De rol in de normale verdeling
Bij het bekijken van een klokvormige curve werken deze twee samen om de vorm te bepalen. Het gemiddelde bepaalt waar de piek van de curve zich op de horizontale as bevindt. De standaardafwijking bepaalt de breedte; een kleine afwijking creëert een hoge, smalle piek, terwijl een grote afwijking de curve uitrekt tot een korte, brede heuvel. Samen stellen ze ons in staat te voorspellen dat ongeveer 68% van de gegevens binnen één 'stap' van het midden valt.
Praktische besluitvorming
In de praktijk wordt het gemiddelde vaak gebruikt voor het vaststellen van doelen, zoals een streefdoel voor de gemiddelde omzet. Professionals gebruiken de standaardafwijking echter om risico's te beheersen. Een forens zou bijvoorbeeld een busroute kunnen kiezen met een iets langere gemiddelde reistijd als deze een zeer lage standaardafwijking heeft, omdat dit garandeert dat hij of zij elke dag op tijd aankomt in plaats van te maken te krijgen met onvoorspelbare schommelingen.
Voors en tegens
Gemeen
Voordelen
+Eenvoudig te berekenen
+Zeer intuïtief
+Gebruikt alle gegevens
+Handig voor vergelijkingen.
Gebruikt
−Gevoelig voor uitschieters
−Misleidend door vertekende gegevens
−Kan een niet-bestaande waarde zijn
−Verbergt interne diversiteit
Standaardafwijking
Voordelen
+Toont de betrouwbaarheid van de gegevens aan
+Behoudt originele eenheden
+Cruciaal voor waarschijnlijkheid
+Identificeert volatiliteit
Gebruikt
−Handmatig lastiger te berekenen
−Betekenisloos zonder het gemiddelde
−Beïnvloed door extreme omstandigheden
−Vereist grote monsters.
Veelvoorkomende misvattingen
Mythe
Een gemiddelde van 80 betekent dat de meeste mensen een score van 80 hebben behaald.
Realiteit
Het gemiddelde is slechts een evenwichtspunt; het is mogelijk dat niemand daadwerkelijk een 80 heeft gescoord als de gegevens verdeeld zijn over zeer hoge en zeer lage waarden.
Mythe
De standaardafwijking kan een negatief getal zijn.
Realiteit
Omdat de formule het kwadrateren van de verschillen ten opzichte van het gemiddelde inhoudt, is het resultaat altijd nul of positief. Een negatieve waarde is wiskundig onmogelijk.
Mythe
Een hoge standaarddeviatie is altijd een 'slecht' teken.
Realiteit
Het duidt simpelweg op variatie. In een klaslokaal is een grote standaardafwijking in interesses geweldig, ook al kan het stressvol zijn voor een fabrikant die identieke bouten probeert te produceren.
Mythe
Je kunt de standaarddeviatie berekenen zonder het gemiddelde te weten.
Realiteit
Het gemiddelde is een essentieel onderdeel van de formule. Je moet eerst weten waar het middelpunt ligt voordat je kunt meten hoe ver alles ervan verwijderd is.
Veelgestelde vragen
Waarom gebruiken we de standaarddeviatie in plaats van alleen de spreiding?
Het bereik kijkt alleen naar de twee meest extreme waarden, wat misleidend kan zijn als het slechts toevallige uitschieters zijn. De standaarddeviatie is veel robuuster omdat deze kijkt naar de positie van elk afzonderlijk datapunt. Het geeft je een idee van de 'dichtheid' van de data, niet alleen van de uiterste grenzen.
Kunnen twee verschillende datasets hetzelfde gemiddelde en verschillende standaarddeviaties hebben?
Absoluut, en dit gebeurt voortdurend in de echte wereld. Stel je twee steden voor met een gemiddelde temperatuur van 21 graden Celsius. In de ene stad blijft de temperatuur het hele jaar door tussen de 20 en 22 graden (lage afwijking), terwijl in de andere de temperatuur schommelt tussen de 20 en 120 graden (hoge afwijking). Het gemiddelde is hetzelfde, maar de leefervaring is totaal anders.
Betekent een lage standaarddeviatie dat de gegevens 'nauwkeurig' zijn?
Niet per se. Het betekent dat de gegevens 'precies' of consistent zijn. Je zou een kapotte weegschaal kunnen hebben die altijd 5 pond te zwaar weegt. De standaardafwijking zou laag zijn omdat de resultaten consistent zijn, maar het gemiddelde zou onnauwkeurig zijn in vergelijking met het werkelijke gewicht.
Welke van de twee is belangrijker voor investeringen?
Beleggers gebruiken beide, maar ze letten vaak meer op de standaarddeviatie omdat die 'risico' vertegenwoordigt. Het gemiddelde geeft het verwachte rendement weer, terwijl de standaarddeviatie aangeeft hoeveel dat rendement kan fluctueren. Een hoge standaarddeviatie betekent een grillige rit met een grotere kans op tijdelijke verliezen.
Welke invloed hebben uitschieters op deze twee meetwaarden?
Uitschieters werken als een magneet voor het gemiddelde, waardoor het naar zich toegetrokken wordt. Voor de standaarddeviatie werkt een uitschieter als een versterker. Omdat de afstand tot het gemiddelde in de berekening gekwadrateerd wordt, kan een enkel ver verwijderd punt de standaarddeviatie onevenredig verhogen, wat aangeeft dat de dataset sterk gespreid is.
Wanneer moet ik de mediaan in plaats van het gemiddelde gebruiken?
Je moet overschakelen naar de mediaan wanneer je gegevens 'scheef' zijn of grote uitschieters bevatten, zoals huizenprijzen of salarissen. In deze gevallen kunnen een paar miljardairs ervoor zorgen dat het gemiddelde veel hoger lijkt dan wat een doorsnee persoon daadwerkelijk verdient. De mediaan is 'ongevoelig' voor deze extremen.
Wat is de 68-95-99,7 regel?
Dit is een handige vuistregel voor normale verdelingen. Hij stelt dat 68% van je gegevens binnen één standaarddeviatie van het gemiddelde valt, 95% binnen twee en 99,7% binnen drie. Het is een krachtige manier om te zien hoe 'normaal' of 'afwijkend' een specifiek datapunt daadwerkelijk is.
Is de standaarddeviatie hetzelfde als de variantie?
Ze zijn nauw verwant, maar niet hetzelfde. Variantie is het gemiddelde van de kwadratische verschillen ten opzichte van het gemiddelde, wat resulteert in 'gekwadrateerde eenheden' (zoals vierkante dollars), die moeilijk te visualiseren zijn. We nemen de wortel van de variantie om de standaarddeviatie te verkrijgen, zodat de eenheden weer overeenkomen met onze oorspronkelijke gegevens.
Oordeel
Kies het gemiddelde wanneer je een enkel representatief getal nodig hebt om het algemene niveau van een groep samen te vatten. Gebruik de standaardafwijking wanneer je de betrouwbaarheid van dat gemiddelde of de spreiding binnen je steekproef wilt begrijpen.