Obwohl beide als grundlegende Säulen der Statistik dienen, beschreiben sie völlig unterschiedliche Eigenschaften eines Datensatzes. Der Mittelwert gibt den zentralen Wert oder Durchschnittswert an, während die Standardabweichung misst, wie stark die einzelnen Datenpunkte von diesem Mittelwert abweichen, und somit wichtige Informationen über die Konsistenz oder Volatilität der Daten liefert.
Höhepunkte
Der Mittelwert gibt an, „was“ vorliegt, während die Standardabweichung angibt, „wie groß“ die Variation ist.
Der Mittelwert kann für zwei Gruppen identisch sein, die optisch völlig unterschiedlich aussehen.
Die Standardabweichung ist im Wesentlichen der durchschnittliche Abstand jedes Punktes vom Mittelwert.
Ohne beide Zahlen ist eine statistische Zusammenfassung oft unvollständig oder sogar irreführend.
Was ist Bedeuten?
Der arithmetische Mittelwert eines Datensatzes, berechnet durch die Summe aller Werte und anschließende Division durch die Gesamtzahl.
Es fungiert als geometrischer Mittelpunkt oder „Gleichgewichtspunkt“ einer numerischen Verteilung.
Die Berechnung berücksichtigt jeden einzelnen Wert innerhalb des jeweiligen Datensatzes.
Ausreißer oder Extremwerte können das Ergebnis erheblich von der Mehrheit der Daten abweichen lassen.
Bei einer perfekt symmetrischen Glockenkurve stimmt sie genau mit dem Median und dem Modalwert überein.
Statistiker bezeichnen die Populationsgröße mit dem griechischen Buchstaben Mu (μ).
Was ist Standardabweichung?
Eine Kennzahl, die das Ausmaß der Variation oder Streuung innerhalb einer Reihe von Datenwerten quantifiziert.
Niedrige Werte bedeuten, dass die Datenpunkte sehr nahe am berechneten Mittelwert liegen.
Sie wird in denselben physikalischen Einheiten ausgedrückt wie die ursprünglich gemessenen Daten.
Der Wert wird durch Ziehen der Quadratwurzel aus der Varianz ermittelt.
Hohe Werte deuten auf eine große Streuung hin, was auf eine geringere Vorhersagbarkeit der Daten schließen lässt.
Der griechische Buchstabe Sigma (σ) ist das Standardsymbol für die Populationsabweichung.
Vergleichstabelle
Funktion
Bedeuten
Standardabweichung
Hauptzweck
Finde das Zentrum
Messen Sie die Ausbreitung
Empfindlichkeit gegenüber Ausreißern
Hoch (kann leicht verzerrt werden)
Hoch (Extreme erhöhen den Wert)
Mathematisches Symbol
μ (Mu) oder x̄ (x-bar)
σ (Sigma) oder s
Maßeinheiten
Gleiches wie Daten
Gleiches wie Daten
Ergebnis Null
Der Durchschnitt ist null.
Alle Datenpunkte sind identisch
Hauptanwendung
Ermittlung der allgemeinen Leistung
Risikobewertung und Konsistenzprüfung
Detaillierter Vergleich
Zentralität vs. Dispersion
Der Mittelwert zeigt Ihnen, wo der „Mittelwert“ Ihrer Daten liegt und liefert so eine schnelle Momentaufnahme des allgemeinen Niveaus. Die Standardabweichung hingegen ignoriert die Lage des Mittelwerts und konzentriert sich ausschließlich auf die Streuung der Werte. Beispielsweise könnten zwei Gruppen einen identischen Mittelwert von 50 haben, aber wenn die Werte der einen Gruppe zwischen 49 und 51 und die der anderen zwischen 0 und 100 liegen, ist die Standardabweichung das einzige Instrument, das diesen enormen Unterschied in der Zuverlässigkeit aufzeigt.
Empfindlichkeit gegenüber Extremwerten
Beide Kennzahlen reagieren empfindlich auf Ausreißer, jedoch unterschiedlich. Ein außergewöhnlich hoher Wert treibt den Mittelwert nach oben und kann so ein irreführendes Bild der „typischen“ Erfahrung zeichnen. Derselbe Ausreißer lässt die Standardabweichung sprunghaft ansteigen und signalisiert dem Forscher, dass die Daten verrauscht sind und der Mittelwert möglicherweise nicht repräsentativ für die gesamte Gruppe ist.
Die Rolle in der Normalverteilung
Bei der Betrachtung einer Glockenkurve bestimmen diese beiden Größen gemeinsam deren Form. Der Mittelwert legt fest, wo der Scheitelpunkt der Kurve auf der horizontalen Achse liegt. Die Standardabweichung bestimmt die Breite: Eine kleine Abweichung erzeugt einen hohen, schmalen Ausläufer, während eine große Abweichung die Kurve zu einem kurzen, breiten Hügel verformt. Zusammen ermöglichen sie die Vorhersage, dass etwa 68 % der Daten innerhalb einer Schrittweite vom Mittelwert liegen.
Praktische Entscheidungsfindung
In der Praxis wird der Mittelwert häufig für Zielvorgaben wie einen angestrebten durchschnittlichen Umsatz verwendet. Fachleute nutzen hingegen die Standardabweichung zur Risikobewertung. Ein Pendler könnte beispielsweise eine Buslinie mit etwas längerer durchschnittlicher Fahrzeit wählen, wenn diese eine sehr geringe Standardabweichung aufweist. So ist ihm garantiert, dass er jeden Tag pünktlich ankommt und nicht mit unvorhersehbaren Schwankungen rechnen muss.
Vorteile & Nachteile
Bedeuten
Vorteile
+Einfach zu berechnen
+Sehr intuitiv
+Nutzt alle Daten
+Gut geeignet für Vergleiche
Enthalten
−Anfällig für Ausreißer
−Irreführende, verzerrte Daten
−Kann ein nicht existierender Wert sein.
−Verbirgt die interne Vielfalt
Standardabweichung
Vorteile
+Zeigt die Datenzuverlässigkeit
+Behält die Originaleinheiten bei
+Entscheidend für die Wahrscheinlichkeit
+Erkennt Volatilität
Enthalten
−Manuell schwieriger zu berechnen
−Ohne den Mittelwert ist es bedeutungslos.
−Von Extremen betroffen
−Erfordert große Proben
Häufige Missverständnisse
Mythos
Ein Mittelwert von 80 bedeutet, dass die meisten Teilnehmer 80 Punkte erzielt haben.
Realität
Der Mittelwert stellt lediglich einen Gleichgewichtspunkt dar; es ist durchaus möglich, dass niemand tatsächlich eine 80 erreicht hat, wenn die Daten zwischen sehr hohen und sehr niedrigen Werten aufgeteilt sind.
Mythos
Die Standardabweichung kann eine negative Zahl sein.
Realität
Da die Formel das Quadrieren der Abweichungen vom Mittelwert beinhaltet, ist das Ergebnis immer null oder positiv. Ein negativer Wert ist mathematisch unmöglich.
Mythos
Eine hohe Standardabweichung ist immer etwas Schlechtes.
Realität
Es zeigt einfach Vielfalt an. In einer Schulklasse ist eine hohe Streuung der Interessen von Vorteil, auch wenn es für einen Hersteller, der identische Schrauben produzieren will, stressig sein mag.
Mythos
Die Standardabweichung kann man berechnen, ohne den Mittelwert zu kennen.
Realität
Der Mittelwert ist eine notwendige Zutat in der Formel. Man muss zuerst wissen, wo der Mittelpunkt liegt, bevor man messen kann, wie weit alles davon entfernt ist.
Häufig gestellte Fragen
Warum verwenden wir die Standardabweichung anstelle der Spannweite?
Die Spannweite betrachtet lediglich die beiden Extremwerte, was irreführend sein kann, wenn es sich nur um zufällige Ausreißer handelt. Die Standardabweichung ist wesentlich robuster, da sie die Lage jedes einzelnen Datenpunkts berücksichtigt. Sie vermittelt ein Gefühl für die Dichte der Daten und nicht nur für deren äußere Grenzen.
Können zwei verschiedene Datensätze den gleichen Mittelwert, aber unterschiedliche Standardabweichungen aufweisen?
Absolut, und das passiert ständig in der Realität. Stellen Sie sich zwei Städte mit einer Durchschnittstemperatur von 70 Grad vor. In der einen liegt die Temperatur das ganze Jahr über zwischen 68 und 72 Grad (geringe Abweichung), während sie in der anderen zwischen 20 und 120 Grad schwankt (hohe Abweichung). Der Mittelwert ist derselbe, aber das Lebensgefühl ist völlig unterschiedlich.
Bedeutet eine niedrige Standardabweichung, dass die Daten „genau“ sind?
Nicht unbedingt. Es bedeutet, dass die Daten „präzise“ oder konsistent sind. Man könnte eine defekte Waage haben, die immer 2,5 kg zu viel anzeigt. Die Standardabweichung wäre niedrig, weil die Ergebnisse konsistent sind, aber der Mittelwert wäre im Vergleich zum tatsächlichen Gewicht ungenau.
Welche ist für Investitionen wichtiger?
Anleger nutzen beides, achten aber oft genauer auf die Standardabweichung, da diese das Risiko widerspiegelt. Der Mittelwert gibt die erwartete Rendite an, die Standardabweichung hingegen zeigt, wie stark diese Rendite schwanken kann. Eine hohe Abweichung bedeutet einen volatileren Markt mit einem höheren Risiko vorübergehender Verluste.
Wie wirken sich Ausreißer auf diese beiden Kennzahlen aus?
Ausreißer wirken wie ein Magnet auf den Mittelwert und ziehen ihn zu sich hin. Bei der Standardabweichung verstärkt ein Ausreißer diesen Effekt. Da der Abstand vom Mittelwert in die Berechnung einfließt, kann ein einzelner, weit entfernter Wert die Standardabweichung unverhältnismäßig stark erhöhen und somit auf eine hohe Streuung der Daten hinweisen.
Wann sollte ich den Median anstelle des Mittelwerts verwenden?
Sie sollten den Median verwenden, wenn Ihre Daten schief verteilt sind oder massive Ausreißer aufweisen, wie beispielsweise bei Immobilienpreisen oder Gehältern. In solchen Fällen kann der Durchschnittswert durch einige wenige Milliardäre deutlich höher erscheinen, als er tatsächlich von einer typischen Person verdient wird. Der Median ist gegenüber solchen Extremen „resistent“.
Was besagt die 68-95-99,7-Regel?
Dies ist eine praktische Regel für Normalverteilungen. Sie besagt, dass 68 % Ihrer Daten innerhalb einer Standardabweichung vom Mittelwert liegen, 95 % innerhalb von zwei und 99,7 % innerhalb von drei. Sie ist eine aussagekräftige Methode, um zu erkennen, wie „normal“ oder „aus der Reihe tanzt“ ein bestimmter Datenpunkt tatsächlich ist.
Ist die Standardabweichung dasselbe wie die Varianz?
Sie sind eng verwandt, aber nicht identisch. Die Varianz ist der Durchschnitt der quadrierten Abweichungen vom Mittelwert, was zu „quadratischen Einheiten“ (wie Quadratdollar) führt, die schwer vorstellbar sind. Wir ziehen die Quadratwurzel aus der Varianz, um die Standardabweichung zu erhalten, sodass die Einheiten wieder unseren ursprünglichen Daten entsprechen.
Urteil
Wählen Sie den Mittelwert, wenn Sie eine einzelne repräsentative Zahl benötigen, um das Gesamtniveau einer Gruppe zusammenzufassen. Verwenden Sie die Standardabweichung, wenn Sie die Zuverlässigkeit dieses Mittelwerts oder die Streuung innerhalb Ihrer Stichprobe verstehen möchten.