Question 1

Welches sollte ich im Bereich Data Science zuerst lernen?

Accepted Answer

Beginnen Sie mit der Wahrscheinlichkeitstheorie. Sie liefert die notwendige „Sprache“ und die Verteilungen (wie die Normalverteilung), um zu verstehen, wie statistische Tests funktionieren. Ohne Wahrscheinlichkeitstheorie fühlt sich Statistik nur wie das Auswendiglernen von Formeln an, ohne zu wissen, warum sie funktionieren.

Question 2

Worin besteht der Unterschied zwischen einem Parameter und einer Statistik?

Accepted Answer

Ein Parameter ist ein wahrer Wert, der für eine gesamte Population gilt (wie die durchschnittliche Körpergröße aller Menschen auf der Erde). Eine Statistik ist ein Wert, der aus einer Stichprobe berechnet wird (wie die durchschnittliche Körpergröße von 100 gemessenen Personen). Mithilfe der Statistik schätzen wir den Parameter.

Question 3

Ist Kartenzählen beim Blackjack Wahrscheinlichkeit oder Statistik?

Accepted Answer

Es ist tatsächlich beides. Man verwendet Statistiken, um die „Daten“ (welche Karten gespielt wurden) zu erfassen, und berechnet dann mithilfe von Wahrscheinlichkeitsrechnung die sich ändernden Gewinnchancen des verbleibenden Kartenstapels. Es handelt sich um eine Echtzeitanwendung zur Aktualisierung eines Modells auf Basis neuer Informationen.

Question 4

Wie hilft die Wahrscheinlichkeitsrechnung bei der Wettervorhersage?

Accepted Answer

Meteorologen führen Tausende von Simulationen mit aktuellen Daten durch. Wenn 700 von 1000 Simulationen Regen vorhersagen, geben sie eine Wahrscheinlichkeit von 70 % an. Die statistische Auswertung basierte auf der Analyse jahrzehntelanger Wetterdaten, um diese Simulationsmodelle überhaupt erst zu erstellen.

Question 5

Was versteht man unter „Inferenz“ in der Statistik?

Accepted Answer

Inferenz ist der Vorgang, anhand einer kleinen Gruppe auf die Merkmale einer großen Gruppe zu schließen oder sie zu erraten. Sie ermöglicht es uns, weitreichende Aussagen über die öffentliche Meinung oder die Wirksamkeit von Medikamenten zu treffen, ohne jede einzelne Person in einem Land testen zu müssen.

Question 6

Was bedeutet eine Wahrscheinlichkeit von 0?

Accepted Answer

Bei einer endlichen Menge an möglichen Ergebnissen bedeutet eine Wahrscheinlichkeit von 0, dass ein Ereignis unmöglich ist. In der kontinuierlichen Mathematik (wie etwa bei der Auswahl einer exakten Dezimalzahl zwischen 0 und 1) kann eine Wahrscheinlichkeit von 0 zwar theoretisch auftreten, in der Praxis bezeichnen wir dies jedoch als „nahezu unmöglich“.

Question 7

Kann man mit Statistiken lügen?

Accepted Answer

Absolut. Durch die Auswahl verzerrter Stichproben, die Visualisierung von Daten mit irreführenden Skalen oder das Ignorieren der Fehlermarge lassen sich Statistiken so manipulieren, dass sie nahezu jede Behauptung stützen. Deshalb ist das Verständnis der Methodik hinter den Zahlen genauso wichtig wie die Zahlen selbst.

Question 8

Warum ist die „Normalverteilung“ in beiden Fällen so wichtig?

Accepted Answer

Die Glockenkurve (Normalverteilung) ist das häufigste Verteilungsmuster in der Natur. In der Wahrscheinlichkeitstheorie beschreibt sie die Häufung von Zufallsvariablen. In der Statistik besagt der zentrale Grenzwertsatz, dass sich unsere Daten mit zunehmender Stichprobengröße dieser Form annähern, was sehr aussagekräftige Vorhersagen ermöglicht.

Funktion	Wahrscheinlichkeit	Statistiken
Richtung der Logik	Deduktiv (Modell zu Daten)	Induktiv (Daten zum Modell)
Hauptziel	Vorhersage zukünftiger Ereignisse	Erklärung vergangener/gegenwärtiger Daten
Bekannte Entitäten	Die Bevölkerung und ihre Regeln	Die Probe und ihre Messungen
Unbekannte Entitäten	Das konkrete Ergebnis eines Prozesses	Die wahren Merkmale der Bevölkerung
Schlüsselfrage	Wie hoch ist die Wahrscheinlichkeit, dass Ereignis „X“ eintritt?	Was sagt uns „X“ über die Welt?
Abhängigkeit	Unabhängig von der Datenerfassung	vollständig abhängig von der Datenqualität
Kernwerkzeug	Zufallsvariablen und Verteilungen	Stichprobenziehung und Hypothesentests

Wahrscheinlichkeit vs. Statistik

Höhepunkte

Was ist Wahrscheinlichkeit?

Was ist Statistiken?

Vergleichstabelle

Detaillierter Vergleich

Der Informationsfluss

Gewissheit vs. Schätzung

Population vs. Stichprobe

Verflochtene Beziehung

Vorteile & Nachteile

Wahrscheinlichkeit

Vorteile

Enthalten

Statistiken

Vorteile

Enthalten

Häufige Missverständnisse

Häufig gestellte Fragen

Urteil

Verwandte Vergleiche

Ableitung vs. Differential

Algebra vs Geometrie

Arithmetische vs. geometrische Folge

Arithmetisches Mittel vs. gewichtetes Mittel

Betrag vs. Modul