Question 1

Vilken bör jag lära mig först inom datavetenskap?

Accepted Answer

Börja med sannolikhet. Det ger dig det "språk" och de fördelningar (som normalfördelningen) som du behöver för att förstå hur statistiska tester faktiskt fungerar. Utan sannolikhet kommer statistik bara att kännas som att memorera formler utan att veta varför de fungerar.

Question 2

Vad är skillnaden mellan en parameter och en statistik?

Accepted Answer

En parameter är ett sant värde som tillhör en hel population (som medellängden på varje människa på jorden). En statistik är ett värde som beräknas från ett urval (som medellängden på 100 personer du mätt). Vi använder statistiken för att uppskatta parametern.

Question 3

Är korträkning sannolikhet eller statistik i blackjack?

Accepted Answer

Det är faktiskt båda. Du använder statistik för att hålla reda på "data" (vilka kort som har spelats) och använder sedan sannolikhet för att beräkna de förändrade oddsen för den återstående kortleken. Det är en realtidsapplikation för att uppdatera en modell baserat på ny information.

Question 4

Hur hjälper sannolikhet vid väderprognoser?

Accepted Answer

Meteorologer kör tusentals simuleringar med aktuell data. Om 700 av 1 000 simuleringar visar regn, rapporterar de en sannolikhet på 70 %. "Statistik"-delen innebar att analysera årtionden av tidigare väder för att skapa dessa simuleringsmodeller från första början.

Question 5

Vad är 'inferens' inom statistik?

Accepted Answer

Inferens är handlingen att "slutleda" eller gissa egenskaperna hos en stor grupp baserat på en liten. Det är den bro som gör det möjligt för oss att göra breda påståenden om den allmänna opinionen eller medicinsk effektivitet utan att testa varje enskild person i ett land.

Question 6

Vad betyder sannolikheten 0?

Accepted Answer

I en ändlig mängd utfall innebär sannolikheten 0 att en händelse är omöjlig. I kontinuerlig matematik (som att välja ett specifikt exakt decimaltal mellan 0 och 1) kan dock sannolikheten 0 tekniskt sett inträffa, men vi kallar det "nästan omöjligt" i praktisk mening.

Question 7

Kan statistik användas för att ljuga?

Accepted Answer

Absolut. Genom att välja snedvridna urval, visualisera data med vilseledande skalor eller ignorera "felmarginalen" kan man få statistik att stödja nästan vilket påstående som helst. Det är därför det är lika viktigt att förstå metodiken bakom siffrorna som siffrorna själva.

Question 8

Varför är "normalfördelningen" så viktig i båda?

Accepted Answer

Klockkurvan (normalfördelning) är det vanligaste mönstret i naturen. Inom sannolikhetsmätningen beskriver den hur slumpmässiga variabler grupperas. Inom statistiken säger den centrala gränsvärdessatsen att ju fler stickprov vi tar, desto mer kommer våra data naturligt att bilda denna form, vilket möjliggör mycket kraftfulla förutsägelser.

Funktion	Sannolikhet	Statistik
Logikens riktning	Deduktiv (modell till data)	Induktiv (data till modell)
Primärt mål	Förutsäga framtida händelser	Förklara tidigare/nuvarande data
Kända enheter	Befolkningen och dess regler	Provet och dess mätningar
Okända enheter	Det specifika resultatet av en rättegång	Befolkningens verkliga egenskaper
Nyckelfråga	Vad är oddsen för att 'X' händer?	Vad säger 'X' oss om världen?
Beroende	Oberoende av datainsamling	Helt beroende av datakvalitet
Kärnverktyg	Stokastiska variabler och fördelningar	Urval och hypotesprövning

Sannolikhet kontra statistik

Höjdpunkter

Vad är Sannolikhet?

Vad är Statistik?

Jämförelsetabell

Detaljerad jämförelse

Informationsflödet

Säkerhet kontra uppskattning

Population kontra urval

Sammanflätad relation

För- och nackdelar

Sannolikhet

Fördelar

Håller med

Statistik

Fördelar

Håller med

Vanliga missuppfattningar

Vanliga frågor och svar

Utlåtande

Relaterade jämförelser

Absolutvärde vs. modul

Algebra kontra geometri

Ändlig vs. Oändlig

Aritmetisk vs geometrisk sekvens

Aritmetiskt medelvärde vs. viktat medelvärde