Question 1

Hvilken skal jeg lære først inden for datalogi?

Accepted Answer

Start med sandsynlighed. Det giver dig det 'sprog' og de fordelinger (som normalfordelingen), som du skal bruge for at forstå, hvordan statistiske tests rent faktisk fungerer. Uden sandsynlighed vil statistik bare føles som at lære formler udenad uden at vide, hvorfor de fungerer.

Question 2

Hvad er forskellen mellem en parameter og en statistik?

Accepted Answer

En parameter er en sand værdi, der tilhører en hel population (som den gennemsnitlige højde af alle mennesker på Jorden). En statistik er en værdi beregnet ud fra en stikprøve (som den gennemsnitlige højde af 100 personer, du har målt). Vi bruger statistikken til at estimere parameteren.

Question 3

Er korttælling i blackjack sandsynlighed eller statistik?

Accepted Answer

Det er faktisk begge dele. Du bruger statistik til at holde styr på 'dataene' (hvilke kort der er blevet spillet) og bruger derefter sandsynlighed til at beregne de ændrede odds for det resterende sæt kort. Det er en realtidsapplikation til at opdatere en model baseret på ny information.

Question 4

Hvordan hjælper sandsynlighed i vejrudsigter?

Accepted Answer

Meteorologer kører tusindvis af simuleringer ved hjælp af aktuelle data. Hvis 700 ud af 1.000 simuleringer viser regn, rapporterer de en sandsynlighed på 70%. 'Statistik'-delen involverede analyse af årtiers tidligere vejr for at skabe disse simuleringsmodeller i første omgang.

Question 5

Hvad er 'inferens' i statistik?

Accepted Answer

Inferens er handlingen at 'udlede' eller gætte karakteristikaene ved en stor gruppe baseret på en lille gruppe. Det er den bro, der giver os mulighed for at fremsætte brede påstande om den offentlige mening eller medicinsk effektivitet uden at teste hver eneste person i et land.

Question 6

Hvad betyder en sandsynlighed på 0?

Accepted Answer

I et endeligt sæt af udfald betyder en sandsynlighed på 0, at en begivenhed er umulig. I kontinuert matematik (som at vælge et specifikt præcist decimaltal mellem 0 og 1) kan en sandsynlighed på 0 teknisk set forekomme, men vi kalder det 'næsten umuligt' i praktisk forstand.

Question 7

Kan statistik bruges til at lyve?

Accepted Answer

Absolut. Ved at vælge forudindtagede stikprøver, visualisere data med vildledende skalaer eller ignorere 'fejlmarginen' kan man få statistikker til at understøtte næsten enhver påstand. Derfor er det lige så vigtigt at forstå metodologien bag tallene som tallene selv.

Question 8

Hvorfor er 'normalfordelingen' så vigtig i begge?

Accepted Answer

Klokkekurven (normalfordeling) er det mest almindelige mønster i naturen. Inden for sandsynlighed beskriver den, hvordan stokastiske variabler grupperes. Inden for statistik fortæller den centrale grænseværdisætning os, at når vi tager flere stikprøver, vil vores data naturligt danne denne form, hvilket giver mulighed for meget kraftfulde forudsigelser.

Funktion	Sandsynlighed	Statistik
Logikkens retning	Deduktiv (model til data)	Induktiv (data til model)
Primært mål	Forudsigelse af fremtidige begivenheder	Forklaring af tidligere/nuværende data
Kendte enheder	Befolkningen og dens regler	Prøven og dens målinger
Ukendte enheder	Det specifikke resultat af en retssag	Befolkningens sande karakteristika
Nøglespørgsmål	Hvad er oddsene for, at 'X' sker?	Hvad fortæller 'X' os om verden?
Afhængighed	Uafhængig af dataindsamling	Helt afhængig af datakvalitet
Kerneværktøj	Stokastiske variabler og fordelinger	Stikprøveudtagning og hypotesetestning

Sandsynlighed vs. Statistik

Højdepunkter

Hvad er Sandsynlighed?

Hvad er Statistik?

Sammenligningstabel

Detaljeret sammenligning

Informationsstrømmen

Sikkerhed vs. estimering

Population vs. stikprøve

Sammenflettet forhold

Fordele og ulemper

Sandsynlighed

Fordele

Indstillinger

Statistik

Fordele

Indstillinger

Almindelige misforståelser

Ofte stillede spørgsmål

Dommen

Relaterede sammenligninger

Absolut værdi vs. modul

Algebra vs. geometri

Aritmetisk middelværdi vs. vægtet middelværdi

Aritmetisk vs. geometrisk sekvens

Cirkel vs. Ellipse