Tikimybė ir statistika
Tikimybė ir statistika yra tos pačios matematinės monetos dvi pusės, nagrinėjančios priešingų krypčių neapibrėžtumą. Nors tikimybė prognozuoja būsimų rezultatų tikimybę remdamasi žinomais modeliais, statistika analizuoja praeities duomenis, kad sukurtų arba patikrintų tuos modelius, efektyviai dirbdama atgal nuo stebėjimų, kad rastų pagrindinę tiesą.
Akcentai
- Tikimybė yra pamatas; statistika yra ant jo pastatytas pastatas.
- 0,5 tikimybė yra matematinis teiginys, o statistinis vidurkis – stebėjimas.
- Statistika apdoroja „triukšmą“ ir išskirtis, kurie grynojoje tikimybių teorijoje ignoruojami.
- Azartiniai lošimai remiasi tikimybe, o draudimo bendrovės – statistika.
Kas yra Tikimybė?
Matematinis atsitiktinumų tyrimas, kuris prognozuoja konkrečių įvykių tikimybę.
- Tai veikia kaip dedukcinis procesas, pereinantis nuo bendrų taisyklių prie konkrečių rezultatų.
- Skaičiavimai visada yra apriboti tarp 0 (neįmanoma) ir 1 (tikrumas).
- Daroma prielaida, kad „populiacijos“ arba sistemos parametrai jau žinomi.
- Dažniausiai naudojami tokie įrankiai kaip permutacijos, deriniai ir pasiskirstymo kreivės.
- Didelių skaičių dėsnis susieja teorinę tikimybę su realaus pasaulio rezultatais.
Kas yra Statistika?
Duomenų rinkimo, analizės ir interpretavimo mokslas, siekiant atrasti modelius ir tendencijas.
- Tai indukcinis procesas, pereinantis nuo konkrečių pastebėjimų prie bendrų išvadų.
- Dėmesys skiriamas nežinomų populiacijos parametrų įvertinimui naudojant mažesnę imtį.
- Apima paklaidų ribų ir duomenų patikimumo lygių apskaičiavimą.
- Skirstoma į dvi pagrindines šakas: aprašomąją ir išvadinę statistiką.
- Labai priklauso nuo duomenų valymo ir šališkumo pašalinimo, siekiant užtikrinti tikslumą.
Palyginimo lentelė
| Funkcija | Tikimybė | Statistika |
|---|---|---|
| Logikos kryptis | Dedukcinis (modelio į duomenis) | Indukcinis (duomenys modeliui) |
| Pagrindinis tikslas | Būsimų įvykių prognozavimas | Ankstesnių / dabartinių duomenų paaiškinimas |
| Žinomi subjektai | Populiacija ir jos taisyklės | Mėginys ir jo matavimai |
| Nežinomi subjektai | Konkretus teismo proceso rezultatas | Tikrosios gyventojų savybės |
| Pagrindinis klausimas | Kokia tikimybė, kad įvyks „X“? | Ką „X“ mums sako apie pasaulį? |
| Priklausomybė | Nepriklausomai nuo duomenų rinkimo | Visiškai priklauso nuo duomenų kokybės |
| Pagrindinis įrankis | Atsitiktiniai kintamieji ir skirstiniai | Imčių ėmimas ir hipotezių tikrinimas |
Išsamus palyginimas
Informacijos srautas
Įsivaizduokite tikimybę kaip „į ateitį orientuotą“ variklį, kai pradedate nuo kortų kaladės ir apskaičiuojate tikimybę ištraukti tūzą. Statistika yra „į praeitį orientuota“ sistema; jums įteikiama ištrauktų kortų krūvelė ir turite nustatyti, ar kaladė buvo suklastota, ar teisinga. Vienas pradeda nuo priežasties ir prognozuoja pasekmę, o kitas pradeda nuo pasekmės ir ieško priežasties.
Tikrumas ir įvertinimas
Tikimybė yra teorinis tikrumas; jei kauliukas teisingas, tikimybė, kad iškris šeši, yra matematiškai fiksuota. Tačiau statistika niekada nepretenduoja į 100 % tikrumą. Vietoj to, statistikai pateikia „pasitikėjimo intervalus“, pripažindami, kad nors jie ir tiki, jog tendencija egzistuoja, visada yra apskaičiuota paklaidos riba arba „p reikšmė“, kuri kiekybiškai įvertina jų tikimybę klysti.
Populiacija ir imtis
Tikimybių skaičiavime darome prielaidą, kad žinome viską apie visą grupę (populiaciją), pavyzdžiui, tiksliai žinome, kiek raudonų rutuliukų yra stiklainyje. Statistika naudojama, kai stiklainis yra neskaidrus ir per didelis, kad būtų galima suskaičiuoti. Ištraukiame saują (imtį), apžiūrime juos ir, naudodami šią ribotą informaciją, galime pagrįstai spėti apie kiekvieną rutuliuką stiklainyje.
Susipynę santykiai
Šiuolaikinė statistika neįsivaizduojama be tikimybių teorijos. Statistiniai testai, pavyzdžiui, nustatant, ar naujas vaistas veikia geriau nei placebas, remiasi tikimybių skirstiniais, siekiant išsiaiškinti, ar stebimi rezultatai galėjo būti gauti atsitiktinai. Tikimybė suteikia teorinį pagrindą, o statistika – praktinį pritaikymą.
Privalumai ir trūkumai
Tikimybė
Privalumai
- +Labai tiksli matematika
- +Absoliučios teorinės taisyklės
- +Esminis dirbtinio intelekto logikai
- +Aiškiai apskaičiuoja riziką
Pasirinkta
- −Reikalingi žinomi įėjimai
- −Gali būti pernelyg abstraktus
- −Jautrus prielaidoms
- −Neatsižvelgia į šališkumą
Statistika
Privalumai
- +Naudoja realaus pasaulio įrodymus
- +Nustato paslėptas tendencijas
- +Ištaiso klaidas
- +Informuoja apie politinius sprendimus
Pasirinkta
- −Atvira interpretacijai
- −Koreliacija nėra priežastinis ryšys
- −Lengvai manipuliuojama
- −Reikalingi dideli duomenų rinkiniai
Dažni klaidingi įsitikinimai
Tikimybė ir statistika yra tiesiog skirtingi to paties dalyko pavadinimai.
Tai skirtingos disciplinos. Nors abi jos nagrinėja atsitiktinumus, tikimybė yra teorinės matematikos šaka, o statistika – taikomasis mokslas, orientuotas į duomenų interpretavimą.
„Statistinis reikšmingumas“ reiškia, kad kažkas yra 100 % įrodyta.
Statistikoje niekas nėra „įrodyta“ absoliučia prasme. Tai tiesiog reiškia, kad rezultatas labai mažai tikėtinas atsitiktinumas, paprastai esant 5 % ar 1 % tikimybei, kad tai atsitiktinumas.
„Vidutinybių dėsnis“ reiškia, kad pergalė „priklauso“ po ilgos pralaimėjimų serijos.
Tai lošėjo klaida. Tikimybių teorija teigia, kad kiekvienas nepriklausomas įvykis (pvz., monetos metimas) neturi ankstesnio įvykio atminties; tikimybė išlieka ta pati, nepriklausomai nuo to, kas įvyko anksčiau.
Daugiau duomenų visada veda prie geresnės statistikos.
Kiekybė kokybės nenustato. Jei duomenys yra šališki arba imtis nėra reprezentatyvi, didesnis duomenų rinkinys tiesiog leis padaryti „patikimesnę“, bet neteisingą išvadą.
Dažnai užduodami klausimai
Kurį duomenų mokslą turėčiau išmokti pirmiausia?
Kuo skiriasi parametras ir statistika?
Ar kortų skaičiavimas yra Blackjack tikimybė, ar statistika?
Kaip tikimybė padeda prognozuoti orus?
Kas yra „išvada“ statistikoje?
Ką reiškia tikimybė, lygi 0?
Ar statistika gali būti naudojama melui?
Kodėl „normalus skirstinys“ yra toks svarbus abiejuose?
Nuosprendis
Tikimybių teoriją naudokite, kai žinote žaidimo taisykles ir norite nuspėti, kas nutiks toliau. Statistikos teoriją naudokite, kai turite daug duomenų ir jums reikia išsiaiškinti, kokios iš tikrųjų yra tos paslėptos taisyklės.
Susiję palyginimai
Absoliuti vertė ir modulis
Nors įvadinėje matematikoje absoliuti vertė dažnai vartojama kaip sinonimas, ji paprastai reiškia realaus skaičiaus atstumą nuo nulio, o modulis šią sąvoką praplečia iki kompleksinių skaičių ir vektorių. Abu šie terminai atlieka tą pačią pagrindinę funkciją: pašalina krypties ženklus, kad būtų atskleistas grynasis matematinio objekto dydis.
Algebra ir geometrija
Nors algebra daugiausia dėmesio skiria abstrakčioms operacijų taisyklėms ir simbolių manipuliavimui sprendžiant nežinomuosius, geometrija tyrinėja erdvės fizines savybes, įskaitant figūrų dydį, formą ir santykinę padėtį. Kartu jie sudaro matematikos pagrindą, loginius ryšius paversdami vaizdinėmis struktūromis.
Apskritimas ir elipsė
Nors apskritimas apibrėžiamas vienu centriniu tašku ir pastoviu spinduliu, elipsė išplečia šią koncepciją iki dviejų židinio taškų, sukurdama pailgą formą, kurioje atstumų iki šių židinių suma išlieka pastovi. Kiekvienas apskritimas techniškai yra specialus elipsės tipas, kuriame du židiniai idealiai persidengia, todėl koordinačių geometrijoje jie yra labiausiai susijusios figūros.
Aritmetinė ir geometrinė seka
Iš esmės aritmetinės ir geometrinės sekos yra du skirtingi būdai didinti arba mažinti skaičių sąrašą. Aritmetinė seka kinta pastoviu, tiesiniu tempu atliekant sudėtį arba atimtį, o geometrinė seka greitėja arba lėtėja eksponentiškai atliekant daugybą arba dalybą.
Aritmetinis vidurkis ir svertinis vidurkis
Aritmetinis vidurkis kiekvieną duomenų tašką traktuoja kaip vienodai svarbų galutiniam vidurkiui, o svertinis vidurkis priskiria tam tikrus svarbos lygius skirtingoms reikšmėms. Šio skirtumo supratimas yra labai svarbus viskam – nuo paprastų klasių vidurkių skaičiavimo iki sudėtingų finansinių portfelių, kur vieni aktyvai yra svarbesni nei kiti, nustatymo.