shkencë të dhënashteoria e matematikësanalizateoria e probabilitetit
Probabiliteti kundrejt Statistikës
Probabiliteti dhe statistika janë dy anët e së njëjtës medalje matematikore, të cilat merren me pasigurinë nga drejtime të kundërta. Ndërsa probabiliteti parashikon gjasat e rezultateve të ardhshme bazuar në modele të njohura, statistikat analizojnë të dhënat e kaluara për të ndërtuar ose verifikuar ato modele, duke punuar në mënyrë efektive prapa nga vëzhgimet për të gjetur të vërtetën themelore.
Theksa
Probabiliteti është themeli; statistika është ndërtesa e ndërtuar mbi të.
Një probabilitet prej 0.5 është një pohim matematik, ndërsa një mesatare statistikore është një vëzhgim.
Statistikat trajtojnë 'zhurmën' dhe vlerat e jashtëzakonshme, të cilat injorohen në teorinë e pastër të probabilitetit.
Lojërat e fatit mbështeten te probabiliteti, ndërsa kompanitë e sigurimeve mbështeten te statistikat.
Çfarë është Probabiliteti?
Studimi matematik i rastësisë që parashikon shanset e ndodhjes së ngjarjeve specifike.
Funksionon si një proces deduktiv, duke kaluar nga rregullat e përgjithshme në rezultate specifike.
Llogaritjet janë gjithmonë të kufizuara midis 0 (e pamundur) dhe 1 (siguri).
Supozon se parametrat e 'popullatës' ose sistemit janë tashmë të njohur.
Zakonisht përdor mjete si permutacione, kombinime dhe kurba shpërndarjeje.
Ligji i Numrave të Mëdhenj lidh probabilitetin teorik me rezultatet e botës reale.
Çfarë është Statistikat?
Shkenca e mbledhjes, analizimit dhe interpretimit të të dhënave për të zbuluar modele dhe trende.
Është një proces induktiv, që kalon nga vëzhgime specifike në përfundime të përgjithshme.
Përqendrohet në vlerësimin e parametrave të panjohur të popullsisë duke përdorur një mostër më të vogël.
Përfshin llogaritjen e marzheve të gabimit dhe niveleve të besimit në të dhëna.
Ndahet në dy degë kryesore: statistika përshkruese dhe statistika inferenciale.
Mbështetet shumë në pastrimin e të dhënave dhe heqjen e paragjykimeve për të siguruar saktësinë.
Tabela Krahasuese
Veçori
Probabiliteti
Statistikat
Drejtimi i Logjikës
Deduktiv (Nga modeli në të dhëna)
Induktiv (Të dhënat në model)
Qëllimi kryesor
Parashikimi i ngjarjeve të ardhshme
Shpjegimi i të dhënave të kaluara/të tashme
Entitete të Njohura
Popullsia dhe rregullat e saj
Mostra dhe matjet e saj
Entitete të Panjohura
Rezultati specifik i një gjyqi
Karakteristikat e vërteta të popullsisë
Pyetje kyçe
Cilat janë shanset që të ndodhë 'X'?
Çfarë na tregon 'X' për botën?
Varësia
I pavarur nga mbledhja e të dhënave
Varet plotësisht nga cilësia e të dhënave
Mjeti kryesor
Variablat e rastësishme dhe shpërndarjet
Marrja e mostrave dhe testimi i hipotezave
Përshkrim i Detajuar i Krahasimit
Rrjedha e Informacionit
Mendojeni probabilitetin si një motor “parashikues” ku filloni me një pako letrash dhe llogaritni shanset për të nxjerrë një as. Statistikat “parashikojnë të kaluarën”; juve ju jepet një pirg letrash të nxjerra dhe duhet të përcaktoni nëse pakoja ishte e manipuluar apo e drejtë. Njëra fillon me shkakun dhe parashikon pasojën, ndërsa tjetra fillon me pasojën dhe kërkon shkakun.
Siguria kundrejt Vlerësimit
Probabiliteti merret me siguri teorike; nëse një zar është i saktë, shansi për një gjashtë është matematikisht i përcaktuar. Megjithatë, statistikat nuk pretendojnë kurrë siguri 100%. Në vend të kësaj, statisticienët ofrojnë 'intervale besimi', duke pranuar se, ndërsa besojnë se ekziston një trend, gjithmonë ekziston një diferencë e llogaritur për gabim ose 'vlera p' që përcakton potencialin e tyre për të qenë gabim.
Popullata kundrejt mostrës
Në probabilitet, ne supozojmë se dimë gjithçka për të gjithë grupin (popullatën), si të dimë saktësisht se sa topa të kuq ka në një kavanoz. Statistikat përdoren kur kavanozi është i errët dhe shumë i madh për t'u numëruar. Ne nxjerrim një grusht (mostra), i shikojmë ato dhe e përdorim atë informacion të kufizuar për të bërë një hamendësim të bazuar në çdo top në kavanoz.
Marrëdhënie e Ndërthurur
Nuk mund të kesh statistika moderne pa probabilitet. Testet statistikore, të tilla si përcaktimi nëse një ilaç i ri funksionon më mirë se një placebo, mbështeten në shpërndarjet e probabilitetit për të parë nëse rezultatet e vëzhguara mund të kenë ndodhur rastësisht. Probabiliteti ofron kornizën teorike, ndërsa statistikat ofrojnë zbatimin në botën reale.
Përparësi dhe Disavantazhe
Probabiliteti
Përparësi
+Matematikë shumë e saktë
+Rregulla teorike absolute
+Thelbësore për logjikën e inteligjencës artificiale
+Llogarit rrezikun qartë
Disavantazhe
−Kërkon të dhëna të njohura
−Mund të jetë tepër abstrakt
−I ndjeshëm ndaj supozimeve
−Nuk merr parasysh paragjykimet
Statistikat
Përparësi
+Përdor prova nga bota reale
+Identifikon trendet e fshehura
+Korrigjon gabimet
+Informon vendimet e politikave
Disavantazhe
−I hapur për interpretim
−Korrelacioni nuk është shkakësi
−Manipulohet lehtë
−Kërkon grupe të mëdha të dhënash
Idenë të gabuara të zakonshme
Miti
Probabiliteti dhe statistika janë thjesht emra të ndryshëm për të njëjtën gjë.
Realiteti
Ato janë disiplina të dallueshme. Ndërsa të dyja merren me rastësinë, probabiliteti është një degë e matematikës teorike, ndërsa statistika është një shkencë e aplikuar e fokusuar në interpretimin e të dhënave.
Miti
Një 'rëndësi statistikore' do të thotë që diçka është 100% e provuar.
Realiteti
Në statistika, asgjë nuk është 'e provuar' në kuptimin absolut. Kjo thjesht do të thotë që rezultati ka shumë pak gjasa të ketë ndodhur aksidentalisht, zakonisht me një shans prej 5% ose 1% që të jetë rastësi.
Miti
'Ligji i Mesatares' do të thotë që një fitore 'është e merituar' pas një serie të gjatë humbjesh.
Realiteti
Ky është Gabimi i Bixhozxhiut. Probabiliteti pohon se çdo ngjarje e pavarur (si një hedhje monedhe) nuk ka kujtesë për ngjarjen e mëparshme; shanset mbeten të njëjta pavarësisht nga ajo që ka ndodhur më parë.
Miti
Më shumë të dhëna gjithmonë çojnë në statistika më të mira.
Realiteti
Sasia nuk përcakton cilësinë. Nëse të dhënat janë të anshme ose mostra nuk është përfaqësuese, një grup i të dhënave më i madh thjesht do t'ju çojë në një përfundim më "të sigurt", por të pasaktë.
Pyetjet më të Përshkruara
Cilin duhet të mësoj së pari për Shkencën e të Dhënave?
Filloni me probabilitetin. Ai ofron 'gjuhën' dhe shpërndarjet (si Shpërndarja Normale) që do t'ju nevojiten për të kuptuar se si funksionojnë në të vërtetë testet statistikore. Pa probabilitet, statistikat do të ndihen thjesht si të mësuarit përmendësh të formulave pa e ditur pse funksionojnë ato.
Cili është ndryshimi midis një parametri dhe një statistike?
Një parametër është një vlerë e vërtetë që i përket një popullsie të tërë (si gjatësia mesatare e çdo njeriu në Tokë). Një statistikë është një vlerë e llogaritur nga një mostër (si gjatësia mesatare e 100 personave që keni matur). Ne e përdorim statistikën për të vlerësuar parametrin.
A është numërimi i kartave në Blackjack probabilitet apo statistikë?
Në fakt janë të dyja. Ju përdorni statistikat për të ndjekur 'të dhënat' (se cilat letra janë luajtur) dhe më pas përdorni probabilitetin për të llogaritur shanset në ndryshim të paketës së mbetur. Është një aplikim në kohë reale i përditësimit të një modeli bazuar në informacion të ri.
Si ndihmon probabiliteti në parashikimin e motit?
Meteorologët kryejnë mijëra simulime duke përdorur të dhëna aktuale. Nëse 700 nga 1,000 simulime tregojnë shi, ata raportojnë një probabilitet prej 70%. Pjesa e 'statistikave' përfshinte analizimin e dekadave të motit të kaluar për të krijuar ato modele simulimi në radhë të parë.
Çfarë është 'Inferenca' në statistikë?
Nxjerrja e përfundimeve është akti i 'nxjerrjes së përfundimeve' ose hamendësimit të karakteristikave të një grupi të madh bazuar në një grup të vogël. Është ura që na lejon të bëjmë pretendime të gjera në lidhje me opinionin publik ose efikasitetin mjekësor pa testuar çdo person të vetëm në një vend.
Çfarë do të thotë një probabilitet prej 0?
Në një grup të kufizuar rezultatesh, një probabilitet prej 0 do të thotë që një ngjarje është e pamundur. Megjithatë, në matematikën e vazhdueshme (si zgjedhja e një decimali të saktë midis 0 dhe 1), një probabilitet prej 0 mund të ndodhë teknikisht, por ne e quajmë 'pothuajse të pamundur' në një kuptim praktik.
A mund të përdoren statistikat për të gënjyer?
Absolutisht. Duke zgjedhur mostra të anshme, duke vizualizuar të dhënat me shkallë mashtruese ose duke injoruar 'marzhin e gabimit', njerëzit mund të bëjnë që statistikat të mbështesin pothuajse çdo pretendim. Kjo është arsyeja pse të kuptuarit e metodologjisë që qëndron pas numrave është po aq e rëndësishme sa vetë numrat.
Pse është kaq e rëndësishme 'Shpërndarja Normale' në të dyja?
Kurba e ziles (Shpërndarja Normale) është modeli më i zakonshëm në natyrë. Në probabilitet, ajo përshkruan se si grupohen variablat e rastësishme. Në statistikë, Teorema e Limitit Qendror na tregon se ndërsa marrim më shumë mostra, të dhënat tona do ta formojnë natyrshëm këtë formë, duke lejuar parashikime shumë të fuqishme.
Verdikt
Përdorni probabilitetin kur i dini rregullat e lojës dhe doni të parashikoni se çfarë do të ndodhë më pas. Kaloni te statistikat kur keni një grumbull të dhënash dhe duhet të kuptoni se cilat janë në të vërtetë ato rregulla të fshehura.