Probabilitatea eta estatistika txanpon matematiko beraren bi aldeak dira, ziurgabetasuna kontrako norabideetatik jorratzen baitute. Probabilitateak etorkizuneko emaitzen probabilitatea aurreikusten duen bitartean, eredu ezagunetan oinarrituta, estatistikak iraganeko datuak aztertzen ditu eredu horiek eraikitzeko edo egiaztatzeko, behaketetatik atzera eginez oinarrizko egia aurkitzeko.
Nabarmendunak
Probabilitatea oinarria da; estatistika, horren gainean eraikitako eraikina.
0,5eko probabilitatea baieztapen matematikoa da, eta batez besteko estatistikoa, berriz, behaketa bat.
Estatistikak 'zarata' eta muturreko balioak maneiatzen ditu, eta hauek probabilitate-teoria hutsean alde batera uzten dira.
Jokoak probabilitatean oinarritzen da, aseguru-etxeek, berriz, estatistikan.
Zer da Probabilitatea?
Gertaera zehatz batzuk gertatzeko probabilitatea aurreikusten duen ausazkotasunaren azterketa matematikoa.
Prozesu deduktibo gisa funtzionatzen du, arau orokorretatik emaitza zehatzetara igaroz.
Kalkuluak beti 0 (ezinezkoa) eta 1 (ziurtasuna) artean lotuta daude.
'Populazioaren' edo sistemaren parametroak ezagunak direla suposatzen du.
Permutazioak, konbinazioak eta banaketa-kurbak bezalako tresnak erabiltzen ditu normalean.
Zenbaki Handien Legeak probabilitate teorikoa benetako emaitzekin lotzen du.
Zer da Estatistikak?
Datuak bildu, aztertu eta interpretatzeko zientzia, ereduak eta joerak aurkitzeko.
Prozesu induktibo bat da, behaketa zehatzetatik ondorio orokorretara igarotzen dena.
Lagin txikiago bat erabiliz populazio-parametro ezezagunak kalkulatzean zentratzen da.
Datuen errore-marjinak eta konfiantza-mailak kalkulatzea dakar.
Bi adar nagusitan banatuta: estatistika deskriptiboa eta inferentziala.
Zehaztasuna bermatzeko, datuen garbiketan eta alborapenen kentzean oinarritzen da neurri handi batean.
Konparazio Taula
Ezaugarria
Probabilitatea
Estatistikak
Logikaren norabidea.
Deduktiboa (eredutik datuetara)
Induktiboa (Datuak Eredura)
Helburu nagusia
Etorkizuneko gertaerak aurreikustea
Iraganeko/oraingo datuak azaltzea
Entitate ezagunak
Biztanleria eta bere arauak
Lagina eta bere neurketak
Entitate ezezagunak
Proba baten emaitza zehatza
Biztanleriaren benetako ezaugarriak
Galdera nagusia
Zein da 'X' gertatzeko probabilitatea?
Zer esaten digu 'X'-k munduari buruz?
Menpekotasuna
Datuen bilketatik independentea
Datuen kalitatearen menpe dago guztiz
Oinarrizko tresna
Ausazko aldagaiak eta banaketak
Laginketa eta hipotesi probak
Xehetasunak alderatzea
Informazioaren fluxua
Pentsa ezazu probabilitatea "aurrera begira" duen motor bat bezala, non karta sorta batekin hasten zaren eta bateko bat ateratzeko probabilitatea kalkulatzen duzun. Estatistika "atzera begira" dago; ateratako karta pila bat ematen dizute eta zehaztu behar duzu sorta manipulatua edo bidezkoa den. Batek kausarekin hasten da eta efektua iragartzen du, eta besteak, berriz, efektuarekin hasten da eta kausa bilatzen du.
Ziurtasuna vs. Estimazioa
Probabilitateak ziurtasun teorikoekin du zerikusia; dado bat bidezkoa bada, sei bat ateratzeko aukera matematikoki finkoa da. Estatistikak, ordea, ez du inoiz %100eko ziurtasuna aldarrikatzen. Horren ordez, estatistikariek "konfiantza-tarteak" eskaintzen dituzte, onartuz joera bat existitzen dela uste duten arren, beti dagoela errore-marjina kalkulatu bat edo "p-balioa", oker egoteko duten potentziala kuantifikatzen duena.
Biztanleria vs. Lagina
Probabilitatean, talde osoari (populazioari) buruz dena dakigula suposatzen dugu, pote batean zenbat kanika gorri dauden zehazki jakitea bezala. Estatistika erabiltzen da potea opakoa eta zenbatzeko handiegia denean. Eskukada bat ateratzen dugu (lagina), begiratzen diegu eta informazio mugatu hori erabiltzen dugu poteko kanika bakoitzari buruzko asmakizun informatua egiteko.
Elkarri lotutako harremana
Ezinezkoa da estatistika modernoa izatea probabilitaterik gabe. Proba estatistikoek, hala nola sendagai berri batek plazeboa baino hobeto funtzionatzen duen zehazteak, probabilitate-banaketetan oinarritzen dira behatutako emaitzak kasualitate hutsez gertatu ote ziren ikusteko. Probabilitateak marko teorikoa eskaintzen du, eta estatistikak, berriz, benetako munduko aplikazioa.
Abantailak eta Erabiltzailearen interfazea
Probabilitatea
Abantailak
+Matematika oso zehatza
+Arau teoriko absolutuak
+Ezinbestekoa IA logikara
+Arriskua argi eta garbi kalkulatzen du
Erabiltzailearen interfazea
−Sarrera ezagunak behar ditu
−Gehiegi abstraktua izan daiteke
−Suposizioekiko sentikorra
−Ez du alborapena kontuan hartzen
Estatistikak
Abantailak
+Mundu errealeko ebidentzia erabiltzen du
+Ezkutuko joerak identifikatzen ditu
+Akatsak zuzentzen ditu.
+Politika erabakiak informatzen ditu
Erabiltzailearen interfazea
−Interpretaziorako irekia.
−Korrelazioa ez da kausalitatea
−Erraz manipulatzen da.
−Datu-multzo handiak behar ditu
Ohiko uste okerrak
Mitologia
Probabilitatea eta estatistika gauza beraren izen desberdinak baino ez dira.
Errealitatea
Diziplina desberdinak dira. Biak zoria jorratzen duten arren, probabilitatea matematika teorikoaren adar bat da, eta estatistika, berriz, datuen interpretazioan oinarritutako zientzia aplikatua da.
Mitologia
«Esangura estatistikoak» zerbait % 100ean frogatuta dagoela esan nahi du.
Errealitatea
Estatistiketan, ezer ez dago "frogatuta" zentzu absolutuan. Emaitza oso litekeena ez dela kasualitatez gertatu esan nahi du, normalean % 5 edo % 1eko probabilitatea kasualitatea izateko.
Mitologia
'Batez bestekoen legeak' esan nahi du porrot bolada luze baten ondoren garaipena 'beharrezkoa' dela.
Errealitatea
Hau da Jokalariaren Falazia. Probabilitateak dioenez, gertaera independente bakoitzak (txanpon-jaurtiketa bat bezala) ez du aurrekoaren oroimenik; probabilitateak berdinak dira aurretik gertatutakoa gorabehera.
Mitologia
Datu gehiagok beti estatistika hobeak dakartza.
Errealitatea
Kantitateak ez du kalitatea konpontzen. Datuak alboratuak badira edo lagina ez bada adierazgarria, datu-multzo handiago batek ondorio "ziurrago" baina okerrago batera eramango zaitu, besterik gabe.
Sarritan Egindako Galderak
Zein ikasi beharko nuke lehenengo Datu Zientziarako?
Hasi probabilitatearekin. Estatistika-probak nola funtzionatzen duten ulertzeko behar dituzun 'hizkuntza' eta banaketak (banaketa normala bezala) eskaintzen ditu. Probabilitaterik gabe, estatistikak formulak buruz ikastea bezala sentituko zara, zergatik funtzionatzen duten jakin gabe.
Zein da parametro baten eta estatistika baten arteko aldea?
Parametro bat populazio oso bati dagokion balio erreala da (Lurreko gizaki bakoitzaren batez besteko altuera bezala). Estatistika bat lagin batetik kalkulatutako balioa da (neurtu dituzun 100 pertsonen batez besteko altuera bezala). Estatistika erabiltzen dugu parametroa kalkulatzeko.
Blackjack-ean karta-zenbaketa probabilitatea ala estatistikoa da?
Egia esan, biak dira. Estatistikak erabiltzen dituzu 'datuak' (zein karta jokatu diren) jarraitzeko eta gero probabilitatea erabiltzen duzu gainerako karta-sortaren aldaketa-probabilitatea kalkulatzeko. Informazio berrian oinarritutako eredu bat eguneratzeko denbora errealeko aplikazioa da.
Nola laguntzen du probabilitateak eguraldiaren iragarpenean?
Meteorologoek milaka simulazio egiten dituzte egungo datuak erabiliz. 1.000 simulaziotik 700ek euria erakusten badute, % 70eko probabilitatea adierazten dute. 'Estatistika' zatiak iraganeko hamarkadetako eguraldia aztertzea izan zuen helburu, simulazio-eredu horiek sortzeko, lehenik eta behin.
Zer da 'inferentzia' estatistikan?
Ondorioa talde handi baten ezaugarriak talde txiki batean oinarrituta "ondorioztatzea" edo asmatzea da. Zubia da, herrialde bateko pertsona guztiak probatu gabe iritzi publikoari edo eraginkortasun medikoaren inguruko baieztapen zabalak egiteko aukera ematen diguna.
Zer esan nahi du 0 probabilitateak?
Emaitza multzo finitu batean, 0 probabilitateak gertaera ezinezkoa dela esan nahi du. Hala ere, matematika jarraituan (0 eta 1 arteko hamartar zehatz bat aukeratzea bezala), 0 probabilitatea teknikoki gerta daiteke, baina 'ia ezinezkoa' dela esaten dugu zentzu praktikoan.
Estatistikak erabil al daitezke gezurra esateko?
Noski. Lagin alboratuak aukeratuz, datuak eskala engainagarriekin bistaratuz edo "errore-marjina" alde batera utziz, jendeak estatistikak ia edozein baieztapen babestu ditzake. Horregatik, zenbakien atzean dagoen metodologia ulertzea zenbakiak berak bezain garrantzitsua da.
Zergatik da hain garrantzitsua 'Banaketa Normala' bietan?
Kanpai-kurba (Banaketa Normala) naturan ohikoena den eredua da. Probabilitatean, ausazko aldagaiak nola multzokatzen diren deskribatzen du. Estatistikan, Limite Zentralaren Teoremak esaten digu lagin gehiago hartzen ditugun heinean, gure datuek forma hori hartuko dutela modu naturalean, iragarpen oso indartsuak ahalbidetuz.
Epaia
Erabili probabilitatea jokoaren arauak ezagutzen dituzunean eta ondoren zer gertatuko den aurreikusi nahi duzunean. Aldatu estatistikara datu pila bat duzunean eta ezkutuko arau horiek zeintzuk diren jakin behar duzunean.