Comparthing Logo
datu zinātneloģikaanalītikapētniecības metodes

Konteksts pret statistiku

Izpratne par konteksta un statistikas mijiedarbību ir sarežģītas analīzes raksturīgākā iezīme. Lai gan statistika sniedz precīzu, matemātisku skeletu par to, kas notiek visā populācijā, konteksts pievieno nepieciešamo pamatu un spēku, izskaidrojot, kāpēc šie modeļi pastāv un kādi konkrēti apstākļi ietekmēja galīgos skaitļus.

Iezīmes

  • Statistika sniedz atbildi “ko”, savukārt konteksts sniedz atbildi “un kā tad”.
  • Dati bez konteksta bieži vien ir tikai troksnis, kas maskējas kā informācija.
  • Konteksts darbojas kā filtrs, kas noņem maldinošas statistiskās novirzes.
  • Visspēcīgākās atziņas rodas, kad skaitļi un naratīvi saskan.

Kas ir Konteksts?

Apkārtējie apstākļi, pamatinformācija un konkrēti nosacījumi, kas piešķir nozīmi konkrētam notikumam vai datu punktam.

  • Identificē ārējos mainīgos, kas ietekmē mērījumu
  • Būtiski, lai nošķirtu korelāciju no faktiskā cēloņsakarības
  • Izmanto tādus kvalitatīvus elementus kā kultūra, vēsture un vide
  • Novērš datu nepareizu interpretāciju neparastu notikumu laikā
  • Sniedz “stāstu” par pēkšņu rādītāju pieaugumu vai kritumu

Kas ir Statistika?

Disciplīna, kas saistīta ar skaitlisku datu vākšanu, analīzi un interpretāciju, lai identificētu modeļus un tendences grupā.

  • Paļaujas uz matemātiskiem modeļiem, lai sasniegtu objektīvus rezultātus
  • Izmanto varbūtību, lai prognozētu nākotnes iznākumu iespējamību
  • Lai nodrošinātu ticamu pārstāvību, nepieciešams liels izlases lielums
  • Palīdz novērst individuālas neobjektivitātes, izmantojot skaitlisku apkopošanu
  • Standartizē informāciju, lai varētu salīdzināt dažādus datu kopumus

Salīdzinājuma tabula

Funkcija Konteksts Statistika
Pamatmērķis Meklējot jēgu un "kāpēc" Meklējot modeļus un "Cik daudz"
Informācijas avots Vide un naratīvi Skaitliski novērojumi
Skatpunkts Subjektīvs un lokalizēts Objektīvs un vispārināts
Primārais spēks Dziļa izpratne Mērogojamība un pierādījums
Galvenais risks Anekdotiska neobjektivitāte Datu dehumanizācija
Uzticamība Augsta situācijas precizitāte Augsta paredzamības jauda

Detalizēts salīdzinājums

Karte pret reljefu

Iedomājieties statistiku kā topogrāfisku karti, kas parāda meža augstumu virs jūras līmeņa un robežas. Konteksts ir kā pastaiga pa kokiem; tas atklāj, vai zeme ir dubļaina no nesena lietus vai vai tur ligzdo konkrēta putnu suga, un šīs detaļas kartē vienkārši nevar iekļaut.

Cēloņsakarība un "slēptais" mainīgais

Statistika varētu liecināt par perfektu korelāciju starp saldējuma pārdošanu un haizivju uzbrukumiem, taču bez konteksta šie dati ir bīstami. Konteksts nodrošina trūkstošo saikni — vasaras karstumu —, kas liek vairāk cilvēkiem iegādāties našķus un vairāk cilvēku peldēties, pierādot, ka šie divi statistikas dati patiesībā viens otru neizraisa.

Viduvējības briesmas

Statistiķis varētu apgalvot, ka upes vidējais dziļums ir četras pēdas, kas šķiet droši šķērsojama. Tomēr konteksts ar desmit pēdu dziļu kritumu upes vidū padara "vidējo" mērījumu dzīvībai bīstamu, uzsverot, cik svarīgas vietējās detaļas ir izdzīvošanai.

Lēmumu pieņemšana uzņēmējdarbībā

Uzņēmums var novērot, ka tā tīmekļa vietnes apmeklētība samazinās par 20 %, un, pamatojoties tikai uz statistiku, tas var krist panikā. Kontekstuālā analīze var atklāt, ka kritums noticis lielu valsts svētku vai globāla interneta pārtraukuma laikā, pārvēršot "krīzi" par nenotikumu, kam nav nepieciešama rīcība.

Priekšrocības un trūkumi

Konteksts

Iepriekšējumi

  • + Izskaidro sarežģītas nianses
  • + Samazina nepareizu interpretāciju
  • + Veido dziļāku empātiju
  • + Identificē unikālus riskus

Ievietots

  • Grūti mērogot
  • Ļoti subjektīvs
  • Laikietilpīgi atrast
  • Grūti kvantificēt

Statistika

Iepriekšējumi

  • + Parāda kopējo ainu
  • + Objektīvs un neitrāls
  • + Iespējo prognozēšanu
  • + Ietaupa laiku lielos mērogos

Ievietots

  • Var būt maldinošs
  • Trūkst cilvēciskā elementa
  • Izdzēš "kāpēc"
  • Nosliece uz manipulācijām

Biežas maldības

Mīts

Statistika ir fakti, un konteksts ir tikai viedoklis.

Realitāte

Abas ir būtiskas patiesības formas. Statistika ir skaitlisks fakts, bet konteksts nodrošina faktisko vidi, kas ļauj pareizi interpretēt šo skaitli.

Mīts

Ja izlases lielums ir pietiekami liels, kontekstam nav nozīmes.

Realitāte

Pat miljardu cilvēku liela izlase var būt bezjēdzīga, ja konteksts ir nepareizs. Ja aptaujājat miljardu cilvēku par sniegu, bet runājat tikai ar tiem, kas dzīvo Sahārā, jūsu milzīgais datu kopums joprojām ir fundamentāli kļūdains.

Mīts

Konteksts ir paredzēts tikai “mīkstajām” zinātnēm, piemēram, socioloģijai.

Realitāte

Tādas eksaktās zinātnes kā fizika un medicīna lielā mērā balstās uz kontekstu. Zāļu efektivitātes statistika ir bezjēdzīga bez pacienta vecuma, svara un iepriekšējo slimību konteksta.

Mīts

Jūs vienmēr varat "aprēķināt" kontekstu vēlāk.

Realitāte

Konteksts bieži vien ir īslaicīgs. Ja datu vākšanas brīdī netiek reģistrēti konkrēti apstākļi, piemēram, laika apstākļi vai politiskais klimats, šī informācija var tikt zaudēta uz visiem laikiem.

Bieži uzdotie jautājumi

Kas ir "slēpjošais mainīgais" statistikā?
Šis ir kontekstuāls faktors, kas netiek iekļauts statistiskajā analīzē, bet faktiski ietekmē gan neatkarīgos, gan atkarīgos mainīgos. Tieši datu "spoks" rada iespaidu, ka divas nesaistītas lietas dejo kopā, un tā atrašana ir kontekstuālās izpētes galvenais mērķis.
Kā es varu zināt, vai maniem datiem trūkst konteksta?
Pajautājiet sev, vai skaitlis mainītos, ja mainītos diennakts laiks, atrašanās vieta vai auditorija. Ja nevarat izskaidrot, kāpēc skaitlis ir augsts vai zems, neizdarot minējumus, jūs aplūkojat neapstrādātu statistiku bez pietiekama konteksta, lai izdarītu drošu spriedumu.
Kāpēc politiķi izmanto statistiku bez konteksta?
Tā ir izplatīta taktika, kā izvēlēties sev piemērotāko. Atmetot kontekstu, piemēram, globālu ekonomikas tendenci, runātājs var panākt, lai vietējās izmaiņas izskatītos kā tiešas viņa konkrētās politikas sekas, pat ja tās nav saistītas.
Vai “lielie dati” aizstāj nepieciešamību pēc konteksta?
Ja nu kas, lielie dati padara kontekstu svarīgāku nekā jebkad agrāk. Ar miljardiem datu punktu ir viegli atrast "viltus korelācijas", kas izskatās nozīmīgas, bet ir tikai matemātiskas sakritības. Konteksts ir vienīgais instruments, kas var atdalīt reālus signālus no šī digitālā trokšņa.
Vai konteksts var būt neobjektīvs?
Pilnīgi noteikti. Tāpat kā statistiku var manipulēt, kontekstu var “pielāgot”, lai atbalstītu konkrētu stāstījumu. Tāpēc ir svarīgi meklēt vairākus konteksta avotus, lai pārliecinātos, ka iegūstat pilnu stāstu, nevis tikai atlasītu versiju.
Kas ir Simpsona paradokss?
Šī ir slavena statistikas parādība, kad tendence parādās vairākās dažādās datu grupās, bet izzūd vai mainās, kad šīs grupas tiek apvienotas. Tas lieliski ilustrē, kāpēc datu grupēšanas konteksts var pilnībā mainīt galīgo secinājumu.
Vai kvalitatīvie pētījumi sniedz labāku kontekstu nekā kvantitatīvie?
Parasti jā. Kvalitatīvas metodes, piemēram, intervijas un atvērta tipa novērojumi, ir īpaši izstrādātas, lai tvertu situācijas nianses un “noskaņu”. Tomēr kvantitatīvie dati var sniegt arī kontekstu, ja tie ietver metadatus, piemēram, laika zīmogus un ģeolokāciju.
Kā es varu sniegt kontekstu ziņojumā, kurā ir daudz datu?
Izmantojiet anotācijas un piezīmes savos grafikos. Tā vietā, lai vienkārši rādītu augšupvērstu līniju, pievienojiet nelielu piezīmi, kurā paskaidrots, ka tajā nedēļā tika uzsākta mārketinga kampaņa. Šis vienkāršais papildinājums savieno neapstrādātus skaitļus ar praktiski izmantojamu ieskatu.
Kas notiek, ja ir konteksts, bet nav statistikas?
Galu galā jūs iegūstat anekdoti. Lai gan anekdote var būt dziļi aizkustinoša un patiesa vienam cilvēkam, tai trūkst “statistiskas nozīmības”, lai pierādītu, ka tas pats notiek ar visiem pārējiem. Jums ir nepieciešami skaitļi, lai pierādītu stāsta mērogu.
Vai ir iespējams, ka konteksta ir par daudz?
Jā, to bieži sauc par "analīzes paralīzi". Ja mēģināsiet ņemt vērā katru mazāko mainīgo Visumā, nekad nevarēsiet atrast skaidru likumsakarību. Mērķis ir atrast "jēgpilno" kontekstu — faktorus, kas faktiski virza gaitu.

Spriedums

Statistikai vajadzētu būt jūsu sākumpunktam, lai noteiktu plašas tendences un pierādītu teorijas ieinteresētajām personām. Tomēr nekad nevajadzētu pieņemt galīgo lēmumu bez konteksta, jo tas nodrošina, ka jūsu darbības ir atbilstošas reālajai videi, kurā jūs darbojaties.

Saistītie salīdzinājumi

Astroloģiskā prognozēšana pret statistisko prognozēšanu

Kamēr astroloģiskā prognozēšana saista debesu ciklus ar cilvēku pieredzi, lai iegūtu simbolisku nozīmi, statistiskā prognozēšana analizē empīriskus vēsturiskus datus, lai novērtētu nākotnes skaitliskās vērtības. Šis salīdzinājums pēta plaisu starp seno, uz arhetipiem balstīto personīgās pārdomu sistēmu un moderno, uz datiem balstīto metodoloģiju, ko izmanto objektīvai lēmumu pieņemšanai uzņēmējdarbībā un zinātnē.

Astroloģiskie tranzīti pret dzīves notikumu varbūtības modeļiem

Šis salīdzinājums pēta aizraujošo plaisu starp senajiem debesu novērojumiem un mūsdienu paredzošo analītiku. Kamēr astroloģiskie tranzīti izmanto planētu ciklus, lai interpretētu personīgās izaugsmes fāzes, dzīves notikumu varbūtības modeļi balstās uz lieliem datiem un statistikas algoritmiem, lai prognozētu konkrētus pagrieziena punktus, piemēram, karjeras izmaiņas vai veselības aprūpes vajadzības.

Ātrā testēšana salīdzinājumā ar A/B testēšanu

Lai gan abas metodoloģijas kalpo digitālās veiktspējas optimizēšanai, tās darbojas uz principiāli atšķirīgiem tehnoloģiju slāņiem. Ātrā testēšana koncentrējas uz lingvistisko ievaddatu pilnveidošanu, kas vada ģeneratīvos mākslīgā intelekta modeļus, savukārt A/B testēšana nodrošina stingru statistisko sistēmu divu atšķirīgu tīmekļa lapas vai lietotnes funkcijas versiju salīdzināšanai, lai noskaidrotu, kura no tām labāk rezonē ar reāliem cilvēkiem.

Augstas frekvences dati salīdzinājumā ar apkopotiem datiem modelēšanā

Izvēle starp augstas frekvences datiem un apkopotiem datiem ir būtisks kompromiss analītikā. Lai gan neapstrādātas, mazāk nekā sekundes laikā apkopotas darījumu un sensoru plūsmas piedāvā nepārspējamu ieskatu tūlītējā uzvedībā un tirgus mikrostruktūrās, saspiesti laika apkopojumi novērš milzīgu statistisko troksni un lielas infrastruktūras prasības, lai atklātu skaidras, strukturālas ilgtermiņa tendences.

Automatizēta modeļu izsekošana salīdzinājumā ar manuālu eksperimentu izsekošanu

Izvēle starp automatizētu modeļu izsekošanu un manuālu eksperimentu izsekošanu būtiski ietekmē datu zinātnes komandas ātrumu un reproducējamību. Kamēr automatizācija izmanto specializētu programmatūru, lai nemanāmi uztvertu katru hiperparametru, metriku un artefaktu, manuālā izsekošana balstās uz cilvēka rūpību, izmantojot izklājlapas vai Markdown failus, radot krasu kompromisu starp iestatīšanas ātrumu un ilgtermiņa mērogojamu precizitāti.