Banatutako informatika vs. datu-zentro zentralizatuak
Banatutako informatikak lan-karga hainbat makina elkarri konektatuta banatzen du, eta datu-zentro zentralizatuek, berriz, prozesatzeko ahalmena instalazio fisiko bakar batean kontzentratzen dute. Bi ikuspegiek hodeiko zerbitzu modernoak elikatzen dituzte, baina nabarmen desberdinak dira eskalagarritasunean, akatsen tolerantzian eta kostuen egituran.
Nabarmendunak
Sistem banatuek akats-puntu bakarrak ezabatzen dituzte lana nodo askotan banatuz.
Datu-zentro zentralizatuek kudeaketa errazagoa eta segurtasun fisikoaren kontrol sendoagoa eskaintzen dute.
Konputazio banatua horizontalki eskalatzen da nodoak gehituz, eta eredu zentralizatuak, berriz, bertikalki eskalatzen dira.
AWS eta Azure bezalako hodei plataforma modernoek bi arkitekturak konbinatzen dituzte eszenaren atzean.
Zer da Banatutako informatika?
Prozesatzeko zereginak sistema bateratu gisa elkarrekin lan egiten duten hainbat ordenagailu elkarri konektatutakoen artean banatzen diren eredua.
1960ko eta 1970eko hamarkadetan sortu zen, ARPANETekin, lehenengo sare banatu praktikoetako bat izan zena.
Sare baten bidez komunikatuta dauden hainbat makinaren menpe dago kalkulua, biltegiratzea eta zerbitzuak partekatzeko.
SETI@home izeneko lehenengo adibide ospetsuak irrati-teleskopioen datuak aztertzeko boluntarioen etxeko ordenagailuak erabiltzen zituen.
Inplementazio modernoen artean Apache Hadoop eta Apache Spark daude, klusterren artean datu-multzo masiboak prozesatzeko diseinatuak.
Bitcoin bezalako blockchain sareak sistema banatu deszentralizatu gisa funtzionatzen dute, autoritate zentral bat gabe.
Zer da Datu-zentro zentralizatuak?
Azpiegitura eredu tradizionala, non baliabide informatiko guztiak instalazio bakar eta dedikatu batean gordetzen diren.
Ordenagailu nagusiek eredu zentralizatua ezagun egin zuten 1960ko hamarkadan, milaka erabiltzaileri toki bakarretik zerbitzua emanez.
Gaur egungo hipereskalako instalazioek milioi bat zerbitzari baino gehiago eduki ditzakete eraikin bakarrean.
Equinix, Google eta Amazon bezalako enpresek hodeiko zerbitzuak elikatzen dituzten campus zentralizatuak kudeatzen dituzte.
Instalazio zentralizatuek normalean 1,1 eta 1,5 arteko energia-erabileraren eraginkortasun-baluazioak (PUE) lortzen dituzte.
Ereduak kudeaketa, segurtasun-auditoria eta araudi-betetzea errazten ditu bateratze fisikoaren bidez.
Konparazio Taula
Ezaugarria
Banatutako informatika
Datu-zentro zentralizatuak
Arkitektura
Hainbat nodo kokapenetan zehar
Instalazio edo campus bakarra
Eskalagarritasuna
Horizontala, gehitu nodoak edozein lekutan
Bertikala, instalazioen edukiera handitu
Akatsen tolerantzia
Altua, huts egiteko puntu bakar bat ere ez
Txikiagoa, erredundantzia diseinuaren araberakoa da
Konputazio banatuak prozesamendua hiri, herrialde edo kontinente desberdinetan egon daitezkeen makina askotan zehar zabaltzen du. Nodo hauek sare-protokolo estandarren bidez komunikatzen dira eta lana adostasun-algoritmoen edo maisu-langile ereduen bidez koordinatzen dute. Datu-zentro zentralizatuek kontrako ikuspegia hartzen dute, milaka zerbitzari eraikin bakarrean sartuz, hozte, potentzia eta konexio arretaz kontrolatuta. Kontzentrazio fisikoak hardwarearen mantentze-lanak errazten ditu, baina menpekotasun geografiko bakarra sortzen du.
Eskalagarritasuna eta Hazkundea
Eskaria gora egiten duenean, banatutako sistemek nodo gehiago gehi ditzakete klusterrera, askotan eskualde desberdinetan, erabiltzaileei hurbilago zerbitzatzeko. Eskalatze horizontal hau malguagoa eta kostu-eraginkorragoa izan ohi da eskala masiboan. Instalazio zentralizatuek bertikalki eskalatzen dute zerbitzari, rack edo hegal berriak gehituz, eta horrek kapital-inbertsio eta denbora-tarte handia eskatzen du. Hodeiko hornitzaileek askotan bi ereduak konbinatzen dituzte, barne-software arkitektura banatuetan oinarritzen diren hipereskalako campus zentralizatuak erabiliz.
Fidagarritasuna eta akatsen tolerantzia
Sistema banatuak berez erresilienteagoak dira, nodo baten hutsegiteak sare osoa gutxitan geldiarazten duelako. Google-ren bilaketa-azpiegitura edo Amazon-en DynamoDB bezalako zerbitzuak makina indibidualak huts egiten dutenean ere martxan jarraitzeko diseinatuta daude. Datu-zentro zentralizatuek antzeko fidagarritasuna lor dezakete elikatze-iturri erredundanteen, babeskopia-sorgailuen eta failover klusterren bidez, baina gune nagusian sute edo uholde bat bezalako gertaera katastrofiko batek etenaldi handiak eragin ditzake oraindik. AWS-n 2017ko S3 etenak erakutsi zuen nola instalazio bakarreko arazo batek zerbitzu ugariri eragin diezaiekeen.
Errendimendua eta latentzia
Datu-zentro zentralizatuek normalean latentzia oso koherentea eskaintzen diete eskualde berera konektatzen diren erabiltzaileei, zerbitzari guztiek sare lokal bera partekatzen baitute. Banatutako sistemek batzuetan latentzia aldakorra sor dezakete nodoek distantzia luzeagoetan komunikatu behar dutelako, nahiz eta ertzeko konputazio aldaerek latentzia murrizten duten konputazioa azken erabiltzaileengandik hurbilago jarriz. Maiztasun handiko merkataritza edo denbora errealeko bideo prozesamendua bezalako lan-kargetarako, konputazio baliabideen kokapen geografikoak izugarri garrantzia du, eta horregatik edukiak banatzeko sareek bi ikuspegiak konbinatzen dituzte.
Kostua eta funtzionamendu-gastuak
Instalazio zentralizatu bat funtzionatzeak kostu finko handiak dakartza: higiezinak, hozte sistemak, segurtasun fisikoa eta energia azpiegitura dedikatua. Gastu hauek aurreikusgarriak dira, baina hasierako kapital handia behar dute. Banatutako informatikak gastua sareetara, orkestrazio softwarera eta nodoen arteko etengabeko koordinaziora aldatzen du. Datu-zentro bat eraikitzeko aurrekonturik ez duten erakundeentzat, AWS edo Azure bezalako hornitzaileengandik banatutako hodeiko baliabideak alokatzea askotan ekonomikoagoa da beren instalazio zentralizatua eraikitzea baino.
Segurtasuna eta Betetzea
Datu-zentro zentralizatuek betetze-ikuskapenak errazten dituzte, datu sentikorrak kokapen ezagun batean baitaude, sarbide fisiko kontrolatuarekin. Banku eta osasungintza bezalako industria arautuek askotan eredu hau nahiago dute arrazoi horregatik. Sistema banatuek betetzea zailtzen dute, datuak jurisdikzio anitzetan egon daitezkeelako, bakoitza pribatutasun-lege desberdinekin. Hala ere, arkitektura banatuek eraso batzuen aurkako segurtasuna hobetu dezakete, nodo bat arriskuan jartzeak ez baitu sistema osoa agerian uzten. Enkriptazio modernoak eta zero-trust esparruek bi ikuspegi hauen arteko aldea gainditzen laguntzen dute.
Abantailak eta Erabiltzailearen interfazea
Banatutako informatika
Abantailak
+Akatsen tolerantzia handia
+Malgutasun geografikoa
+Eskalagarritasun horizontala
+Gune bakarreko arrisku txikiagoa
Erabiltzailearen interfazea
−Orkestrazio konplexua
−Sarearen latentzia arazoak
−Betetze gogorragoa
−Arazketaren erronkak
Datu-zentro zentralizatuak
Abantailak
+Kudeaketa errazagoa.
+Segurtasun fisiko sendoa
+Aurreikus daitekeen errendimendua
+Betetze sinplifikatua
Erabiltzailearen interfazea
−Akats puntu bakarra
−Kapital-kostu handiak
−Latentzia geografikoa
−Eskalatzeko oztopoak
Ohiko uste okerrak
Mitologia
Konputazio banatuak beti esan nahi du blockchain edo kriptografia-moneta.
Errealitatea
Konputazio banatua blockchain-a baino hamarkada batzuk lehenagokoa den arlo zabala da. Kluster konputazioa, sare konputazioa, mikrozerbitzuak eta edukien banaketa sareak barne hartzen ditu. Blockchain printzipio banatuen aplikazio espezializatu bat besterik ez da, adostasunean oinarritua, autoritate zentral bat gabe.
Mitologia
Datu-zentro zentralizatuak zaharkituta daude hodeiko aroan.
Errealitatea
Instalazio zentralizatuak oso bizirik daude eta hodei hornitzaile nagusi guztien bizkarrezurra osatzen dute. AWS, Microsoft Azure eta Google Cloud-ek milioika zerbitzari gordetzen dituzten campus zentralizatu erraldoiak erabiltzen dituzte. Hodeia, funtsean, aplikazio banatuei alokatutako azpiegitura zentralizatua da.
Mitologia
Sistema banatuak beti merkeagoak dira zentralizatuak baino.
Errealitatea
Kostua eskalaren eta lan-kargaren araberakoa da neurri handi batean. Hedapen txikiek askotan kostu handiagoa dute banatuta exekutatzeko, sareko eta orkestrazioko gastuengatik. Instalazio zentralizatuak ekonomikoagoak izan daitezke aurreikus daitezkeen lan-karga egonkor etaetarako, eta konfigurazio banatuak bikainak dira eskaera global eta gorakoietarako.
Mitologia
Datu-zentro zentralizatuek ezin dute sistema banatuen fidagarritasun parekatu.
Errealitatea
Gaur egungo instalazio zentralizatuek funtzionamendu-denbora bikaina lortzen dute potentzian, hoztean eta sarean N+1 edo 2N erredundantziari esker. IV. mailako datu-zentroek % 99,995eko erabilgarritasuna bermatzen dute, eta horrek banatutako inplementazio askoren parekoa edo gainditzen du. Fidagarritasuna ingeniaritza-inbertsioaren araberakoa da, ez arkitekturaren araberakoa bakarrik.
Mitologia
Konputazio banatuak errendimendu motelagoa esan nahi du sareko gainkarga dela eta.
Errealitatea
Ondo diseinatutako banatutako sistemek askotan zentralizatutako sistemek baino errendimendu hobea dute erabiltzaile globalentzat, eskaerak sortzen diren tokitik gertuago kokatzen baitute konputazioa. Cachea, datuen partizioa eta ertzeko konputazioa bezalako teknikek arkitektura banatuak azkarragoak egin ditzakete mundu osoko trafikoa zerbitzatzen duen instalazio zentralizatu bakar batek baino.
Sarritan Egindako Galderak
Zein da konputazio banatuaren eta datu-zentro zentralizatuen arteko desberdintasun nagusia?
Banatutako informatikak lan-karga hainbat makinatan banatzen du, eta makina horiek leku desberdinetan egon daitezke, eta datu-zentralizatuen zentroek, berriz, baliabide informatiko guztiak instalazio bakarrean kontzentratzen dituzte. Konpromiso nagusia malgutasun geografikoaren eta funtzionamendu-sinpletasunaren artekoa da. Banatutako sistemek akatsen tolerantzia hobea eskaintzen dute, eta konfigurazio zentralizatuak, berriz, errazago kudeatzen eta ziurtatzen dira.
Zein ikuspegi da eskalagarriagoa?
Banatutako informatika, oro har, errazago eskalatzen da, sareko konexioa duen edozein lekutan nodo berriak gehi daitezkeelako. Datu-zentro zentralizatuek hedapen fisikoa behar dute, eta horrek eraikuntza, energia-hobekuntzak eta hozte-ahalmena dakartza. Hala ere, hipereskalako instalazio zentralizatuak milioi bat zerbitzari baino gehiago hartzeko aukera dute oraindik, beraz, bi ereduek eskala izugarria har dezakete inbertsio nahikoa eginez gero.
Hodeiko konputazioa banatua ala zentralizatua da?
Hodeiko konputazioak bi ereduak nahasten ditu. AWS, Azure eta Google Cloud bezalako hornitzaile handiek hipereskalako datu-zentro zentralizatuak erabiltzen dituzte, baina barruan exekutatzen den softwareak printzipio banatuak erabiltzen ditu, hala nola mikrozerbitzuak, zatikatzea eta erreplikazioa. Azken erabiltzaileek zerbitzu banatu bat bizi dute, azpiko hardwarea campus zentralizatuetan egon arren.
Zeintzuk dira eguneroko bizitzan banatutako konputazioaren adibideak?
Cloudflare bezalako edukien banaketa sareek web edukia banatzen dute ehunka kokapen globaletan. Netflix bezalako streaming zerbitzuek kodeketa eta cache sistema banatuak erabiltzen dituzte. Google bezalako bilatzaileek indexazioa eta kontsulten prozesamendua banatzen dituzte kluster erraldoietan zehar. Zure telefonoak ere printzipio banatuak erabiltzen ditu datuak hainbat datu-zentrotan sinkronizatzean.
Zergatik eraikitzen dituzte oraindik enpresek datu-zentro zentralizatuak?
Instalazio zentralizatuek segurtasun fisiko errazagoa, araudi-betetzea errazagoa eta funtzionamendu-konplexutasun txikiagoa eskaintzen dute. Gainera, erakundeei hoztea, energia eta sarea toki bakarrean optimizatzeko aukera ematen diete, eta horrek kostuak eskala handian murriztu ditzake. Enpresa askok eredu hau nahiago dute aurreikus daitezkeen lan-kargetarako eta jurisdikzio zehatzetan egon behar diren datu sentikorretarako.
Nola desberdintzen da akatsen tolerantzia bi modeloen artean?
Banatutako sistemek hutsegiteak naturalki onartzen dituzte, nodo bat galtzeak ez baitu sistema osoa geldiarazten. Datu-zentro zentralizatuek erredundantzia-neurrien menpe daude, hala nola babeskopia-sorgailuak, sare-bide anitz eta failover klusterrak, fidagarritasun antzekoa lortzeko. Gune zentralizatu batean gertatzen den benetako gertaera katastrofiko batek etenaldi orokorrak eragin ditzake oraindik, eta horregatik erakunde askok lan-karga kritikoak eskualde askotan banatzen dituzte orain.
Zein eredu da hobea datu handietarako eta adimen artifizialerako lan-kargetarako?
Konputazio banatua da datu handien eta adimen artifizialaren estandarra, lan-karga hauek makina askotan zehar prozesatzeko paraleloan oinarritzen direlako. Apache Spark, TensorFlow eta Ray bezalako framework-ak klusterren artean konputazioa banatzeko diseinatuta daude. Datu-zentro zentralizatuek lan-karga hauek ostatatu ditzakete oraindik, baina software-arkitektura bera banatua da.
Zer paper jokatzen du edge computing-ak alderaketa honetan?
Edge computing funtsean erabiltzaileei hurbilago jartzen zaien konputazio banatua da, askotan telefono-dorreetara, lantegietara edo tokiko mikrodatu-zentroetara. Ibilgailu autonomo eta gauzen internet bezalako denbora-sentsible diren aplikazioen latentzia murrizten du. Edge-k hodeiko datu-zentro zentralizatuekin batera funtzionatzen du, prozesamendu astuna zentralizatuta gertatzen delarik eta erantzun azkarrak ertzean kudeatzen direlarik.
Nola alderatzen dira kostuak azpiegitura banatuaren eta zentralizatuaren artean?
Datu-zentro zentralizatuek hasierako kapital handia behar dute eraikinetarako, energiarako eta hozterako, baina funtzionamendu-kostu aurreikusgarriak eskaintzen dituzte. Banatutako sistemek gastua sareetara, orkestrazio-softwarera eta etengabeko koordinaziora bideratzen dute. Inplementazio txiki eta ertainetarako, banatutako hodeiko zerbitzuak normalean merkeagoak dira. Lan-karga egonkor masiboetarako, instalazio zentralizatuek unitate-ekonomia hobea eskain dezakete.
Sistema bat banatua eta zentralizatua izan daiteke aldi berean?
Bai, eta sistema moderno gehienak hala dira. Enpresa batek bere aplikazio nagusiak datu-zentro zentralizatu batean exekutatu ditzake, edukia CDN baten bidez banatzen duen bitartean. Hodei-arkitektura hibridoek azpiegitura zentralizatu pribatua eta hodei-zerbitzu publiko banatuak konbinatzen dituzte. Bi ikuspegiak osagarriak dira elkarren artean baztertzaileak baino, eta erakunde handi gehienek biak erabiltzen dituzte.
Epaia
Aukeratu konputazio banatua eskalagarritasun horizontal masiboa, erredundantzia geografikoa behar duzunean edo datu handien analisia eta blockchain bezalako lan-kargak exekutatzen ari zarenean, eredu deszentralizatu batera naturalki egokitzen direnak. Aukeratu datu-zentro zentralizatuak kontrol fisiko zorrotza, errendimendu aurreikusgarria, betetze errazagoa eta dena teilatu beraren azpian kudeatzearen eraginkortasun operatiboa behar dituzunean. Gaur egun, erakunde askok biak konbinatzen dituzte, barne-software banatuaren ereduetan oinarritzen diren hipereskalako hodei zentralizatuak erabiliz.