cloud-computingimprastrakturamga sistemang ipinamamahagimga sentro ng datoskakayahang sumukat
Distributed Computing vs. Centralized Data Centers
Ang distributed computing ay nagpapakalat ng mga workload sa maraming magkakaugnay na makina, habang ang mga sentralisadong data center ay nagtutuon ng lakas ng pagproseso sa iisang pisikal na pasilidad. Parehong pinapagana ng mga pamamaraan ang mga modernong serbisyo sa cloud, ngunit malaki ang pagkakaiba ng mga ito sa scalability, fault tolerance, at cost structure.
Mga Naka-highlight
Tinatanggal ng mga distributed system ang mga single point of failure sa pamamagitan ng pagkalat ng trabaho sa maraming node.
Ang mga sentralisadong data center ay nag-aalok ng mas simpleng pamamahala at mas malakas na pisikal na kontrol sa seguridad.
Ang distributed computing ay nag-i-scale nang pahalang sa pamamagitan ng pagdaragdag ng mga node, habang ang mga sentralisadong modelo ay nag-i-scale nang patayo.
Pinagsasama ng mga modernong cloud platform tulad ng AWS at Azure ang parehong arkitektura sa likod ng mga eksena.
Ano ang Ipinamamahaging Kompyuter?
Isang modelo kung saan ang mga gawain sa pagproseso ay nahahati sa maraming magkakaugnay na computer na nagtutulungan bilang isang pinag-isang sistema.
Nagmula noong dekada 1960 at 1970 kasama ang ARPANET, isa sa mga pinakaunang praktikal na distributed network.
Umaasa sa maraming makina na nakikipag-ugnayan sa pamamagitan ng isang network upang magbahagi ng komputasyon, imbakan, at mga serbisyo.
Kabilang sa mga sikat na halimbawa noong unang panahon ang SETI@home, na gumamit ng mga boluntaryong computer sa bahay upang suriin ang datos ng teleskopyo sa radyo.
Kabilang sa mga modernong implementasyon ang Apache Hadoop at Apache Spark, na idinisenyo para sa pagproseso ng malalaking dataset sa iba't ibang kumpol.
Ang mga blockchain network tulad ng Bitcoin ay gumagana bilang mga desentralisadong distributed system na walang sentral na awtoridad.
Ano ang Mga Sentralisadong Sentro ng Datos?
Isang tradisyonal na modelo ng imprastraktura kung saan ang lahat ng mga mapagkukunan ng computing ay nakalagay sa isang nakalaang pasilidad.
Pinasikat ng mga Mainframe ang sentralisadong modelo noong dekada 1960, na nagsisilbi sa libu-libong gumagamit mula sa iisang lokasyon.
Ang mga modernong pasilidad na hyperscale ay maaaring maglaman ng mahigit 1 milyong server sa isang gusali lamang.
Ang mga kumpanyang tulad ng Equinix, Google, at Amazon ay nagpapatakbo ng mga sentralisadong kampus na nagpapagana ng mga serbisyo sa cloud.
Ang mga sentralisadong pasilidad ay karaniwang nakakamit ng mga rating ng power usage effectiveness (PUE) sa pagitan ng 1.1 at 1.5.
Pinapasimple ng modelo ang pamamahala, pag-awdit ng seguridad, at pagsunod sa mga regulasyon sa pamamagitan ng pisikal na pagsasama-sama.
Talahanayang Pagkukumpara
Tampok
Ipinamamahaging Kompyuter
Mga Sentralisadong Sentro ng Datos
Arkitektura
Maraming node sa iba't ibang lokasyon
Isang pasilidad o kampus
Kakayahang sumukat
Pahalang, magdagdag ng mga node kahit saan
Patayo, palawakin ang kapasidad ng pasilidad
Pagpaparaya sa Pagkakamali
Mataas, walang iisang punto ng pagkabigo
Mas mababa, depende sa disenyo ng kalabisan
Pagkaantala
Pabagu-bago, depende sa kalapitan ng node
Pare-pareho sa loob ng pasilidad
Pagiging Komplikado ng Pamamahala
Mas mataas, nangangailangan ng mga tool sa orkestrasyon
Mas mababa at sentralisadong administrasyon
Modelo ng Seguridad
Ipinamamahaging tiwala at pag-encrypt
Pisikal na perimeter at kontrol sa pag-access
Karaniwang mga Kaso ng Paggamit
Malaking datos, blockchain, edge computing
Mga app para sa negosyo, cloud hosting, SaaS
Istruktura ng Gastos
Mas mababang gastos sa hardware, mas mataas na networking
Mas mataas na gastos sa pasilidad, nahuhulaang operasyon
Detalyadong Paghahambing
Arkitektura at Pisikal na Layout
Ang distributed computing ay kumakalat ng pagproseso sa maraming makina na maaaring nasa iba't ibang lungsod, bansa, o maging sa mga kontinente. Ang mga node na ito ay nakikipag-ugnayan sa pamamagitan ng mga karaniwang protocol ng network at nagkokoordina ng trabaho sa pamamagitan ng mga consensus algorithm o mga pattern ng master-worker. Ang mga sentralisadong data center ay gumagamit ng kabaligtaran na pamamaraan, na pinagsasama-sama ang libu-libong server sa isang gusali na may maingat na kinokontrol na paglamig, kuryente, at koneksyon. Ang pisikal na konsentrasyon ay ginagawang madali ang pagpapanatili ng hardware ngunit lumilikha ng isang heograpikong dependency.
Kakayahang Iskalahin at Paglago
Kapag tumaas ang demand, ang mga distributed system ay maaaring magdagdag ng higit pang mga node sa cluster, kadalasan sa iba't ibang rehiyon upang mapaglingkuran ang mga user na mas malapit sa kanila. Ang horizontal scaling na ito ay may posibilidad na maging mas flexible at cost-effective sa malawakang saklaw. Ang mga sentralisadong pasilidad ay nag-i-scale nang patayo sa pamamagitan ng pagdaragdag ng higit pang mga server, rack, o kahit na pagbuo ng mga bagong wing, na nangangailangan ng malaking puhunan sa kapital at lead time. Kadalasang pinagsasama ng mga cloud provider ang parehong modelo, gamit ang mga centralized hyperscale campus na internal na umaasa sa mga distributed software architecture.
Kahusayan at Pagpaparaya sa Pagkakamali
Ang mga distributed system ay likas na mas matatag dahil ang pagkabigo ng isang node ay bihirang magpabagsak sa buong network. Ang mga serbisyo tulad ng search infrastructure ng Google o ang DynamoDB ng Amazon ay idinisenyo upang patuloy na tumakbo kahit na mag-crash ang mga indibidwal na makina. Ang mga centralized data center ay maaaring makamit ang katulad na pagiging maaasahan sa pamamagitan ng mga kalabisan na power supply, backup generator, at failover cluster, ngunit ang isang kapaha-pahamak na kaganapan tulad ng sunog o baha sa pangunahing site ay maaari pa ring magdulot ng malalaking pagkawala ng kuryente. Ang 2017 S3 outage sa AWS ay nagpakita kung paano maaaring makaapekto ang isang isyu sa isang pasilidad sa hindi mabilang na mga serbisyo.
Pagganap at Latency
Karaniwang naghahatid ang mga sentralisadong data center ng pare-parehong latency para sa mga user na kumokonekta sa iisang rehiyon, dahil lahat ng server ay gumagamit ng iisang lokal na network. Minsan, ang mga distributed system ay maaaring magdulot ng pabagu-bagong latency dahil ang mga node ay kailangang makipag-ugnayan sa mas malalayong distansya, bagama't ang mga variant ng edge computing ay talagang nakakabawas ng latency sa pamamagitan ng paglalagay ng compute nang mas malapit sa mga end user. Para sa mga workload tulad ng high-frequency trading o real-time video processing, ang heograpikong pagkakalagay ng mga compute resources ay napakahalaga, kaya naman pinagsasama ng mga content delivery network ang parehong pamamaraan.
Gastos at Operasyong Pangkalahatan
Ang pagpapatakbo ng isang sentralisadong pasilidad ay kinabibilangan ng malalaking nakapirming gastos: real estate, mga sistema ng pagpapalamig, pisikal na seguridad, at nakalaang imprastraktura ng kuryente. Ang mga gastusing ito ay nahuhulaan ngunit nangangailangan ng malaking paunang kapital. Ang distributed computing ay naglilipat ng paggastos patungo sa networking, orchestration software, at patuloy na koordinasyon sa pagitan ng mga node. Para sa mga organisasyong walang badyet para magtayo ng data center, ang pagrenta ng mga distributed cloud resources mula sa mga provider tulad ng AWS o Azure ay kadalasang mas matipid kaysa sa pagtatayo ng sarili nilang sentralisadong pasilidad.
Seguridad at Pagsunod
Pinapasimple ng mga sentralisadong data center ang mga compliance audit dahil ang sensitibong data ay nasa isang kilalang lokasyon na may kontroladong pisikal na access. Kadalasang mas gusto ng mga regulated na industriya tulad ng pagbabangko at pangangalagang pangkalusugan ang modelong ito dahil sa kadahilanang iyon. Pinapahirap ng mga distributed system ang pagsunod dahil ang data ay maaaring nasa maraming hurisdiksyon, bawat isa ay may iba't ibang batas sa privacy. Gayunpaman, ang mga distributed architecture ay maaaring mapabuti ang seguridad laban sa ilang partikular na pag-atake, dahil ang pagkompromiso sa isang node ay hindi naglalantad sa buong sistema. Ang mga modernong encryption at zero-trust framework ay nakakatulong na tulayin ang agwat sa pagitan ng dalawang pamamaraang ito.
Mga Kalamangan at Kahinaan
Ipinamamahaging Kompyuter
Mga Bentahe
+Mataas na pagpapaubaya sa pagkakamali
+Kakayahang umangkop sa heograpiya
+Pahalang na kakayahang sumukat
+Mas mababang panganib sa iisang lugar
Nakumpleto
−Komplikadong orkestrasyon
−Mga isyu sa latency ng network
−Mas mahirap na pagsunod
−Mga hamon sa pag-debug
Mga Sentralisadong Sentro ng Datos
Mga Bentahe
+Mas madaling pamamahala
+Malakas na pisikal na seguridad
+Nahuhulaang pagganap
+Pinasimpleng pagsunod
Nakumpleto
−Isang punto ng pagkabigo
−Mataas na gastos sa kapital
−Heograpikong latency
−Pag-scale ng mga bottleneck
Mga Karaniwang Maling Akala
Alamat
Ang distributed computing ay palaging nangangahulugang blockchain o cryptocurrency.
Katotohanan
Ang distributed computing ay isang malawak na larangan na nauna pa sa blockchain nang ilang dekada. Kabilang dito ang cluster computing, grid computing, microservices, at content delivery networks. Ang Blockchain ay isa lamang espesyalisadong aplikasyon ng mga distributed principles, na nakatuon sa consensus nang walang sentral na awtoridad.
Alamat
Hindi na ginagamit ang mga sentralisadong data center sa panahon ng cloud.
Katotohanan
Ang mga sentralisadong pasilidad ay buhay na buhay at bumubuo sa gulugod ng bawat pangunahing provider ng cloud. Ang AWS, Microsoft Azure, at Google Cloud ay pawang nagpapatakbo ng malalaking sentralisadong kampus na naglalaman ng milyun-milyong server. Ang cloud ay mahalagang sentralisadong imprastraktura na inuupahan sa mga distributed application.
Alamat
Ang mga distributed system ay palaging mas mura kaysa sa mga sentralisado.
Katotohanan
Ang gastos ay lubos na nakadepende sa laki at workload. Ang maliliit na deployment ay kadalasang mas mahal para patakbuhin ang distributed dahil sa networking at orchestration overhead. Ang mga sentralisadong pasilidad ay maaaring maging mas matipid para sa predictable at stable na workload, habang ang mga distributed setup ay mahusay para sa matarik at pandaigdigang demand.
Alamat
Hindi kayang tapatan ng mga sentralisadong data center ang pagiging maaasahan ng mga distributed system.
Katotohanan
Nakakamit ng mga modernong sentralisadong pasilidad ang kahanga-hangang uptime sa pamamagitan ng N+1 o 2N redundancy sa kuryente, pagpapalamig, at networking. Ginagarantiyahan ng mga Tier IV data center ang 99.995% na availability, na kapantay o nahihigitan ang maraming distributed deployment. Ang pagiging maaasahan ay nakasalalay sa pamumuhunan sa inhinyeriya, hindi lamang sa arkitektura.
Alamat
Ang distributed computing ay nangangahulugan ng mas mabagal na pagganap dahil sa network overhead.
Katotohanan
Ang mga mahusay na dinisenyong distributed system ay kadalasang mas mahusay kaysa sa mga sentralisadong sistema para sa mga pandaigdigang gumagamit dahil inilalagay nila ang compute nang mas malapit sa kung saan nagmumula ang mga kahilingan. Ang mga pamamaraan tulad ng caching, data partitioning, at edge computing ay maaaring gawing mas mabilis ang mga distributed architecture kaysa sa isang sentralisadong pasilidad na nagseserbisyo sa pandaigdigang trapiko.
Mga Madalas Itanong
Ano ang pangunahing pagkakaiba sa pagitan ng distributed computing at centralized data center?
Hinahati ng distributed computing ang mga workload sa maraming makina na maaaring matatagpuan sa iba't ibang lugar, habang ang mga sentralisadong data center ay nagkokonsentra sa lahat ng mga mapagkukunan ng computing sa iisang pasilidad. Ang pangunahing kompromiso ay sa pagitan ng geographic flexibility at operational simpleness. Ang mga distributed system ay nag-aalok ng mas mahusay na fault tolerance, habang ang mga sentralisadong setup ay mas madaling pamahalaan at i-secure.
Aling pamamaraan ang mas malawak ang sakop?
Ang distributed computing sa pangkalahatan ay mas madaling i-scale dahil maaari kang magdagdag ng mga bagong node kahit saan na may koneksyon sa network. Ang mga sentralisadong data center ay nangangailangan ng pisikal na pagpapalawak, na kinabibilangan ng konstruksyon, mga pag-upgrade ng kuryente, at kapasidad ng paglamig. Gayunpaman, ang mga hyperscale centralized facility ay maaari pa ring lumaki upang maglaman ng mahigit isang milyong server, kaya ang parehong modelo ay maaaring umabot sa napakalaking saklaw na may sapat na pamumuhunan.
Ang cloud computing ba ay ipinamamahagi o sentralisado?
Pinagsasama ng cloud computing ang dalawang modelo. Ang mga pangunahing provider tulad ng AWS, Azure, at Google Cloud ay nagpapatakbo ng mga centralized hyperscale data center, ngunit ang software na tumatakbo sa loob ng mga ito ay gumagamit ng mga distributed na prinsipyo tulad ng mga microservice, sharding, at replication. Nararanasan ng mga end user ang isang distributed service kahit na ang pinagbabatayan na hardware ay nasa mga centralized campus.
Ano ang mga halimbawa ng distributed computing sa pang-araw-araw na buhay?
Ang mga network ng paghahatid ng nilalaman tulad ng Cloudflare ay namamahagi ng nilalaman sa web sa daan-daang pandaigdigang lokasyon. Ang mga serbisyo ng streaming tulad ng Netflix ay gumagamit ng mga distributed encoding at caching system. Ang mga search engine tulad ng Google ay namamahagi ng indexing at query processing sa malalaking cluster. Kahit ang iyong smartphone ay gumagamit ng mga distributed na prinsipyo kapag nagsi-sync ng data sa maraming data center.
Bakit pa rin nagtatayo ang mga kumpanya ng mga sentralisadong data center?
Ang mga sentralisadong pasilidad ay nag-aalok ng mas madaling pisikal na seguridad, mas simpleng pagsunod sa mga regulasyon, at mas mababang kasalimuotan sa operasyon. Pinapayagan din nito ang mga organisasyon na i-optimize ang pagpapalamig, kuryente, at networking sa isang lokasyon, na maaaring makabawas sa mga gastos nang malawakan. Mas gusto ng maraming negosyo ang modelong ito para sa mga nahuhulaang workload at sensitibong data na dapat manatili sa loob ng mga partikular na hurisdiksyon.
Paano nagkakaiba ang fault tolerance sa pagitan ng dalawang modelo?
Natural na kinukunsinti ng mga distributed system ang mga pagkabigo dahil ang pagkawala ng isang node ay hindi nangangahulugang hihinto ang buong sistema. Ang mga centralized data center ay umaasa sa mga redundancy measure tulad ng mga backup generator, maraming network path, at failover cluster upang makamit ang katulad na reliability. Ang isang tunay na sakuna sa isang sentralisadong site ay maaari pa ring magdulot ng malawakang pagkawala ng kuryente, kaya naman maraming organisasyon ngayon ang namamahagi ng mga kritikal na workload sa maraming rehiyon.
Aling modelo ang mas mainam para sa mga workload na gumagamit ng malaking data at AI?
Ang distributed computing ang pamantayan para sa big data at AI dahil ang mga workload na ito ay nakikinabang mula sa parallel processing sa maraming makina. Ang mga framework tulad ng Apache Spark, TensorFlow, at Ray ay idinisenyo upang ipamahagi ang computation sa mga cluster. Maaari pa ring i-host ng mga centralized data center ang mga workload na ito, ngunit ang mismong arkitektura ng software ay distributed.
Ano ang papel na ginagampanan ng edge computing sa paghahambing na ito?
Ang edge computing ay mahalagang distributed computing na inilalapit sa mga end user, kadalasan sa mga cell tower, pabrika, o lokal na micro data center. Binabawasan nito ang latency para sa mga time-sensitive na application tulad ng mga autonomous vehicle at IoT. Gumagana ang Edge kasama ng mga centralized cloud data center, kung saan ang mabibigat na pagproseso ay nangyayari nang sentralisado at ang mabilis na mga tugon ay hinahawakan sa edge.
Paano pinaghahambing ang mga gastos sa pagitan ng ipinamahaging imprastraktura at sentralisadong imprastraktura?
Ang mga sentralisadong data center ay nangangailangan ng malaking paunang kapital para sa mga gusali, kuryente, at pagpapalamig, ngunit nag-aalok ng mga mahuhulaang gastos sa pagpapatakbo. Ang mga distributed system ay naglilipat ng paggastos patungo sa networking, orchestration software, at patuloy na koordinasyon. Para sa maliliit hanggang katamtamang laki ng mga deployment, ang mga distributed cloud service ay karaniwang mas mura. Para sa napakalaking steady-state workload, ang mga sentralisadong pasilidad ay maaaring mag-alok ng mas mahusay na unit economics.
Maaari bang maging parehong distributed at centralized ang isang sistema?
Oo, at karamihan sa mga modernong sistema ay ganoon. Maaaring patakbuhin ng isang kumpanya ang mga pangunahing aplikasyon nito sa isang sentralisadong data center habang namamahagi ng nilalaman sa pamamagitan ng isang CDN. Pinagsasama ng mga arkitektura ng hybrid cloud ang pribadong sentralisadong imprastraktura at mga pampublikong ipinamamahaging serbisyo sa cloud. Ang dalawang pamamaraan ay komplementaryo sa halip na magkahiwalay, at karamihan sa malalaking organisasyon ay gumagamit ng pareho.
Hatol
Pumili ng distributed computing kapag kailangan mo ng napakalaking horizontal scalability, geographic redundancy, o nagpapatakbo ng mga workload tulad ng big data analytics at blockchain na natural na akma sa isang desentralisadong modelo. Pumili ng mga centralized data center kapag kailangan mo ng mahigpit na pisikal na kontrol, mahuhulaang pagganap, mas simpleng pagsunod, at ang kahusayan sa pagpapatakbo ng pamamahala ng lahat sa ilalim ng iisang bubong. Maraming organisasyon ngayon ang pinagsasama ang pareho, gamit ang mga centralized hyperscale cloud na internal na umaasa sa mga distributed software pattern.