cluster

From DCEwiki
Jump to navigation Jump to search
cluster
je seskupení dvou a více fyzických počítačů (nodů), které navenek mohou vystupovat jako jeden subjekt - módně nazývaný cloud
nod
je fyzický stroj (server, PC,..), vybavený pevnými disky (HDD) s alespoň jednou síťovou kartou, který je v interakci s ostatními nody prostřednictvím komunikačního software - tím může být Pacemaker, zookeeper, apod.

Typologie clusteru z hlediska použití[edit]

Výpočetní cluster[edit]

Výpočetní cluster ( angl. HPC - High-performance Computing) využívá výpočetního výkonu jednotlivých nodů, tvořených obvykle stroji nižší cenové kategorie, pro zpracování dílčích matematických operací. Celkový výkon je pak mnohonásobně vyšší než by bylo vůbec možné dosáhnout u jediného fyzického stroje.

Diskový cluster[edit]

Neboli také Storage cluster vytváří jeden virtuální diskový prostor jeho rozložením mezi fyzické disky nodů. Využít pro tento účel lze buď speciálních clusterových souborových systémů ( OCFS2, GFS2, Lustre, CEPH,...), které jsou schopny řešit rozložení zátěže a redundanci dat mezi nody, nebo clusterové verze LVM (cluster).

Poznámka Některé clusterové souborové systémy, jako např. CEPH už při svém návrhu počítají s výpadky nodů, proto ukládají tzv. roztroušená data i s informacemi, které umožňují v případě potřeby dopočítat chybějící bloky dat.

Škálovatelný cluster[edit]

Je spojením nodů, které jsou schopny paralelně poskytovat stejný typ služby. V případě potřeby tak lze rozložit zátěž na více strojů, a takto zabránit přetížení některého z nodů. Tato funkcionalita se angl. označuje jako load ballancing. Protože lze tímto způsobem celkový výkon clusteru podle potřeby navyšovat nebo snižovat, označuje se tento typ clusteru jako škálovatelný (angl. scallable)

Typologie clusteru z hlediska zdrojů[edit]

Výše uvedenou typologii clusterů lze v čisté formě aplikovat pouze na homogenní clusterové prostředí, které nabízí pouze jednu službu (zdroj). V reálu však clusterové prostředí spravuje zdrojů více a navíc je i věšinou sestaveno z nodů různé kvality a s rozdílným hardwarovým vybavením.

Synchronní cluster[edit]

V případě synchronního clusteru může být zdroj poskytován na kterémkoliv nodu, případně z každého nodu současně.

Aby to bylo možné, musí být splněný výchozí předpoklad, že každý z nodů musí mít k dispozici:

  • identickou adresářovou infrastrukturu odpovídající potřebám zdroje
  • identické softwarové vybavení, potřebné k poskytování zdroje
  • identická zařízení potřebná k provozu zdroje.

Asynchronní cluster[edit]

Asynchronní cluster je typicky sestaven z různých nodů, které nemusí být schopny některé zdroje provozovat. Proto je u poskytovaných zdrojů nutné vždy nakonfigurovat lokaci. Pacemaker má v případě takového clusteru především zajistit, aby byly nody informovány zda-li je zdroj A, který potřebují pro zajištění zdroje B dostupný. Aby v případě, že tomu tak není, mohly podniknout příslušné kroky (zastavení zdroje B, restart zdroje A, atd.)

Grid[edit]

Grid někdo rovněž považuje za typ clusteru, ale není tomu tak. Grid sice připomíná svou funkcionalitou výpočetní a datový cluster, ale liší se tím, že jeho výpočetního výkonu není dosaženo paralelizací procesů, nýbrž jejich distribucí.

Stroje, které jsou v gridu, jsou vzájemně nezávislé a společnou mají pouze aplikaci, která rozděluje zpracování úkolu mezi jednotlivé výpočetní jednotky. Těmi nemusí být pouze jednotlivé fyzické servery (nody), ale i jiné clustery. Příkladem praktické implementace gridu může být internetová síť.

Pro grid je - na rozdíl od clusteru, naprosto normální, že se jeho nody průběžně objevují, nebo ztrácejí. Gridové aplikace je navrženy tak, aby s tím počítaly.

Grid svým rozsahem je tedy spíše typem infrastruktury, která navíc může přesáhnout rámec jedné organizace či společnosti.