Prvky diskových subsystémov serverov

Diskové a súborové podsystémy počítača zvyčajne nie sú predmetom špeciálnej pozornosti používateľov. Winchester je pomerne spoľahlivá vec a funguje akoby sám o sebe, bez toho, aby na seba upútal pozornosť bežného používateľa.

Zvládnutím základných techník práce so súbormi a priečinkami ich takýto používateľ privedie k plnej automatizácii bez toho, aby premýšľal o existencii ďalších nástrojov na údržbu pevného disku. Správa diskov je úplne presunutá na operačný systém.

Ťažkosti začínajú buď vtedy, keď súborový systém vykazuje jasné zníženie výkonu, alebo keď začne zlyhávať. Ďalší dôvod na bližšie štúdium tejto témy: inštalácia niekoľkých "skrutiek" na PC súčasne.

Ako každé zložité zariadenie, aj pevný disk potrebuje pravidelnú údržbu. Windows 7, aj keď sa o niektoré z týchto starostí stará, nedokáže za vás vyriešiť všetky problémy sám. Inak sú "brzdy" časom zaručené. Minimálne musíte byť schopní robiť tieto veci:

Vyčistite súborový systém od odpadu. Koncept odpadu zahŕňa dočasné súbory, súbory cookie prehliadača, ktoré sa množili, duplicitné informácie atď.
Defragmentujte svoj pevný disk. Súborový systém Windows je zostavený tak, že to, čo používateľ vidí ako celok, sú v skutočnosti samostatné fragmenty súborov roztrúsené po magnetickom povrchu pevného disku, spojené v reťazci: každý predchádzajúci fragment pozná každý ďalší. Na prečítanie súboru ako celku je potrebné tieto časti poskladať, na čo je potrebné vykonať veľké množstvo cyklov čítania z rôznych miest na povrchu. To isté sa deje pri nahrávaní. Defragmentácia umožňuje zhromaždiť všetky tieto kúsky na jednom mieste.
Zobrazte a opravte informácie o sekcii.
Byť schopný otvoriť prístup k skrytým a systémovým súborom a priečinkom.
V prípade potreby vedieť pracovať s viacerými „skrutkami“ naraz.

A tiež vykonať niektoré ďalšie užitočné akcie. V našej poznámke nebudeme diskutovať o celom rozsahu týchto problémov, ale budeme sa venovať iba niektorým.

Ako čítať informácie o oddieloch?

Pre tých, ktorí nie sú oboznámení, dáme vysvetlenie: v systéme Windows existuje niečo ako "snap".

Je to spustiteľný súbor .msc, ktorý beží ako normálny exe. Všetky moduly snap-in majú jednotné rozhranie a sú postavené na technológii COM – základ vnútornej štruktúry tohto operačného systému.

Okno Správa diskov je tiež hračkou. Môžete ho spustiť tak, že do okna „Spustiť“ napíšete jeho názov diskmgmt.msc, ako je znázornené na nasledujúcom obrázku:

V dôsledku toho budeme mať okno samotného modulu snap-in s nadpisom „Správa diskov“. Táto aplikácia vyzerá takto:

Toto rozhranie je intuitívne a jednoduché. V hornom paneli okna vidíme zoznam všetkých zväzkov (alebo oddielov) na „skrutke“ so súvisiacimi informáciami o nich, ako napríklad:

Názov sekcie.
Typ sekcie.
Jeho plná kapacita.
Jeho stav (rôzne sekcie môžu mať rôzny stav).
Zostávajúce voľné miesto vyjadrené v gigabajtoch a percentách z celku.

A ďalšie informácie. Spodný panel obsahuje zoznam jednotiek a oddielov. Odtiaľ môžete vykonávať operácie so zväzkami a jednotkami. Ak to chcete urobiť, kliknite pravým tlačidlom myši na názov zväzku a vyberte konkrétnu operáciu z podponuky "Akcie".

Hlavnou výhodou rozhrania je, že všetko sa tu zhromažďuje v skupine - nie je potrebné prechádzať rôznymi ponukami a oknami, aby sme mohli realizovať naše plány.

Objemové operácie

Poďme analyzovať niektoré neočividné operácie s oddielmi. Po prvé, poďme diskutovať o prechode z formátu MBR na formát GPT. Oba tieto formáty zodpovedajú rôznym typom zavádzačov. MBR je klasický, ale už zastaraný formát zavádzača.

Má explicitné obmedzenia v objeme zväzku (nie viac ako 2 TB) aj v počte zväzkov - nie sú podporované viac ako štyri. Nezamieňajte objem a sekciu - ide o trochu odlišné pojmy. Prečítajte si o ich rozdieloch na internete. Formát GPT je založený na technológii GUID a nemá tieto obmedzenia.

Ak teda máte veľký disk, pokojne si preveďte MBR na GPT. Je pravda, že v tomto prípade budú všetky údaje na disku zničené - bude potrebné ich skopírovať na iné miesto.

Virtualizačná technológia prenikla všade. Neobišiel ani súborový systém. Ak chcete, môžete vytvoriť a pripojiť takzvané „virtuálne disky“.

Takéto „zariadenie“ je bežný súbor .vhd a možno ho použiť ako bežné fyzické zariadenie – na čítanie aj zápis.

To otvára ďalšie možnosti katalogizácie informácií. Týmto sa náš príbeh končí. Správa diskov v systéme Windows 7 je pomerne široká téma a ponorením sa do nej môžete objaviť množstvo nových vecí.

16.01.1997 Patrick Corrigan, Mickey Applebaum

Možnosti konfigurácie diskových podsystémov servera sú rôznorodé a v dôsledku toho je nevyhnutný zmätok. Aby sme vám pomohli pochopiť tento zložitý problém, rozhodli sme sa zvážiť hlavné technológie a ekonomickú realizovateľnosť ich aplikácie. DISK

Možnosti konfigurácie diskových podsystémov servera sú rôznorodé a v dôsledku toho je nevyhnutný zmätok. Aby sme vám pomohli pochopiť tento zložitý problém, rozhodli sme sa zvážiť hlavné technológie a ekonomickú realizovateľnosť ich aplikácie.

V prípade serverových diskových podsystémov máte na výber veľa možností, no pre veľké množstvo je ťažké nájsť systém, ktorý vám najlepšie vyhovuje. Situáciu komplikuje fakt, že pri výberovom konaní sa budete musieť potýkať so značným množstvom nepravdivých informácií a marketingového humbuku.

Prehľad hlavných technológií serverových diskových subsystémov a diskusia o vhodnosti ich použitia z hľadiska nákladov, výkonu, spoľahlivosti a odolnosti voči chybám by mali pomôcť pochopiť podstatu tohto problému.

ROZHRANIA DISKU

Či už určujete nový server alebo inovujete existujúci server, rozhranie disku je kritickým problémom. Väčšina diskov dnes používa rozhrania SCSI alebo IDE. Pozrieme sa na obe technológie, popíšeme ich implementáciu a prediskutujeme, ako fungujú.

SCSI je štandardizované rozhranie ANSI, ktoré má niekoľko variácií. Pôvodná špecifikácia SCSI, teraz nazývaná SCSI-I, používa 8-bitový dátový kanál s maximálnou dátovou rýchlosťou 5 Mbps. SCSI-2 umožňuje niekoľko variácií, vrátane Fast SCSI s 8-bitovým dátovým kanálom a prenosovou rýchlosťou až 10 Mbps; Široký SCSI so 16-bitovým dátovým kanálom a prenosovou rýchlosťou až 10 Mbps; a Fast/Wide SCSI so 16-bitovým dátovým spojením a prenosovou rýchlosťou až 10 Mbps (pozri tabuľku 1).

TABUĽKA 1 - MOŽNOSTI SCSI

SCSI-1	Maximálny výkon	Šírka kanála	Frekvencia	Počet zariadení*
SCSI-1	5 Mbps	8 číslic	5 MHz	8
SCSI-2
Rýchle SCSI	10 Mbps	8 číslic	10 MHz	8
Rýchle/široké SCSI	20 Mbps	16 číslic	10 MHz	8; 16**

* podporované zariadenia zahŕňajú HBA ** s nevyváženým výstupným signálom; diferenciál

S príchodom „širokého“ 16-bitového Fast/Wide SCSI boli 8-bitové verzie niekedy označované ako „úzke“ – Narrow SCSI. Nedávno sa objavilo niekoľko ďalších implementácií SCSI: Ultra SCSI, Wide Ultra SCSI a SCSI-3. V porovnaní s bežnejšími možnosťami majú tieto rozhrania určitú výkonnostnú výhodu, no keďže zatiaľ nie sú veľmi rozšírené (počet zariadení využívajúcich tieto rozhrania je veľmi obmedzený), nebudeme sa im v tomto článku venovať.

Káblový systém SCSI-I je linková zbernica s možnosťou pripojenia až ôsmich zariadení vrátane adaptéra hostiteľskej zbernice (HBA). Tento dizajn zbernice sa nazýva SCSI SCSI s jedným koncom a dĺžka kábla môže byť až deväť metrov. SCSI-2 (prakticky nahrádza SCSI-I) podporuje jednokoncové SCSI aj diferenciálne SCSI. Diferenciálne SCSI používa inú metódu signalizácie ako jednokoncové SCSI a podporuje až 16 zariadení v slučke dlhej až 25 metrov. Poskytuje lepšie potlačenie hluku, čo v mnohých prípadoch znamená lepší výkon.

Jeden problém s rozdielnym SCSI je kompatibilita zariadení. Napríklad v súčasnosti existuje obmedzený počet rôznych páskových jednotiek kompatibilných so systémom SCSI a jednotiek CD-ROM. Diferenciálne zariadenia a HBA sú zvyčajne o niečo drahšie ako zariadenia s jedným zakončením, ale majú tú výhodu, že podporujú viac zariadení na kanál, dlhšie slučky a v niektorých prípadoch lepší výkon.

Pri výbere zariadení SCSI by ste si mali byť vedomí problémov s kompatibilitou. Jednostranné SCSI a diferenciálne SCSI môžu používať rovnaké zapojenie, ale jednokoncové zariadenia a rozdielové zariadenia nemožno kombinovať. Wide SCSI používa iný systém kabeláže ako Narrow SCSI, takže nie je možné používať Wide SCSI a Narrow SCSI zariadenia na rovnakom kanáli.

AKO FUNGUJE SCSI

V SCSI sú radič zariadenia (napríklad radič disku) a rozhranie s počítačom rôzne zariadenia. Počítačové rozhranie, HBA, pridáva do počítača ďalšiu zbernicu rozhrania na pripojenie viacerých radičov zariadení: až sedem radičov zariadení na jednokoncovom prepojení SCSI a až 15 na rozdielovom prepojení. Technicky môže každý ovládač podporovať až štyri zariadenia. Pri vysokých prenosových rýchlostiach dnešných vysokokapacitných diskov je však ovládač zariadenia zvyčajne zabudovaný do disku, aby sa znížil hluk a elektrický šum. To znamená, že môžete mať až sedem jednotiek na jednokoncovom prepojení SCSI a až 15 na rozdielovom prepojení SCSI.

Jednou z výhod SCSI je spracovanie viacerých, prekrývajúcich sa príkazov. Táto prekrývajúca sa podpora I/O dáva jednotkám SCSI možnosť plne zmiešať ich čítanie a zápis s inými jednotkami v systéme, takže rôzne jednotky môžu spracovávať príkazy paralelne namiesto jednej jednotky naraz.

Keďže všetka inteligencia rozhrania disku SCSI sa nachádza v HBA, HBA riadi prístup OS k diskom. Výsledkom je, že konflikty prekladu a prístupu k zariadeniu rieši HBA, nie počítač. Vo všeobecnosti to znamená, že za predpokladu, že sa použijú správne napísané a nainštalované ovládače, počítač a OS nevidia medzi zariadeniami žiadny rozdiel.

Okrem toho, keďže HBA riadi prístup medzi internou rozširujúcou zbernicou počítača a zbernicou SCSI, dokáže vyriešiť konflikty prístupu k obom z nich poskytovaním pokročilých funkcií, ako je služba prerušenia/obnovy spojenia. Break/Recovery umožňuje operačnému systému odoslať príkaz na vyhľadanie, čítanie alebo zápis do konkrétneho zariadenia, po čom je disk ponechaný na vykonanie príkazu sám, takže príkaz môže medzitým prijať iný disk na rovnakom kanáli. Tento proces výrazne zlepšuje priepustnosť diskových kanálov s viac ako dvoma diskami, najmä ak sú údaje pruhované alebo rozptýlené po diskoch. Ďalšou vylepšenou funkciou je synchrónna výmena dát, čím sa zvýši celková priepustnosť diskového kanála a integrita dát.

IDE

IDE je de facto štandard široko používaný v počítačoch založených na x86. Toto je len všeobecné odporúčanie pre výrobcov, takže každý mohol slobodne vyvinúť špecifické IDE pre svoje zariadenia a adaptéry. V dôsledku toho sa produkty od rôznych výrobcov a dokonca aj rôzne modely toho istého výrobcu ukázali ako navzájom nekompatibilné. Keď sa špecifikácia ustálila, tento problém takmer zmizol, no nekompatibilita je stále možná.

Na rozdiel od SCSI, IDE umiestňuje inteligenciu na disk a nie na HBA. HBA pre IDE má malú až žiadnu inteligenciu a jednoducho priamo vysiela zbernicu počítača na disky. Bez medziľahlého rozhrania je počet zariadení na jednom kanáli IDE obmedzený na dve a dĺžka kábla je obmedzená na tri metre.

Keďže všetka inteligencia zariadení IDE spočíva na samotných zariadeniach, jedno zo zariadení na kanáli je priradené ako master kanála a vstavaný radič na druhom je deaktivovaný a stáva sa podriadeným (chanell slave). Hlavné zariadenie riadi prístup cez kanál IDE k obom zariadeniam a vykonáva pre ne všetky I/O operácie. Toto je jedna z možností konfliktu medzi zariadeniami v dôsledku rôznych dodávateľov implementácií rozhrania IDE. Napríklad jeden disk môže byť navrhnutý tak, aby pracoval s konkrétnou schémou ovládača, ale hostiteľ, ku ktorému je pripojený, môže používať iný typ ovládača. Okrem toho novšie jednotky Enhanced IDE (EIDE) používajú rozšírenú sadu príkazov a prekladových tabuliek na podporu jednotiek s väčšou kapacitou a vyšším výkonom. Ak sú pripojené k starému štandardu, hlavnému disku IDE, nielenže stratia svoje pokročilé funkcie, ale nemusia vám poskytnúť celú svoju dostupnú kapacitu. Horšie je, že môžu nahlásiť svoju plnú kapacitu OS bez toho, aby ju mohli použiť, čím by mohli poškodiť informácie na disku.

Možnosť poškodenia údajov je spôsobená tým, že každý operačný systém vníma informácie o konfigurácii disku po svojom. Napríklad DOS a systém BIOS umožňujú maximálnu kapacitu disku iba 528 MB. NetWare a iné 32-bitové systémy nemajú tieto obmedzenia a sú schopné čítať celú jednotku IDE priamo cez svoju elektroniku. Keď na jednom disku vytvoríte viacero partícií rôznych operačných systémov, každá z nich vidí kapacitu a konfiguráciu inak, čo môže viesť k prekrývaniu tabuliek partícií, čo následne výrazne zvyšuje riziko straty dát na disku.

Pôvodná architektúra IDE nerozpoznáva disky väčšie ako 528 MB a môže podporovať iba dve zariadenia na kanál s maximálnou prenosovou rýchlosťou 3 Mbps. Na prekonanie niektorých obmedzení IDE bola v roku 1994 predstavená architektúra EIDE. EIDE podporuje vyššiu kapacitu a výkon, ale jeho prenosové rýchlosti 9 až 16 Mbps sú stále pomalšie ako SCSI. Na rozdiel od 15 zariadení na kanál pre SCSI môže podporovať maximálne štyri na kanál. Všimnite si tiež, že ani IDE, ani EIDE neposkytujú funkciu multitaskingu. A preto nemôžu poskytovať rovnakú úroveň výkonu ako rozhrania SCSI v typickom serverovom prostredí.

Hoci bol štandard IDE pôvodne navrhnutý pre disky, teraz podporuje páskové jednotky a disky CD-ROM. Rozdelenie kanála pomocou jednotky CD-ROM alebo páskovej jednotky však môže nepriaznivo ovplyvniť výkon disku. Celkovo možno povedať, že výhody výkonu a škálovateľnosti SCSI z neho robia lepšiu voľbu ako IDE alebo EIDE pre väčšinu špičkových serverových aplikácií, ktoré vyžadujú vysoký výkon. Avšak pre aplikácie základnej úrovne, kde výkon alebo rozšíriteľnosť nie je veľký problém, postačí IDE alebo EIDE. Zároveň, ak potrebujete redundanciu disku, potom IDE nie je najlepšou voľbou kvôli potenciálnym problémom spojeným s prístupom master-slave. Okrem toho by ste sa mali mať na pozore pred možným prekrývaním tabuľky oddielov a problémami s nekompatibilitou zariadení master-slave.

Existuje však niekoľko prípadov, keď sa rozhrania IDE a EIDE dajú použiť na serveroch vyššej kategórie. Bežnou praxou je napríklad použitie malej jednotky IDE pre oblasť DOS na serveroch NetWare. Na sťahovanie softvéru sa tiež bežne používa mechanika CD-ROM s rozhraním IDE.

SYSTÉMY REDUNDANTNÝCH DISKOV

Ďalšou dôležitou otázkou, ktorú treba prediskutovať pri definovaní špecifikácie servera, je redundancia. Existuje niekoľko metód na zlepšenie spoľahlivosti viacdiskového diskového systému. Väčšina z týchto schém redundancie sú varianty RAID (skratka pre "Redundantné pole lacných alebo nezávislých diskov"). Pôvodná špecifikácia RAID bola navrhnutá tak, aby nahradila veľké, drahé mainframové a minipočítačové disky poliami malých, lacných diskov navrhnutých pre minipočítače – preto slovo „lacné“. Bohužiaľ, v systémoch RAID zriedka vidíte niečo lacné.

RAID je séria implementácií redundantných diskových polí, ktoré poskytujú rôzne úrovne ochrany a rýchlosti prenosu údajov. Keďže RAID zahŕňa použitie diskových polí, SCSI je najlepšie rozhranie na použitie, pretože môže podporovať až 15 zariadení. K dispozícii je 6 úrovní RAID: od nuly po piatu. Hoci niektorí výrobcovia inzerujú svoje vlastné schémy redundancie, ktoré označujú ako RAID-6, RAID-7 alebo vyššie. (RAID-2 a RAID-4 nie sú na sieťových serveroch, takže o nich nebudeme hovoriť.)

Zo všetkých úrovní RAID má nula najvyšší výkon a najnižšiu bezpečnosť. Predpokladá minimálne dve zariadenia a synchronizovaný zápis dát na oba disky, pričom disky vyzerajú ako jedno fyzické zariadenie. Proces zápisu údajov na viacero diskov sa nazýva rozloženie jednotiek a skutočný spôsob zápisu týchto údajov sa nazýva prekladanie údajov. Pri stripingu sa dáta zapisujú na všetky disky blok po bloku; tento proces sa nazýva blokové prekladanie. Veľkosť bloku je určená operačným systémom, ale zvyčajne sa pohybuje od 2 kB do 64 kB. V závislosti od konštrukcie radiča disku a HBA sa tieto sekvenčné zápisy môžu prekrývať, čo vedie k zvýšeniu výkonu. Napríklad samotný RAID-0 môže zlepšiť výkon, ale neposkytuje ochranu proti chybám. Ak zlyhá disk, zlyhá celý podsystém, čo zvyčajne vedie k úplnej strate údajov.

Variantom prekladania dát je rozptyl dát. Rovnako ako pri stripovaní sa údaje zapisujú postupne na viaceré disky, ktoré sa zaplnia. Na rozdiel od stripingu však nie je potrebné zapisovať na všetky disky; ak je disk zaneprázdnený alebo plný, údaje sa môžu zapisovať na ďalší dostupný disk – to vám umožňuje pridať disky do existujúceho zväzku. Rovnako ako štandard RAID-0, kombinácia diskovej populácie s prekrývaním údajov zlepšuje výkon a zvyšuje veľkosť zväzku, ale neposkytuje ochranu pred zlyhaním.

RAID-1, známy ako zrkadlenie diskov, zahŕňa inštaláciu párov identických diskov, pričom každý disk v páre je zrkadlovým obrazom toho druhého. V RAID-1 sa dáta zapisujú na dva rovnaké alebo takmer identické páry diskov: keď napríklad jeden disk zlyhá, systém pokračuje v práci so zrkadlovým diskom. Ak zrkadlené disky zdieľajú spoločný HBA, potom bude výkon tejto konfigurácie v porovnaní s jedným diskom nižší, pretože údaje sa musia zapisovať postupne na každý disk.

Novell zúžil definíciu zrkadlenia a pridal koncept duplexu. Podľa terminológie Novell sa zrkadlenie týka párov diskov, keď sú pripojené k serveru alebo počítaču prostredníctvom jedného HBA, zatiaľ čo duplikácia sa týka zrkadlených párov diskov pripojených prostredníctvom samostatných HBA. Redundancia poskytuje redundanciu pre celý diskový kanál vrátane HBA, káblov a diskov a poskytuje určité zvýšenie výkonu.

RAID-3 vyžaduje aspoň tri rovnaké disky. Táto technológia sa často označuje ako technológia „n mínus 1“ (n-1), pretože maximálna kapacita systému je daná celkovým počtom jednotiek v poli (n) mínus jedna jednotka pre paritu. RAID-3 používa metódu zápisu nazývanú bitové prekladanie, kde sa údaje zapisujú na všetky disky bit po bite. Pre každý bajt zapísaný na n-diskoch sa na "paritný disk" zapíše paritný bit. Ide o extrémne pomalý proces, pretože pred vygenerovaním informácií o parite a ich zápisom na „paritný disk“ sa musia údaje zapísať na každý z n diskov poľa. Výkon RAID-3 môžete zvýšiť synchronizáciou mechanizmov otáčania disku tak, aby fungovali striktne v krokoch. Avšak kvôli obmedzeniam výkonu sa používanie RAID-3 dramaticky znížilo a dnes sa predáva len veľmi málo serverových produktov založených na RAID-3.

RAID-5 je najpopulárnejšia implementácia RAID na trhu sieťových serverov. Rovnako ako RAID-3 vyžaduje aspoň tri rovnaké disky. Na rozdiel od RAID-3 však RAID-5 oddeľuje dátové bloky bez použitia vyhradeného disku na zabezpečenie parity. Údaje aj kontrolný súčet sa zapisujú cez celé pole. Táto metóda umožňuje nezávislé čítanie a zápis na disk a tiež umožňuje operačnému systému alebo radiču RAID vykonávať viacero súbežných I/O.

V konfiguráciách RAID-5 sa k disku pristupuje iba vtedy, keď sa z neho čítajú/zapisujú informácie o parite alebo údaje. Výsledkom je, že RAID-5 má lepší výkon ako RAID-3. V praxi sa výkon RAID-5 niekedy môže rovnať alebo dokonca prekročiť výkon jednodiskových systémov. Toto zlepšenie výkonu samozrejme závisí od mnohých faktorov vrátane toho, ako je implementované pole RAID a aké natívne schopnosti má operačný systém servera. RAID-5 tiež poskytuje najvyššiu úroveň integrity údajov zo všetkých štandardných implementácií RAID, pretože údaje aj parita sú zapísané v pruhovanej forme. Keďže RAID-5 používa skôr blokové prekladanie ako bitové prekladanie, nie je tu žiadna výkonnostná výhoda zo spinovej synchronizácie.

Niektorí výrobcovia pridali rozšírenia do svojich systémov RAID-5. Jedným z týchto rozšírení je prítomnosť „hot-spare“ disku zabudovaného v poli. Ak disk zlyhá, horúca náhrada okamžite nahradí havarovaný disk a skopíruje údaje späť na seba s obnovou parity na pozadí. Pamätajte však, že prebudovanie disku RAID-5 má za následok vážny zásah do výkonu servera. (Viac informácií o hot-swap a hot-spare diskoch nájdete na bočnom paneli „Hot“ Drive Features.)

Systémy RAID je možné organizovať pomocou softvéru načítaného na serveri a pomocou jeho procesora na prevádzku, ako aj pomocou špecializovaného radiča RAID.

Systémy RAID implementované softvérom zaberajú značné množstvo zdrojov systémového procesora, ako aj systémovej pamäte, čo výrazne znižuje výkon servera. Softvérové systémy RAID sú niekedy zahrnuté ako súčasť operačného systému (ako je to v prípade servera Microsoft Windows NT Server) alebo ako doplnok tretej strany (ako je to v prípade systémov NetWare a operačného systému Macintosh).

Hardvérové systémy RAID používajú vyhradený radič poľa RAID; zvyčajne má vlastný procesor, vyrovnávaciu pamäť a softvér ROM pre diskové I/O a paritu. Vyhradený radič na vykonávanie týchto operácií uvoľňuje procesor servera na vykonávanie iných funkcií. Okrem toho, pretože softvér procesora a adaptéra sú špecificky vyladené pre funkčnosť RAID, poskytujú lepší výkon diskových I/O a integritu údajov ako softvérové systémy RAID. Bohužiaľ, hardvérové radiče RAID bývajú drahšie ako ich softvéroví konkurenti.

ZRKADLENIE, DUPLIKÁCIA A PLNENIE

Niektoré operačné systémy, vrátane NetWare a Windows NT Server, umožňujú zrkadlenie disku na viacerých diskových kanáloch, čím poskytujú ďalšiu vrstvu redundancie. Ako už bolo spomenuté, Novell tento prístup nazýva duplikácia disku. V kombinácii s výplňou disku môže duplikácia poskytnúť lepší výkon ako systémy s jedným diskom a vo všeobecnosti môže prekonať hardvérové implementácie RAID-5. Keďže každá polovica zrkadleného páru diskov používa samostatný diskový kanál, zápisy na disky, na rozdiel od prípadu, keď sú disky na rovnakom HBA, môžu byť zapisované súčasne. Duplikácia tiež umožňuje rozdelené vyhľadávanie - proces rozdeľovania požiadaviek na čítanie medzi diskové kanály pre rýchlejšie vykonávanie. Táto funkcia zdvojnásobuje výkon čítania disku, pretože oba kanály paralelne vyhľadávajú rôzne bloky z rovnakého súboru údajov. Znižuje tiež vplyv na výkon pri zapisovaní na disk, pretože jeden kanál môže čítať dáta, zatiaľ čo druhý zapisuje.

NetWare podporuje až osem diskových kanálov (niektoré adaptéry SCSI poskytujú viacero kanálov), čo znamená, že pre každý duplikovaný pár môžete mať viacero kanálov. Môžete si dokonca zvoliť usporiadanie až ôsmich samostatných zrkadlových kanálov. Windows NT Server tiež poskytuje softvérové zrkadlenie a duplikáciu, ale zatiaľ nepodporuje paralelné zápisy a samostatné vyhľadávania.

Pri výbere redundantného diskového systému je potrebné zvážiť štyri hlavné faktory: výkon, náklady, spoľahlivosť a ochrana pred poruchami.

Pokiaľ ide o výkon, hlavným faktorom sú vstavané schopnosti serverového operačného systému, najmä ak prichádza do hry redundancia disku. Ako už bolo uvedené, duplikácia disku NetWare v kombinácii s výplňou disku poskytuje lepší výkon ako hardvérový alebo softvérový RAID. Výkon hardvérového RAID je však vo všeobecnosti lepší ako výkon vstavaných diskových služieb Windows NT Server. Všeobecne povedané, v priebehu rokov sa technológia a výkon systémov RAID neustále zlepšovali.

Ďalším potenciálnym problémom s výkonom systémov RAID je obnova dát v prípade katastrofy. Až donedávna ste v prípade zlyhania disku museli vypnúť pole RAID, aby ste ho mohli obnoviť. Tiež, ak ste chceli zmeniť veľkosť poľa (zvýšiť alebo znížiť jeho kapacitu), museli ste urobiť úplnú zálohu systému a potom prekonfigurovať a znova inicializovať pole, pričom ste počas tohto procesu vymazali všetky údaje. V oboch prípadoch je systém dlhší čas nedostupný.

Na vyriešenie tohto problému spoločnosť Compaq vyvinula radič Smart Array-II, ktorý umožňuje rozšíriť kapacitu poľa bez reinicializácie existujúcej konfigurácie poľa. Iní výrobcovia, vrátane Distributed Processing Technology (DPT), oznámili, že ich ovládače budú vykonávať podobné funkcie v nie príliš vzdialenej budúcnosti. Mnohé z nových polí majú nástroje pre rôzne operačné systémy, ktoré možno použiť na obnovenie poľa po výmene poškodeného zariadenia bez vypnutia servera. Majte však na pamäti, že tieto pomocné programy spotrebúvajú veľa serverových zdrojov a tým nepriaznivo ovplyvňujú výkon systému. Aby sa predišlo takýmto ťažkostiam, obnova systému by sa mala vykonávať počas mimopracovných hodín.

V priemysle a publikáciách predajcov RAID sa viedli početné diskusie o rozdieloch v nákladoch medzi zrkadlením, duplikáciou a implementáciami RAID. Zrkadlenie a duplikácia poskytujú 100% zdvojnásobenie diskov a (ak sú duplikované) HBA, zatiaľ čo implementácie RAID majú jeden radič HBA a/alebo RAID plus jeden disk viac, než je kapacita, s ktorou chcete skončiť. Podľa týchto argumentov je RAID lacnejší, pretože je potrebný menší počet diskov. To môže byť pravda, ak sú pre vás tolerovateľné obmedzenia výkonu softvérových implementácií RAID zahrnutých v operačnom systéme, ako sú tie, ktoré sa nachádzajú vo Windows NT. Vo väčšine prípadov je však na dosiahnutie primeraného výkonu potrebný vyhradený radič RAID.

Jednotky a štandardné adaptéry SCSI sú relatívne lacné, zatiaľ čo vysokokvalitný radič RAID môže stáť až 4 500 USD. Ak chcete určiť cenu vášho systému, musíte zvážiť optimálne konfigurácie pre všetky komponenty. Napríklad, ak potrebujete približne 16 GB adresovateľného miesta na disku, môžete implementovať zrkadlenú konfiguráciu s dvoma 9 GB diskami na kanál a získať určitú nadbytočnú kapacitu. V prípade RAID-5 je z dôvodov výkonu a spoľahlivosti lepšie zostať pri piatich 4 GB diskoch, aby sa zvýšil počet vretien na prekladanie dát a tým aj celkový výkon poľa.

S externým diskovým subsystémom bude zrkadlová konfigurácia stáť približne 10 500 USD za 18 GB dostupného priestoru. Toto číslo je založené na skutočných maloobchodných cenách: 2 000 USD za jeden disk, 250 USD za jeden HBA a 300 USD za každý externý diskový subsystém vrátane káblov. Systém RAID-5 nakonfigurovaný so 16 GB adresovateľného priestoru pomocou piatich 4 GB diskov bude stáť približne 12 800 USD. Tento údaj je založený na skutočných maloobchodných cenách poľa DPT RAID-5.

Mnohé systémy RAID obsahujú „proprietárne“ komponenty navrhnuté výrobcom. Minimálne „značkové“ sú puzdro a zadný panel. HBA a radiče RAID sú tiež často proprietárne. Niektorí výrobcovia používajú aj neštandardné držiaky a pneumatiky na disky. Niekto ich poskytuje samostatne za rozumnú cenu, niekto iba spolu s diskom a spravidla za vysokú cenu. Posledný prístup môže byť nákladný, keď potrebujete opraviť alebo rozšíriť váš systém. Ďalším spôsobom, ako vás predajca zavedie do kúta, je poskytnutie softvéru na správu a monitorovanie diskov, ktorý funguje len s konkrétnymi komponentmi. Ak sa vždy, keď je to možné, vyhnete neštandardným komponentom, náklady sa zvyčajne dajú udržať na nízkej úrovni.

Pri porovnávaní spoľahlivosti redundantných diskových systémov je potrebné zvážiť dva faktory: možnosť zlyhania systému alebo zlyhania ktoréhokoľvek z jeho komponentov a možnosť straty údajov v dôsledku zlyhania komponentov. (Bohužiaľ, RAID alebo zrkadlenie vás nemôže zachrániť pred hlavnou príčinou straty údajov - chybou používateľa!)

P = t / Tc,

kde t je prevádzkový čas a Tc je kombinovaný čas medzi poruchami komponentov.

Keď beží bez poruchy po dobu jedného roka (8760 hodín) a Tc hypotetického disku 300 000 hodín, pravdepodobnosť zlyhania je 3 %, čiže o niečo menej ako jedna z 34 prípadov. So zvyšujúcim sa počtom komponentov sa zvyšuje pravdepodobnosť porucha ktoréhokoľvek komponentu sa zvyšuje. RAID aj zrkadlenie zvyšujú pravdepodobnosť zlyhania, ale znižujú možnosť straty údajov.

Tabuľka 2, prevzatá z bulletinu Storage Dimensions s názvom „Systémy ukladania údajov odolných voči chybám pre nepretržité siete“, ukazuje pravdepodobnosť zlyhania vypočítanú pomocou vyššie uvedeného vzorca oproti pravdepodobnosti straty údajov pre štyri vyplnené disky, päťdiskové pole RAID a osem zrkadlových diskov. (Za predpokladu, že všetky disky majú rovnakú veľkosť a všetky tri systémy poskytujú rovnakú využiteľnú kapacitu. Bulletin nájdete na stránke Rozmery úložiska: http://www.storagedimensions.com/raidwin/wp-ovrvw.html.)

TABUĽKA 2 – ODHADY PRAVDEPODOBNOSTI ZLYHANIA

Hoci zrkadlenie v kombinácii s vyplnením disku má vyššiu štatistickú pravdepodobnosť zlyhania disku, má tiež oveľa nižšiu pravdepodobnosť straty údajov v prípade zlyhania disku. Taktiež pri správne navrhnutom redundantnom systéme môže byť čas obnovy výrazne kratší.

Tento príklad neberie do úvahy veľa faktorov. Na získanie štatisticky správneho čísla je potrebné vypočítať stredný čas medzi poruchami všetkých komponentov diskového systému vrátane HBA, plochých káblov, napájacích káblov, ventilátorov a napájacích zdrojov. Samozrejme, tieto výpočty hovoria iba o tom, čo sa môže stať vzhľadom na spoľahlivosť navrhovaných komponentov, ale nie je vôbec potrebné, aby sa to stalo.

Pri výbere diskového systému musíte jasne vedieť, ktoré komponenty nie sú duplikované. V systémoch RAID to môže zahŕňať HBA, radiče RAID, napájacie zdroje, napájacie káble a ploché káble. Jednou z výhod duplikácie so samostatnými diskovými subsystémami na každom kanáli je odstránenie väčšiny jednotlivých miest, kde môže dôjsť k poruchám.

ZÁVER

Vo všeobecnosti sú zariadenia SCSI lepšou voľbou pre serverový diskový subsystém ako jednotky IDE alebo EIDE. Je ľahké získať jednotky SCSI s kapacitou až 9 GB na jednotku, zatiaľ čo dnešné jednotky EIDE majú maximálnu kapacitu približne 2,5 GB. S viacerými duálnymi adaptérmi HBA môže celková kapacita SCSI ľahko presiahnuť 100 GB, pričom limit EIDE je 10 GB. SCSI má tiež lepší výkon; navyše SCSI netrpí problémami, ktoré so sebou prináša prístup master-slave v IDE/EIDE.

Ak potrebujete redundanciu disku, existuje niekoľko možností. Redundancia Novell NetWare v kombinácii s diskovou náplňou poskytuje vynikajúci výkon a ochranu pred zlyhaním. Hardvérový RAID je tiež dobrou voľbou, ale zvyčajne má nižší výkon a vyššie náklady. Ak používate Windows NT a výkon je pre vás dôležitý, potom môže byť hardvérový RAID vašou najlepšou voľbou.

Patrick Corrigan je prezident a hlavný konzultant/analytik v The Corrigan Group, poradenskej a školiacej firme. Možno ho kontaktovať na: [e-mail chránený] alebo cez Compuserve: 75170.146. Mickey Applebaum je senior sieťový konzultant v GSE Erudite Software. Možno ho kontaktovať na: [e-mail chránený]

PREDSTAVUJEME FUNKCIE SUBSYSTÉMU DISKU

"Horúce" funkcie diskových podsystémov

Termíny hot-swap, hot-stere a hot-rebuild, široko používané na opis špecifických funkcií diskových podsystémov, sú často nesprávne chápané.

„Hot Swap“ je funkcia, ktorá vám umožňuje odstrániť chybný disk z diskového podsystému bez vypnutia systému. Podpora hot swap je hardvérová funkcia vášho diskového subsystému, nie RAID.

V systémoch vymeniteľných za chodu sú pevné disky zvyčajne namontované na saniach, ktoré umožňujú, aby uzemňovacie kolíky medzi jednotkou a šasi zostali pripojené dlhšie ako napájacie a riadiace vedenia. To chráni pohon pred poškodením statickým výbojom alebo elektrickým oblúkom medzi kontaktmi. Hot-swap disky možno použiť v poliach RAID aj v zrkadlových diskových systémoch.

„Obnovenie za chodu“ označuje schopnosť systému automaticky obnoviť pôvodnú konfiguráciu disku po výmene chybného disku.

Horúce náhradné diely sú zabudované do poľa RAID a zvyčajne sa nechávajú nečinné, kým nie sú potrebné. V určitom okamihu, keď horúca náhradná jednotka nahradí chybný disk, musíte vymeniť chybný disk a prekonfigurovať pole.

Diskový systém vymeniteľný za chodu s horúcimi náhradnými diskami nemusí mať nutne schopnosť obnovy za chodu. „Hot Swap“ vám jednoducho umožňuje rýchlo, bezpečne a jednoducho odstrániť/inštalovať disk. Zdá sa, že „horúca náhrada“ poskytuje „prestavbu za chodu“, pretože umožňuje okamžitú výmenu zlyhaného disku v poli RAID, ale zlyhaný disk je stále potrebné vymeniť predtým, ako bude zadaný príkaz na opätovné zostavenie. V súčasnosti všetky systémy RAID dostupné na platforme PC vyžadujú určitú úroveň zásahu používateľa na spustenie obnovy dát - aspoň na úrovni načítania modulu NLM na serveri NetWare alebo stlačenia tlačidla štart v ponuke aplikácie NT Server.

Cieľom architektúr odolných voči poruchám je poskytnúť informačný systém s nízkymi nákladmi na údržbu a nulovými prestojmi. Nedostatočná dostupnosť systému môže spoločnosti spôsobiť obrovské finančné straty. Túto sumu tvoria náklady na zníženú produktivitu zamestnancov v dôsledku zlyhania systému, náklady na práce, ktoré nie je možné vykonať, kým sa systém neobnoví, náklady na opravu zlyhaných prvkov systému. Preto pri implementácii kritických aplikácií stojí za zváženie, že náklady na prestoje v dôsledku zlyhania systému dobre odôvodňujú značné investície do inštalácie architektúr odolných voči chybám.

Na vybudovanie systému odolného voči poruchám je potrebné venovať pozornosť niekoľkým jeho hlavným komponentom. Spoľahlivosť diskového subsystému je kritická. Pozrime sa na hlavné charakteristiky diskových podsystémov odolných voči chybám a zastavme sa pri ich implementácii pomocou technológie RAID.

Čo stojí za chybovosťou diskového subsystému

Systém odolný voči chybám automaticky deteguje chybné komponenty, následne veľmi rýchlo určí príčinu poruchy a prekonfiguruje tieto komponenty.

Kľúčovým bodom pri vytváraní systému odolného voči chybám je poskytnúť ochrannú redundanciu založenú na hardvéri aj softvéri. Táto redundancia implementuje algoritmy detekcie chýb, ktoré sa používajú v spojení s diagnostickými algoritmami na identifikáciu príčiny chyby.

Existujú tri hlavné metódy detekcie chýb. Prvým je počiatočné testovanie (Initial Testing), ktoré vykonáva výrobca pred finálnou integráciou systému. V tejto fáze sa identifikujú hardvérové chyby, ktoré by sa mohli vyskytnúť pri výrobe a montáži komponentov systému.

Druhá metóda, súbežné online testovanie, sa vzťahuje na čas normálnej prevádzky systému. Táto metóda hľadá hlavne tie chyby, ktoré sa mohli objaviť po inštalácii systému. Jednou z najznámejších metód online testovania je kontrola parity. Zabezpečuje, že každý bajt údajov prenášaných počítačovým systémom sa dostane k svojmu ďalšiemu komponentu neporušený. Paritná metóda detekuje iba prítomnosť chyby a nedokáže určiť, ktorý bit chýba. Preto sa používa v spojení s Error Correction Code, ktorý presne určuje, aké dáta sa stratia, čo umožňuje systému ich rýchle obnovenie.

Napokon treťou metódou zisťovania chýb je testovanie redundancie. Overuje, či funkcie zabezpečenia systému fungujú správne.

Systém odolný voči chybám musí v prípade zlyhania poskytnúť alternatívnemu zariadeniu núdzové prepnutie, ako aj informovať správcu o akýchkoľvek zmenách v konfigurácii, aby mohol obnoviť chybné komponenty skôr, ako ich duplikáty prestanú fungovať. Na to musí systém posielať správy do administrátorskej konzoly, zaznamenávať všetky chyby na disk na pravidelnú kontrolu a tiež musí byť schopný odoslať externú správu, ak došlo k zlyhaniu v neprítomnosti administrátora na jeho pracovisku.

Pri výbere systému odolného voči chybám je potrebné zvážiť aj jeho schopnosť prispôsobiť sa novým technológiám, pretože počítače a diskové zariadenia s vyšším výkonom sa objavujú fantasticky.

Na záver by používatelia nemali zabúdať, že pri najlepšej implementácii odolnosti voči chybám musia pravidelne zálohovať údaje na magnetickú pásku alebo optický disk, aby bola zabezpečená ich bezpečnosť v prípade globálnejšej katastrofy, než je zlyhanie ktoréhokoľvek komponentu systému. Odolnosť voči poruchám sa pravdepodobne nezachráni v prípade požiaru, zemetrasenia alebo teroristickej bomby.

Diskové podsystémy RAID

Zatiaľ čo výkon systému ovplyvňuje veľa faktorov, ako napríklad výpadok napájania alebo prehriatie, nič nie je dôležitejšie ako ochrana údajov na vašich diskoch. Zlyhanie disku spôsobuje dlhší výpadok systému, pretože pred obnovením programu je potrebné rekonštruovať údaje.

V roku 1987 traja výskumníci z University of Berkeley publikovali článok popisujúci metódy na zabezpečenie odolnosti voči chybám pomocou polí malých (3,5- a 5,25-palcových) diskových jednotiek, ktoré dokážu dosiahnuť výkonové charakteristiky jedného veľkého drahého disku (Single Large Expensive Disk - SLED) v sálových počítačoch. Táto technológia sa nazýva RAID – Redundant Array of Inexpensive Disks (Redundant Array of Inexpensive Disks). Nižšie sa pozrieme na hlavné charakteristiky šiestich úrovní RAID.

Úrovne RAID majú rôzne výkonnostné charakteristiky a rôzne náklady. RAID 0 (duplexná metóda) je najrýchlejší, nasleduje RAID 3 alebo RAID 5 (v závislosti od veľkosti záznamov). Cena každej metódy závisí od celkového množstva požadovaného miesta na disku. Napríklad pre malé až stredné súbory môže byť zrkadlenie lacnejšie ako RAID 3 alebo 5.

Pri výbere diskového subsystému odolného voči chybám musíte mať na pamäti aj softvér na automatickú obnovu dát v prípade poruchy. Pokiaľ ide o súborový server LAN, je dôležité, aby sa údaje dali obnoviť s minimálnym úsilím zo strany správcu siete LAN as minimálnou stratou pre používateľov servera. Napríklad v prípade RAID 0 je prestavba jednoducho skopírovaním údajov zo sekundárneho disku na prestavaný alebo vymenený disk. Pre systémy RAID 3, 4 a 5 výrobcovia poskytujú softvér, ktorý obnovuje údaje podľa segmentov XOR. Tieto programy bežia na pozadí, čo umožňuje používateľom pokračovať v práci počas obnovy. Systémy RAID so vstavanými inteligentnými procesormi sú schopné prestavby oveľa rýchlejšie ako ich náprotivky, ktoré používajú softvér, ktorý beží na procesore hlavného systému.

Tradičné systémy RAID majú nepopierateľné výhody, no zároveň spôsobujú množstvo problémov. Rôzne úrovne RAID poskytujú rôzny výkon a náklady a správcovia musia nájsť najlepšiu možnosť pre daný systém. Dnešné diskové podsystémy RAID sú pomerne zložité na správu a konfiguráciu. Zväčšenie miesta na disku a prekonfigurovanie podsystému je tiež časovo náročný a pracný proces.

Na zvládnutie týchto problémov sa vyvíjajú nové technológie diskových polí s možnosťou automatickej konfigurácie na rôzne úrovne, ktoré už nezapadajú do tradičného rámca špecifikovaných úrovní RAID. My sa pozrieme na produkty tohto typu od spoločností Hewlett-Packard a EMC.

Hewlett-Packard AutoRAID

Po štyroch rokoch tvrdej práce divízia úložísk Hewlett-Packard vyvinula novú technológiu, ktorá využíva redundanciu tradičného RAID a zároveň odstraňuje mnohé z jeho nedostatkov. Diskový subsystém AutoRAID automaticky vyberá úroveň RAID, ktorá vyhovuje požiadavkám používateľov, a tiež implementuje množstvo ďalších dôležitých funkcií.

Jadrom technológie je sada algoritmov radiča diskového subsystému na správu adries dátových blokov. Tradičné diskové polia, ako napríklad RAID 4 alebo 5, používajú statické, preddefinované algoritmy na preklad adries dátových blokov hostiteľského počítača na adresy disku. Vývojári AutoRAID opustili tento prístup a uprednostnili použitie dynamických algoritmov na inteligentné mapovanie akejkoľvek adresy bloku na hostiteľovi na ľubovoľný disk v poli. Toto zobrazenie sa môže počas prevádzky systému zmeniť.

Dynamické algoritmy umožňujú riadiacej jednotke presúvať dáta uložené v diskovom poli na ľubovoľné miesto na akomkoľvek disku bez ovplyvnenia dát alebo spôsobu, akým sú adresované hostiteľským počítačom. Táto technológia umožňuje konvertovať z jednej úrovne RAID na druhú. Na základe toho, čo je známe o rôznych výkonnostných charakteristikách rôznych úrovní RAID, sa diskový subsystém dynamicky prispôsobuje tak, aby čo najlepšie vyhovoval potrebám hostiteľského počítača.

Ďalšou dôležitou možnosťou tohto prístupu je jednoduché miešanie diskov rôznych veľkostí a výkonu v jednom podsystéme. Niektoré tradičné diskové polia majú podobné možnosti, ale v nich je konfigurácia subsystému zložitý a zdĺhavý proces. Konfigurácia v AutoRAID je rýchla a jednoduchá. Jednou z úloh administrátora pri konfigurácii ľubovoľného diskového poľa je vytvorenie virtuálnych diskov z dostupného fyzického priestoru. Používatelia pracujú s virtuálnymi diskami, ktoré im radič podsystému prezentuje ako fyzické. Pri konfigurácii tradičného diskového poľa musí správca poznať vlastnosti každého fyzického disku, aby ich mohol zoskupiť a vytvoriť virtuálne disky. AutoRAID oslobodzuje správcu od týchto zložitostí. Teraz mu stačí poznať celkové množstvo pamäte v diskovom poli. Správca určí množstvo pamäte potrebnej pre každý virtuálny disk, po ktorom mapovacie algoritmy automaticky zoskupia fyzické disky, aby sa zabezpečilo čo najefektívnejšie využitie dostupného priestoru a najvyšší výkon.

Prekonfigurovanie subsystému je tiež jednoduché. Jedným z najčastejších dôvodov rekonfigurácie je potreba zvýšiť miesto na disku. Tradičné podsystémy RAID riešia tento problém dvoma spôsobmi. Prvým je pridať dostatok diskov na vytvorenie novej redundantnej skupiny. Táto metóda môže byť dosť drahá. V druhom prípade správca uloží všetky dáta na náhradný disk, pridá nové disky, prekonfiguruje celý subsystém a obnoví dáta. Je zrejmé, že tento proces bude trvať dlho, počas ktorého systém nefunguje.

Zdá sa, že je oveľa jednoduchšie prekonfigurovať a pridať ďalšie miesto na disku. Správcovi stačí nainštalovať nové disky a vytvoriť ďalší virtuálny disk. Táto práca sa vykonáva interaktívne a trvá niekoľko sekúnd.

Táto jednoduchá rekonfigurácia systému závisí od technológie dynamického mapovania implementovanej v AutoRAID. Každý disk v poli sa považuje za sekvenciu blokov. Pri pridávaní nových diskov sa ich bloky pridávajú do celkového fondu dostupnej pamäte. Mapovacie algoritmy umožňujú riadiacej jednotke používať každý blok nezávisle, čo vedie k lepšiemu výkonu systému, nákladom a dostupnosti.

Jedinečnou vlastnosťou technológie AutoRAID je automatické a priame použitie nových diskov na zlepšenie výkonu diskového podsystému. Keď je nainštalovaný nový disk, údaje sa prerozdelia rovnomerne na všetky disky v podsystéme. Tento proces sa nazýva vyvažovanie a prebieha na pozadí medzi operáciami hostiteľského počítača. Rovnomerná distribúcia dát na všetky disky vytvára viac príležitostí na vykonávanie viacerých dátových operácií súčasne. Pre systémy spracovania transakcií znamená zvýšenie počtu paralelných operácií zvýšenie celkového výkonu.

Ďalšia inovácia opísanej technológie je založená na metóde vyvažovania - takzvaný "active hot spare" (active hot spare). Funkcia aktívnej horúcej zálohy je rovnaká ako funkcia horúcej zálohy v tradičnom poli. Ak niektorý disk zlyhá, radič podsystému okamžite začne proces obnovy, ktorý zrekonštruuje stratené údaje na náhradnom disku a obnoví redundanciu podsystému. V konvenčných poliach sa náhradný disk nepoužíva, kým sa niečo nestane so systémom, pretože obsahuje náhradný priestor pre obnovené dáta. Dočasné úložisko sa niekedy vytvorí na horúcom náhradnom disku, ale musí sa zlikvidovať hneď, ako disk zlyhá.

Technológia HP AutoRAID využíva horúce náhradné diely na zlepšenie výkonu podsystému. Proces vyvažovania distribuuje používateľské dáta na všetky disky v systéme, vrátane horúceho rezervného disku (čím viac diskov sa používa na dáta, tým lepší je výkon). Zároveň je na každom disku časť miesta vyhradená na obnovu dát v prípade zlyhania. Zrekonštruované dáta počas procesu prestavby systému budú uložené na náhradnej ploche každého z diskov v poli.

EMC RAID-S

EMC, výrobca úložných systémov, ponúka novú implementáciu technológie RAID RAID-S, ktorá poskytuje vyšší výkon a ochranu dát a odstraňuje mnohé nedostatky tradičných systémov RAID.

RAID-S nemožno priradiť k žiadnej úrovni RAID. Pomocou nových pokrokov v hardvéri, softvéri a zobrazovaní EMC kombinuje pozitívne aspekty RAID 4, 5 a RAID 6 s novými technológiami na vytvorenie novej schémy ochrany údajov. Diskové polia RAID-S sú navrhnuté na použitie v systémoch triedy mainframe.

RAID-S umožní používateľom vytvárať úložné systémy, ktoré pomôžu vytvoriť najlepšiu rovnováhu medzi výkonom, ochranou údajov a dostupnosťou systému. RAID-S vám umožňuje vybrať si úroveň RAID, ktorá najlepšie vyhovuje potrebám vašej organizácie. EMC navyše umožňuje kombinovať technológiu RAID-S, diskové pole RAID 1 a ďalšie firemné diskové úložné systémy v jednom systéme.

Napríklad veľká banka môže prevádzkovať online systémy spracovania transakcií, ktoré slúžia svojim zákazníkom, ako aj systémy dávkového spracovania pre administratívne úlohy. Každá aplikácia má svoje vlastné požiadavky na úložisko a prístup. Diskové systémy EMC každému z nich poskytnú potrebnú úroveň dostupnosti a ochrany údajov.

Etapy dokonalosti RAID

RAID 0. RAID 0 nie je vo svojej podstate odolný voči chybám, ale môže výrazne zlepšiť výkon. V bežnom systéme sa dáta postupne zapisujú na disk, kým sa nevyčerpá jeho kapacita. RAID 0 distribuuje dáta medzi disky v poli nasledovne. Ak sa napríklad použijú štyri disky, údaje sa zapíšu do prvej stopy prvého disku, potom do prvej stopy druhého disku, prvej stopy tretieho a prvej stopy štvrtého disku. Údaje sa potom zapíšu do druhej stopy prvého disku atď. Táto distribúcia údajov vám umožňuje súčasne čítať a zapisovať údaje na štyri disky a tým zvyšuje výkon systému. Na druhej strane, ak jeden z diskov zlyhá, budete musieť obnoviť údaje aj na všetkých štyroch diskoch.

RAID 1. RAID 1 implementuje zrkadlenie/duplexovanie údajov vytvorením druhej kópie údajov na samostatnom disku pre každý disk v poli. Obojstranná tlač okrem dát na disku duplikuje aj kartu adaptéra a kábel, čím poskytuje ešte väčšiu redundanciu. Metóda ukladania dvoch kópií údajov je spoľahlivým spôsobom implementácie diskového subsystému odolného voči chybám a našla široké uplatnenie v moderných architektúrach.

RAID 2. RAID 2 distribuuje dáta na diskoch poľa bit po bite: prvý bit sa zapíše na prvý disk, druhý bit sa zapíše na druhý disk atď. Redundanciu zabezpečuje niekoľko prídavných diskov, na ktoré sa zapisuje kód opravy chýb. Táto implementácia je drahšia, pretože si vyžaduje väčšiu redundanciu: pole so 16 až 32 primárnymi diskami musí mať tri dodatočné disky na uloženie korekčného kódu. RAID 2 poskytuje vysoký výkon a spoľahlivosť, ale jeho použitie je obmedzené hlavne na trh výskumných počítačov kvôli vysokým minimálnym požiadavkám na diskový priestor. Sieťové súborové servery v súčasnosti túto metódu nepoužívajú.

RAID 3. RAID 3 distribuuje dáta na diskoch poľa bajt po byte: prvý bajt sa zapíše na prvý disk, druhý bajt sa zapíše na druhý disk atď. Redundancia poskytuje jeden dodatočný disk, kde sa zapisuje súčet dát modulo 2 (XOR) pre každý z hlavných diskov. Týmto spôsobom RAID 3 rozdeľuje záznamy dátových súborov, ukladá ich na viacero diskov súčasne a poskytuje veľmi rýchle čítanie a zápis. Segmenty XOR na sekundárnom disku dokážu zistiť akúkoľvek poruchu diskového subsystému a špeciálny softvér určí, ktorý disk v poli zlyhal. Použitie bajtovej distribúcie dát umožňuje súčasné čítanie alebo zápis dát z viacerých diskov pre súbory s veľmi dlhými záznamami. Naraz je možné vykonať iba jednu operáciu čítania alebo zápisu.

RAID 4. RAID 4 je podobný RAID 3 okrem toho, že údaje sú na diskoch rozložené v blokoch. Jeden ďalší disk sa používa aj na ukladanie segmentov XOR. Táto implementácia je užitočná pre súbory s veľmi krátkym zápisom a vyššou frekvenciou čítania ako zápisu, keďže je možné vykonať viacero čítaní súčasne so správnou veľkosťou bloku na disku. Stále je však povolená iba jedna operácia zápisu, pretože všetky operácie zápisu používajú na výpočet kontrolného súčtu rovnakú sekundárnu jednotku.

RAID 5. RAID 5, podobne ako RAID 4, používa distribúciu údajov blok po bloku, ale segmenty XOR sú rozdelené na všetky disky v poli. To vám umožní vykonávať viacero operácií zápisu súčasne. RAID 5 je tiež užitočný pre krátke zapisovacie súbory.

Živá migrácia

Stratégia živej migrácie dát vám predovšetkým umožňuje ukladať najaktívnejšie dáta do RAID 1, ktorý má najvyšší výkon, a menej aktívne dáta do lacnejšieho RAID 5. Vo väčšine systémov tvoria aktívne využívané dáta malú časť všetkých uložené informácie. Väčšina dát bude teda uložená na RAID 5. Táto technológia poskytuje správcom systému dve kľúčové výhody. Po prvé, zbaví ich bolesti pri premýšľaní o tom, ktorú úroveň RAID zvoliť. Po druhé, diskový subsystém nepretržite optimalizuje výkon a náklady na diskové úložisko, ako by to bolo v prípade, keď administrátor trávi všetok svoj pracovný čas ladením systému.

Vlastnosti implementácie RAID-S:

RAID-S vypočítava redundantný kód opravy chýb na úrovni ovládača disku, nie na úrovni radiča podsystému. Toto odľahčí radič, oslobodí ho od spracovania I/O požiadaviek, a tým zlepší výkon diskového subsystému.

V RAID-S nie sú dáta rozdelené medzi fyzické disky ako v tradičných implementáciách RAID, ale zostávajú na disku nedotknuté. To vám umožňuje použiť existujúce nastavenia monitorovania a I/O subsystému

bez ďalšieho školenia personálu.

Keďže údaje nie sú rozložené na diskoch, aj keď zlyhá viacero diskov súčasne, informácie o zostávajúcich zväzkoch v skupine RAID-S budú stále dostupné aplikáciám na hostiteľskom počítači.

RAID-S implementuje pokročilú technológiu a je pripravený na jednoduchú integráciu budúcich technológií, čím chráni dlhodobé investície používateľov.

Materiál je rozdelený do troch častí: A - teória, B - prax, C - vytvorenie multibootového flash disku.

A. Všeobecná teória (populárna).

1. Žehlička.

Všetky fyzické zariadenia, ktoré každodenne používame na ukladanie informácií (HDD, CD-ROM, flash disk a dokonca aj disketa), sú blokové I/O zariadenia. K počítaču sa môžu pripojiť cez rôzne rozhrania: IDE, SATA, eSATA, USB. Operačný systém poskytuje používateľovi a programátorovi aplikačného softvéru jediný transparentný spôsob čítania/zápisu informácií z/na tieto médiá.

Ovládače komunikujú priamo s hardvérom. Ovládač je program načítaný do operačného systému. Je to vrstva medzi OS a zariadeniami, ktorá predstavuje OS so štandardným programovacím rozhraním pre blokové I/O zariadenia.

2. Údaje na fyzickom disku.

Tieto zariadenia sa nazývajú blokové zariadenia, pretože informácie sa na nich zapisujú a čítajú v blokoch (sektory, klastre) pevnej veľkosti. Veľkosť bloku je násobkom 512 bajtov. Blokový prístup je potrebný na zabezpečenie vysokej rýchlosti diskového subsystému.

Samotný disk je naformátovaný (rozdelený) na nízkej úrovni (vo výrobe). Disk je tvorený valcami. Valec je kruh na tanieri disku. Prvé valce sú umiestnené v strede kotúčovej dosky, posledné - na vonkajšom okraji. Každý valec je rozdelený na sektory. Sektory organizujú bloky na disku. Okrem samotných údajov sa do blokov zaznamenávajú informácie na kontrolu chýb. Ovládač vo vnútri pevného disku pracuje s týmito informáciami a nie je zvonku viditeľný. Ovládač posiela príkazy do radiča disku na úrovni „čítaj 10 blokov 10 cylindr 20 sektor“.

Všetky dáta užitočného zaťaženia zapísané na médium sú usporiadané do sekcií. V systéme Windows je každý oddiel zvyčajne reprezentovaný ako logická jednotka (C, D, E, ...). Na vymeniteľných médiách (flash disk, CD, disketa) sa spravidla vytvára jeden oddiel, na interných pevných diskoch je naopak zvyčajne niekoľko oddielov. Údaje v oddiele sú usporiadané v súborovom systéme.

Každý oddiel môže nezávisle nastaviť svoju vlastnú veľkosť bloku - veľkosť klastra. Upravuje pomer rýchlosti/hospodárnosti. Blok je najmenšia adresovateľná jednotka diskového priestoru. Klaster kombinuje niekoľko blokov – toto je minimálna adresovateľná jednotka v partícii.

Takto sa vytvorí nasledujúca logická hierarchia (zdola nahor): blok, sektor, valec - klaster - sekcia - súbor, adresár.

Vo väčšine súborových systémov môže súbor zaberať jeden alebo viac klastrov. Ak je teda veľkosť súboru menšia ako veľkosť klastra, súbor zaberie celý klaster. Každému súboru na disku bude pridelený počet bajtov, ktorý je násobkom veľkosti klastra. Niektoré súborové systémy sú schopné rozdeliť jeden klaster na viacero súborov (zabalenie), ale to je skôr výnimka (zatiaľ). Čím väčšia je veľkosť klastra, tým vyššia je rýchlosť a tým viac miesta sa plytvá na zhlukoch naplnených do polovice.

3. Rozloženie fyzického disku.

Veľkosť oddielu sa tiež meria v blokoch. Preto pri rozdeľovaní disku môže byť veľkosť vyjadrená v bajtoch mierne opravená programom.

Keďže na disku môže byť viacero oddielov, musia byť niekde uvedené spolu s limitmi a vlastnosťami každého oddielu. Na to slúži tabuľka partícií, ktorá sa nachádza na začiatku fyzického disku (začiatok disku je jeho prvý blok v súlade s adresovaním). V klasickom prípade je súčasťou MBR (master boot record), ktorý zaberá celý prvý blok. Celá tabuľka oddielov má pridelených 64 bajtov. Každý záznam v tabuľke pozostáva z adries začiatku a konca oddielu, typu oddielu, počtu sektorov v oddiele a príznaku „zaneprázdnenia“ oddielu a zaberá 16 bajtov. Maximálny počet partícií na disku je teda obmedzený na štyri (16 × 4 = 64).

Stalo sa to historicky, ale časom sa ukázalo, že 4 sekcie nie sú vždy dostatočné. Riešenie problému sa našlo. Oddiely, ktoré sú označené v hlavičke disku (v MBR), sa nazývajú primárne (primárne). Stále by mali byť do 4 vrátane. Okrem toho bol predstavený koncept rozšírených (rozšírených) sekcií. Rozšírený oddiel obsahuje jeden alebo viac pododdielov a neobsahuje súborový systém. On sám je plnohodnotným primárom oddielu.

Pretože pododdiely rozšíreného oddielu nie sú uvedené v tabuľke oddielov disku, nemožno ich označiť ako zavádzacie. Spúšťacia oblasť je oblasť, z ktorej sa spúšťa zavádzanie operačného systému. Je označený v položke tabuľky oddielov. Takto možno označiť iba jednu zo 4 primárnych sekcií. Rozšírený oddiel sa nedá spustiť, pretože nemá súborový systém.

Označenie rozšírenej sekcie je popísané na jej začiatku. Analogicky s MBR sa v prvom sektore nachádza EBR (Extended boot record). Popisuje rozloženie logických jednotiek tohto rozšíreného oddielu.

Optický disk a flash disk majú väčšinou len jednu partíciu, keďže menšie delenie tam nemá zmysel. Pri napaľovaní CD sa zvyčajne používa súborový systém ISO 9660. Obraz disku s týmto súborovým systémom sa nazýva obraz ISO. Často sa používa izolovane od fyzického disku ako kontajner na prenos údajov, pretože každý obrázok je bitovou presnou kópiou fyzického média.

4. Systém súborov.

Každý diskový oddiel určený na ukladanie dát (teda všetky oddiely okrem rozšíreného) je naformátovaný podľa nejakého súborového systému. Formátovanie je proces vytvárania štruktúry súborového systému v nejakom priestore na disku – partícii. Súborový systém organizuje užívateľské dáta vo forme súborov umiestnených v nejakej hierarchii adresárov (priečinkov, adresárov).

Štruktúra adresárov a súborov v partícii je klasicky popísaná v tabuľke súborov. Tabuľka zvyčajne zaberá určitý priestor na začiatku sekcie. Za tabuľkou sa zapíšu samotné údaje. Vzniká tak systém, kde je štruktúra popísaná oddelene a dáta (súbory) sú uložené oddelene.

Ak je súbor odstránený z disku, je odstránený aj z tabuľky súborov. Miesto, ktoré zaberalo na disku, je označené ako voľné. Ale nedochádza k žiadnej fyzickej očiste tohto miesta. Keď sa na disk zapisuje, údaje sa zapisujú na voľné miesto. Ak teda po odstránení vytvoríte nový súbor, existuje možnosť, že sa zapíše na miesto odstráneného súboru. Pri rýchlom formátovaní (používanom v drvivej väčšine prípadov) partície sa prepíše aj len tabuľka. Postup na obnovenie súborov po odstránení alebo formátovaní je založený na týchto funkciách.

Počas prevádzky môže dôjsť k fyzickému poškodeniu disku. Niektoré bloky sa môžu stať nečitateľnými. Tieto bloky sa nazývajú „bads“ (zlý sektor). Ak pri čítaní disku zasiahne chybný disk, dôjde k I/O chybe. V závislosti od toho, kde sa chybný blok objavil a koľko z nich sa objavilo, môže dôjsť k strate časti obsahu súborov alebo časti tabuľky súborov.

Pri pokuse o zápis na zlý blok musí radič disku určiť problém a prideliť tomuto bloku nové miesto na povrchu disku a odstrániť staré miesto z používania (premiestniť zlý blok). Robí to neviditeľne pre OS a ovládače, samo o sebe. Deje sa tak, pokiaľ je k dispozícii priestor na presun.

5. Pracujte s diskom.

Operačný systém poskytuje možnosť pracovať s diskami na úrovni súborov, oddielov a zariadení. Konkrétna implementácia prístupu ku každej úrovni závisí od konkrétneho OS. Ale v každom prípade je bežné, že k fyzickému disku a ktorejkoľvek jeho partícii je možné pristupovať rovnakým spôsobom ako k bežnému binárnemu súboru. To znamená, že do nej môžete zapisovať dáta, môžete z nej čítať dáta. Takéto funkcie sú užitočné najmä pri vytváraní a obnovovaní obrazov diskov, klonovaní diskov.

V operačných systémoch UNIX sú všetky úložné zariadenia reprezentované ako súbory v adresári /dev:

sda, sdb, sdc, ... - fyzické disky (HDD vrátane externých, flash disky, IDE disky);

fd0, fd1 - prepadne.

Oddiely na každom z diskov sú dostupné ako sda1, sda2, sd3, ...

Disky sú očíslované v poradí, v akom ich vidí BIOS. Číslovanie oddielov - v poradí, v akom boli na disku vytvorené oddiely.

Na vytvorenie obrazu (obraz je bit po bite kópia informácií umiestnených na disku alebo partícii) celého disku (napríklad prvého podľa BIOSu - sda), musíte odčítať dáta z / dev / sda do akéhokoľvek iného súboru špeciálne vytvoreného pre obrázok pomocou sekvenčného kopírovania obsahu súboru programu. Ak chcete zapísať obrázok do súboru, musíte použiť rovnaký program na odčítanie údajov z obrázka v /dev/sda. Analogicky môžete vytvoriť/obnoviť obraz oddielu (napríklad prvého na prvom disku - sda1) prístupom k /dev/sda1 namiesto /dev/sda.

6. Montáž.

Ak chcete diskové zariadenie „premeniť“ na súbor súborov a adresárov, ku ktorým je možné pristupovať, je potrebné ho pripojiť. V systéme Windows nič také ako pripojenie neexistuje. Tam sú partície jednoducho spojené s logickými jednotkami (C:, D:, E, ...). Informácie o tom, ktoré písmeno sa má priradiť ku ktorej jednotke, sú uložené v samotnom OS.

V systéme UNIX je koncept pripojenia základom práce s diskami a poskytuje oveľa väčšiu flexibilitu ako Windows. Pripojenie je proces pripojenia nejakého zdroja obrazu disku (buď samotného disku alebo súboru s jeho obrazom) k nejakému adresáru v systéme súborov UNIX. Systém súborov v systéme UNIX začína z jedného bodu - z koreňového adresára (/) a neexistujú žiadne logické jednotky C, D, E.

Na začiatku bootovania OS rodiny UNIX sa do koreňového adresára / pripojí disková partícia označená ako root (root). Adresáre služieb OS umiestnené v koreňovom adresári súborového systému by mali byť vytvorené na diskovej oblasti. Môžu sa k nim pripájať ďalšie oddiely alebo môžu byť súbory zapisované priamo do hlavného oddielu (pripojené do /).

Kľúčovým bodom je, že zdroj obrazu disku (blokové zariadenie, obrazový súbor alebo adresár už pripojeného súborového systému) možno pripojiť k ľubovoľnému adresáru na ľubovoľnej úrovni vnorenia súborového systému, ktorá začína znakom /. Rôzne logické oddiely fyzického disku sú teda reprezentované adresármi v jedinom súborovom systéme, na rozdiel od samostatných súborových systémov rôznych logických diskov v systéme Windows (kde je každý disk považovaný za autonómny súborový systém, ktorý má svoj vlastný koreňový adresár).

Ak chcete pripojiť, musíte zadať systém súborov obrazu, voľby pripojenia a adresár, ku ktorému sa má pripojiť.

Vďaka tejto flexibilite môžete naviazať jeden adresár na niekoľko rôznych miest v súborovom systéme, vytvoriť obraz disku a pripojiť ho bez zapisovania na disk, otvoriť obraz ISO. A to všetko sa deje bez použitia nástrojov tretích strán.

7. MBR - boot area.

Na začiatku fyzického disku sa zvyčajne nachádza MBR (hlavný zavádzací záznam). Toto je zavádzacia oblasť disku. Keď sa počítač spustí, BIOS určí, ktorý disk je primárny (primárny) a vyhľadá na ňom MBR. Ak sa nájde, prenesie sa naň kontrola. Ak nie, zobrazí sa chyba oznamujúca, že zavádzací disk nebol nájdený.

V MBR sa okrem tabuľky oblastí (popísanej vyššie) nachádza programový kód, ktorý sa načíta do pamäte a vykoná sa. Práve tento program by mal určiť zavádzaciu oblasť na disku a preniesť na ňu riadenie. Prenos riadenia je podobný: prvý blok (512 bajtov) zavádzacej oblasti sa umiestni do pamäte RAM a vykoná sa. Obsahuje programový kód, ktorý spúšťa spustenie operačného systému.

Vzhľadom na to, že riadenie z BIOSu sa prenáša do programu zaznamenaného na disku pri štarte počítača, je možné spružniť výber bootovacej partície. To robia nakladače GRUB a LILO, ktoré sú vo svete UNIX široko používané. V súčasnosti nemá zmysel používať posledný bootloader na moderných počítačoch. Pomocou GRUB môžete dať používateľovi na výber, ktorý oddiel sa má spustiť a ako.

Kód GRUB je príliš veľký na to, aby sa zmestil do MBR. Preto sa inštaluje na samostatný oddiel (zvyčajne ten, ktorý je pripojený na /boot) so systémom súborov FAT, FFS alebo Ext2. MBR obsahuje kód, ktorý načíta kód GRUB zo špecifického oddielu a prenáša naň riadenie.

GRUB sám alebo s pomocou používateľa určuje, z ktorého oddielu sa má bootovať. V prípade oddielu Winsows sa naň jednoducho prenesie riadenie rovnakým spôsobom, ako by to bolo z bežného MBR. V prípade Linuxu bootloader vykonáva zložitejšie akcie. Načíta jadro OS do pamäte a prenesie naň riadenie.

Zálohovanie bootovacej oblasti disku je rovnako jednoduché ako zálohovanie celého disku alebo jedného oddielu. Pointa je, že MBR zaberá prvých 512 bajtov /dev/sda disku. Preto pre zálohu MBR musíte do súboru odčítať prvých 512 bajtov /dev/sda a naopak, na obnovenie musíte súbor odčítať do /dev/sda.

Keď hovoríme o zdrojoch diskového subsystému, existujú tri z nich: množstvo miesta, rýchlosť čítania a zápisu v MB/s a rýchlosť čítania a zápisu v počte vstupných/výstupných operácií za sekundu (vstup/výstup za za druhé, IOPS alebo jednoducho I/O).

Najprv si povedzme o objeme. Uvediem úvahy, ktorými sa treba riadiť, a príklad výpočtu.

Úvahy sú nasledovné:

Miesto na disku zaberajú samotné súbory na disku virtuálneho stroja. Preto musíte pochopiť, koľko miesta potrebujú;

Ak plánujeme použiť tenké disky pre celý VM alebo jeho časť, mali by sme naplánovať ich počiatočný objem a následný rast (ďalej tenké disky znamenajú zodpovedajúci typ súborov vmdk, teda funkciu tenkého poskytovania v ESX (t.j. ) implementácia) Faktom je, že funkčnosť tenkého poskytovania môže byť implementovaná na úložnom systéme bez ohľadu na ESX(i), a nemám na mysli funkčnosť úložných systémov);

V predvolenom nastavení hypervízor pre každý VM vytvorí stránkovací súbor, ktorý sa rovná veľkosti jeho RAM. Tento stránkovací súbor sa nachádza v priečinku VM (predvolené) alebo na samostatnom LUN;

Ak plánujete použiť snímky, mali by ste pre ne naplánovať aj miesto. Ako východiskový bod možno vziať tieto úvahy:

Ak budú snímky existovať krátko po vytvorení, napríklad len počas zálohovania, vyhradíme pre ne desať percent veľkosti disku VM;

Ak sa budú snímky používať s priemernou alebo nepredvídateľnou intenzitou, potom má zmysel položiť približne 30 % veľkosti disku VM;

Ak sa aktívne používajú snímky pre virtuálne počítače (čo je relevantné v scenároch, v ktorých sa virtuálne počítače používajú na testovanie a vývoj), množstvo, ktoré zaberajú, môže byť niekoľkonásobne väčšie ako nominálna veľkosť virtuálnych diskov. V tomto prípade je ťažké poskytnúť presné odporúčania, ale ako východiskový bod možno považovať zdvojnásobenie veľkosti každého VM. (Snímka sa ďalej vzťahuje na zodpovedajúcu funkčnosť ESX(i). Faktom je, že snímky možno implementovať do úložného systému nezávisle od ESX(i), a nemám na mysli funkčnosť úložných systémov.)

Príklad vzorca vyzerá takto:

Množstvo miesta pre skupinu VM = Počet VM x (Veľkosť disku x T +

Veľkosť disku x S + Veľkosť pamäte - Veľkosť pamäte x R).

T - koeficient tenkých diskov. Ak sa takéto disky nepoužívajú, rovná sa 1. Ak áno, potom je ťažké poskytnúť abstraktný odhad v závislosti od povahy aplikácie vo VM. Tenké disky v podstate zaberajú menej miesta, ako je nominálna veľkosť disku. Takže - tento koeficient ukazuje, aký podiel nominálnej veľkosti zaberajú disky virtuálneho stroja;

S je veľkosť snímok. 10/30/200 percent, v závislosti od dĺžky nepretržitého používania;

R je percento rezervovanej pamäte. Vyhradená pamäť sa nezmestí do odkladacieho súboru, odkladací súbor je vytvorený v menšej veľkosti. Jeho veľkosť sa rovná: množstvo pamäte VM mínus množstvo rezervovanej pamäte.

Napríklad odhadované vstupné údaje nájdete v tabuľke. 1.3.

Tabuľka 1.3. Údaje na plánovanie objemu diskového podsystému

Získame odhad požadovaného objemu:

Skupina infraštruktúry - 15 x (20 + 20 x 10 % + 2 - 2 x 0) = 360 GB;

Aplikačné servery - 20 x (40 + 40 x 10 % + 2 - 2 x 0) = 920 GB;

Kritické servery - 10 x (100 + 100 x 10 % + 6 - 6 x 0,5) = 1130 GB;

Test a dočasné - 20 x (20 x 30 % + (20 x 30 %) x 200 % + 2 - 2 x 0) = = 400 GB.

Preto môžeme vytvoriť dve LUN po 1,4 TB a rozdeliť medzi ne virtuálne stroje približne rovnako. Alebo vytvorte 4-5 LUN po 600800 GB a umiestnite stroje z rôznych skupín na rôzne LUN. Obe možnosti (a tie medzi nimi) sú prijateľné. Výber medzi nimi sa uskutočňuje na základe iných preferencií (napríklad organizačných).

Ďalším zdrojom diskového subsystému je výkon. V prípade virtuálnych počítačov nie je rýchlosť MB/s spoľahlivým kritériom, pretože keď veľký počet virtuálnych počítačov pristupuje na rovnaké disky, prístupy sú nekonzistentné. Pre virtuálnu infraštruktúru je dôležitejšou charakteristikou počet vstupných / výstupných operácií (IOPS, Input / Output za sekundu). Diskový subsystém našej infraštruktúry musí umožňovať viac týchto operácií, ako požaduje virtuálny počítač.

Aká je vo všeobecnosti cesta prístupu hosťujúceho OS k fyzickým diskom:

1. Hosťujúci OS odovzdá požiadavku ovládaču radiča SAS/SCSI (ktorý preň emuluje hypervízor).

2. Ovládač ho odovzdá samotnému virtuálnemu radiču SAS/SCSI.

3. Hypervízor ho zachytí, skombinuje s požiadavkami z iných VM a odovzdá spoločný front ovládaču fyzického radiča (HBA v prípade FC a hardvérového iSCSI alebo Ethernetového radiča v prípade NFS a softvérového iSCSI).

4. Vodič odošle požiadavku riadiacej jednotke.

5. Kontrolér ho odovzdá do úložného systému prostredníctvom dátovej siete.

6. Riadiaca jednotka úložiska prijme požiadavku. Táto požiadavka je operácia čítania alebo zápisu z nejakého zväzku LUN alebo NFS.

7. LUN je „virtuálny oddiel“ v poli RAID zložený z fyzických diskov. To znamená, že radič úložiska odovzdá požiadavku jednotkám v tomto poli RAID.

Kde môže byť prekážka diskového subsystému:

S najväčšou pravdepodobnosťou na úrovni fyzických diskov. Dôležitý je počet fyzických diskov v poli RAID. Čím je ich viac, tým lepšie je možné paralelizovať operácie čítania a zápisu. Taktiež, čím rýchlejšie (z hľadiska I/O) sú samotné disky, tým lepšie;

Rôzne úrovne polí RAID majú rôzny výkon. Je ťažké poskytnúť úplné odporúčania, pretože okrem rýchlosti sa typy RAID líšia aj cenou a spoľahlivosťou. Základné úvahy sú však tieto:

RAID-10 je najrýchlejšie, ale najmenej efektívne využitie miesta na disku, pričom sa odpočítava 50 % na podporu odolnosti voči chybám;

RAID-6 je najspoľahlivejší, ale trpí slabým výkonom zápisu (30-40% RAID-10 pri 100% zápise), hoci čítanie z neho je také rýchle ako RAID-10;

RAID-5 je kompromis. Výkon zápisu je lepší ako RAID-6 (ale horší ako RAID-10), efektívnosť úložiska je vyššia (z hľadiska odolnosti voči chybám sa berie kapacita iba jedného disku). Ale RAID-5 trpí vážnymi problémami spojenými s dlhou obnovou dát po zlyhaní disku v prípade moderných vysokokapacitných diskov a veľkých RAID skupín, počas ktorých zostáva nechránený pred ďalším zlyhaním (premení sa na RAID-0) a dramaticky stráca v výkon;

RAID-0 alebo „RAID s nulovou toleranciou chýb“ nemožno použiť na ukladanie zmysluplných údajov;

Nastavenia úložného systému, najmä vyrovnávacia pamäť radiča úložného priestoru. Preštudovanie dokumentácie úložného systému je dôležité pre jeho správnu konfiguráciu a prevádzku;

Dátová sieť. Najmä ak plánujete používať úložisko IP, iSCSI alebo NFS. V žiadnom prípade nechcem povedať, že ich nie je potrebné používať – takéto systémy využívajú už dlho a mnohí. Chcem tým povedať, že by ste sa mali snažiť uistiť sa, že záťaž prenášaná do virtuálneho prostredia bude mať dostatočnú šírku pásma siete s plánovanou šírkou pásma.

Výsledná rýchlosť diskového subsystému vyplýva z rýchlosti diskov a algoritmu na paralelizáciu diskových prístupov radiča (rozumej typu RAID a podobných funkcií). Dôležitý je aj pomer počtu operácií čítania k počtu operácií zápisu – tento pomer berieme zo štatistík alebo z dokumentácie k aplikáciám v našich VM.

Vezmime si príklad. Predpokladajme, že naše VM vytvoria záťaž až 1000 IOps, z ktorých 67 % bude čítať a 33 % zapisovať. Koľko a akých diskov budeme potrebovať v prípade použitia RAID-10 a RAID-5?

V poli RAID-10 sú všetky disky zapojené do operácií čítania naraz a iba polovica je zapojená do operácií zápisu (pretože každý blok údajov sa zapisuje na dva disky naraz). V poli RAID-5 sa na čítaní zúčastňujú všetky disky, ale každý blok je zapísaný s réžiou spojenou s výpočtom a zmenou kontrolného súčtu. Môžete si predstaviť, že jeden zápis do poľa RAID-5 spôsobí štyri zápisy priamo na disky.

Zápis - 1 000 x 0,33 % = 330 x 2 (keďže zápisu sa zúčastňuje iba polovica diskov) = 660 IOps.

Celkovo potrebujeme 1330 IOps z diskov. Ak vydelíme 1330 počtom IOps deklarovaným vo výkonnostných charakteristikách jedného disku, dostaneme potrebný počet diskov v poli RAID-10 pre zadané zaťaženie.

Čítanie - 1 000 x 0,67 % = 670 IOps;

Zápis - 1 000 x 0,33 % = 330 x 4 = 1 320 IOps.

Celkovo potrebujeme 1990 IOps z diskov.

Podľa dokumentácie výrobcu zvládne jeden pevný disk SAS 15k 150-180 IOps. Jeden disk SATA 7,2k - 70-100 IOps. Existuje však názor, že je lepšie zamerať sa na mierne odlišné čísla: 50-60 pre SATA a 100-120 pre SAS.

Dokončime príklad.

Pri použití RAID-10 a SATA potrebujeme 22-26 diskov.

Pri použití RAID-5 a SAS potrebujeme 16-19 diskov.

Je zrejmé, že výpočty, ktoré som uviedol, sú dosť približné. Úložné systémy využívajú rôzne druhy mechanizmov, predovšetkým ukladanie do vyrovnávacej pamäte - na optimalizáciu prevádzky úložného systému. Ale ako východiskový bod pre pochopenie procesu dimenzovania diskového subsystému sú tieto informácie užitočné.

V pozadí sú metódy na získanie počtu IOPS požadovaných pre VM a pomeru čítania a zápisu. Pre existujúcu infraštruktúru (pri jej presune na virtuálne stroje) je možné tieto údaje získať pomocou špeciálnych nástrojov na zber informácií, ako je VMware Capacity Planner. Pre plánovanú infraštruktúru – z dokumentácie k aplikáciám a vlastných skúseností.