Види RAID та їх характеристики. Практичні поради щодо створення RAID-масивів на домашніх ПК

Проблема підвищення надійності зберігання інформації завжди стоїть на порядку денному. Особливо це стосується великих масивів даних, баз даних яких залежить робота комплексних систем у великому діапазоні сфер галузей. Особливо це важливо для високопродуктивнихсерверів.

Як відомо, продуктивність сучасних процесорів незмінно зростає, за чим явно не встигають у своєму розвитку сучасні
жорсткі диски. Наявність одного диска, будь то SCSI або, ще гірше IDE, вже не зможе вирішитизавдання, актуальні для нашого часу. Потрібно безліч дисків, які будуть доповнювати один одного, підміняти у разі виходу одного з них, зберігати резервні копії, працювати якісно та продуктивно.

Проте, просто наявності кількох жорстких дисків недостатньо, їх потрібно об'єднати в систему, яка злагоджено працюватиме і не допустить втрати даних при будь-яких збоях, пов'язаних з дисками.

Про створення такої системи треба подбати заздалегідь, адже, як каже відоме прислів'я – докисмажений півень не клюне- не вхопляться. Можна втратити свої дані безповоротно.

Цією системою може стати RAID– технологія віртуального зберігання інформації, що об'єднує кілька дисків на один логічний елемент. RAID масивом називається надлишковий масивнезалежні диски. Використовують зазвичай для покращення продуктивності та надійності.

Що потрібне для створення рейд? Як мінімум наявність двох вінчестерів. Залежно від рівня масиву варіюється кількість пристроїв зберігання, що використовуються.

Які бувають масиви raid

Існують базові комбіновані масиви RAID. Інститут у Берклі штат Каліфорнія запропонував розділяти рейд на рівні специфікації:

  • Базові:
    • RAID 1 ;
    • RAID 2 ;
    • RAID 3 ;
    • RAID 4 ;
    • RAID 5 ;
    • RAID 6 .
  • Комбіновані:
    • RAID 10 ;
    • RAID 01 ;
    • RAID 50 ;
    • RAID 05 ;
    • RAID 60 ;
    • RAID 06 .

Розглянемо найчастіше використовувані.

Рейд 0

RAID 0 призначенийдля збільшення швидкості та запису. Він не збільшує надійність зберігання, тому не є надлишковим. Ще його звуть страйп (striping - «чергування»). Зазвичай використовуєтьсявід 2 до 4 дисків.

Дані поділяються на блоки, що записують по черзі диски. Швидкістьзапису/читання зростає при цьому в число разів, кратне кількості дисків. З недоліківможна відзначити збільшену ймовірність втрати даних за такої системи. Бази даних на таких дисках зберігати не має сенсу, адже будь-який серйозний збійпризведе до повної непрацездатності рейду, оскільки немає коштів відновлення.

Рейд 1

RAID 1 забезпечує дзеркальнезберігання даних на апаратному рівні. Називають також масив Mirror, що значить « Дзеркало» . Тобто дані дисків у разі дублюються. Можна, можливо використовуватиза кількості пристроїв зберігання від 2 до 4.

Швидкістьзапису/читання при цьому практично не змінюється, що можна віднести до переваг. Масив працює, якщо хоч один диск рейду знаходиться в роботі, але об'єм системи при цьому дорівнює обсягу одного диска. На практиці при виході з ладуодного з вінчестерів Вам потрібно буде якнайшвидше вжити заходів для його заміни.

Рейд 2

RAID 2 – використовує так званий код Хеммінгу. Дані розбиваються по жорстких дисках аналогічно RAID 0, на дисках, що залишилися, зберігаються. коди виправлення помилок, при збої за якими можна регенеруватиінформації. Цей метод дозволяє на льоту виявляти, а потім і виправлятизбої у системі.

Швидкість читання/записиу цьому випадку порівняно з використанням одного диска підвищується. Мінусом є велика кількість дисків, при якому його раціонально застосовувати, щоб не було надмірності даних, зазвичай це 7 і більше.

RAID 3 - в масиві дані розбиваються на всі диски крім одного, в якому зберігаються байти парності. Стійкий до відмовам системи. Якщо один із дисків виходить з ладу. То його інформацію легко «підняти», використовуючи дані контрольних сум парності.

В порівнянні з RAID 2 немає можливостікорекції помилок на льоту. Цей масив відрізняється високою продуктивністюта можливістю використовувати від 3 дисків та більше.

Головним мінусомтакої системи можна вважати підвищене навантаження на диск, що зберігає байти парності та низьку надійність цього диска.

Рейд 4

В цілому RAID 4 аналогічний RAID 3 різницеющо дані парності зберігаються в блоках, а не в байтах, що дозволило збільшити швидкість передачі даних малого обсягу.

Мінусомзазначеного масиву виявляється швидкість запису, адже парність запису генерується на єдиний диск, як і RAID 3.

Це непогане рішення для тих серверів, де файли частіше зчитуються, ніж записуються.

Рейд 5

RAID від 2 до 4 мають недоліки, пов'язані з неможливістю розпаралелювання операцій запису. RAID 5 усуваєцей недолік. Блоки парності записуються одночаснона всі дискові пристрої масиву, немає асинхронностіу розподілі даних, отже, парність є розподіленою.

Числовикористовуваних вінчестерів від 3. Масив дуже поширений завдяки своїй універсальностіі економічностіЧим більше дисків буде використовуватися, тим економніше буде витрачатися дисковий простір. Швидкістьпри цьому високаза рахунок розпаралелювання даних, але продуктивністьзнижується у порівнянні з RAID 10, за рахунок великої кількості операцій. Якщо виходить один диск, то надійність знижується до рівня RAID 0. Потрібно багато часу на відновлення.

Рейд 6

Технологія RAID 6 схожа на RAID 5, але підвищується надійністюза рахунок збільшення кількості дисків парності.

Однак, дисків вже потрібно мінімум 5 і більш потужний процесор для обробки збільшеного числа операцій, причому кількість дисків обов'язково має бути рівним простим числом 5,7,11 і так далі.

Рейд 10, 50, 60

Далі йдуть комбінаціїзазначених раніше рейдів. Наприклад, RAID 10 це RAID 0 + RAID 1.

Вони успадковують і перевагимасивів їх складових у плані надійності, продуктивності та кількості дисків, а водночас економічності.

Створення рейду масиву на домашньому ПК

Переваги створення рейд масиву будинку неочевидні з огляду на те, що це неекономічно, Втрата даних не настільки критична у порівнянні з серверами, а інформаціюможна зберігати у резервних копіях, періодично роблячи бекапи.

Для цього Вам знадобиться рейд-контролер, що володіє власним BIOS і своїми налаштуваннями. У сучасних системних платах рейд-контролер може бути інтегрованийу південний міст чіпсета. Але навіть у таких платах за допомогою підключення до PCI або PCI-E роз'єму можна підключити ще один контролер. Прикладами можуть бути пристрої фірм Silicon Image та JMicron.

Кожен контролер може мати свою утиліту для налаштування.

Розглянемо створення рейду за допомогою Intel Matrix Storage Manager Option ROM.

Перенесітьвсі дані з ваших дисків, інакше в процесі створення масиву вони будуть очищені.

Зайдіть у BIOSSetupВашої материнської плати та увімкніть режим роботи RAIDдля вашого sata вінчестер.

Щоб запустити утиліту, перезавантажте ПК, натисніть ctrl+iпід час процедури POST. У вікні програми ви побачите список доступних дисків. Натисніть Create Massive, Далі виберіть необхідний рівень масиву.

Надалі слідуючи інтуїтивно зрозумілому інтерфейсу, введіть розмір масивуі підтвердітьйого створення.

Якщо Ви зацікавилися цією статтею, то Ви, мабуть, зіткнулися або припускаєте незабаром зіткнутися з однією з наведених нижче проблем на Вашому комп'ютері:

- явно не вистачає фізичного обсягу вінчестера як єдиного логічного диска. Найчастіше ця проблема виникає під час роботи з файлами великого обсягу (відео, графіка, бази даних);
- явно не вистачає продуктивність вінчестера. Найчастіше ця проблема виникає під час роботи з системами нелінійного відео монтажу або одночасному зверненні до файлів на вінчестері великої кількості користувачів;
- явно не вистачає надійності вінчестера. Найчастіше ця проблема виникає при необхідності працювати з даними, які в жодному разі не можна втратити або які повинні завжди бути доступні для користувача. Сумний досвід показує, що навіть найнадійніша техніка іноді ламається і, як правило, в самий не підходящий момент.
Вирішити ці та деякі інші проблеми може створити на вашому комп'ютері RAID-системи.

Що таке "RAID"?

У 1987 році Паттерсон (Patterson), Гібсон (Gibson) і Катц (Katz) з Каліфорнійського університету Берклі опублікували статтю "Корпус для надлишкових масивів з дешевих дисководів (RAID)". У цій статті описувалися різні типи дискових масивів, що позначаються скороченням RAID - Redundant Array of Independent (або Inexpensive) Disks (надлишковий масив незалежних (або недорогих) дисководів). В основу RAID покладено таку ідею: об'єднуючи в масив кілька невеликих та/або дешевих дисководів, можна отримати систему, що перевершує за обсягом, швидкості роботи та надійності найдорожчі дисководи. До того ж така система з погляду комп'ютера виглядає як єдиний дисковод.
Відомо, що середній час напрацювання на відмову масиву дисководів дорівнює середньому часу напрацювання на відмову одиночного дисководу, поділеному на кількість дисководів у масиві. Внаслідок цього середній час напрацювання на відмову масиву виявляється занадто малим для багатьох програм. Однак дисковий масив можна декількома способами зробити стійким до відмови одного дисководу.

У вищезгаданій статті було визначено п'ять типів (рівень) дискових масивів: RAID-1, RAID-2, ..., RAID-5. Кожен тип забезпечував стійкість на відмову, і навіть різні переваги проти одиночним дисководом. Поряд з цими п'ятьма типами популярність набув також дисковий масив RAID-0, що не має надмірності.

Які існують рівні RAID та який із них вибрати?

RAID-0. Зазвичай визначається як НЕ надлишкова група дисководів без контролю парності. RAID-0 за способом розміщення інформації з дисководів, що входять до масиву, іноді називається "Striping" ("смугастий" або "тільник"):

Оскільки RAID-0 не має надмірності, аварія одного дисководу призводить до аварії всього масиву. З іншого боку, RAID-0 забезпечує максимальну швидкість обміну та ефективність використання об'єму дисководів. Оскільки для RAID-0 не потрібні складні математичні чи логічні обчислення, витрати на його реалізацію є мінімальними.

Область застосування: аудіо- та відео програми, що вимагають високої швидкості безперервної передачі даних, яку не може забезпечити одиночний дисковод. Наприклад, дослідження, проведені фірмою Mylex, з метою визначити оптимальну конфігурацію дискової системи для станції нелінійного відео монтажу показують, що, порівняно з одним дисководом, масив RAID-0 із двох дисководів дає приріст швидкості запису/читання на 96% з трьох дисководів. - На 143% (за даними тесту Miro VIDEO EXPERT Benchmark).
Мінімальна кількість дисководів у масиві "RAID-0" – 2шт.

RAID-1. Більш відомий як "Mirroring" ("Дзеркалювання") - це пара дисководів, що містять однакову інформацію та складають один логічний диск:

Запис проводиться на обидва диски в кожній парі. Тим не менш, дисководи, що входять до пари, можуть здійснювати одночасні операції читання. Таким чином, «дзеркалювання» може подвоювати швидкість читання, але швидкість запису залишається незмінною. RAID-1 має 100% надмірність і аварія одного дисководу не призводить до аварії всього масиву - контролер просто перемикає операції читання/запису на дисковод, що залишився.
RAID-1 забезпечує найвищу швидкість роботи серед усіх типів надлишкових масивів (RAID-1 - RAID-5), особливо в розрахованому на багато користувачів оточенні, але найгірше використання дискового простору. Оскільки для RAID-1 не потрібні складні математичні чи логічні обчислення, витрати на його реалізацію є мінімальними.
Мінімальна кількість дисководів у масиві "RAID-1" – 2шт.
Для збільшення швидкості запису та забезпечення надійності зберігання даних кілька масивів RAID-1 можна об'єднати в RAID-0. Така конфігурація називається «двухрівневий» RAID або RAID-10 (RAID 0+1):


Мінімальна кількість дисководів у масиві "RAID 0+1" – 4шт.
Область застосування: дешеві масиви, у яких головне – надійність зберігання даних.

RAID-2. Розподіляє дані по страйпів розміром у сектор групи дисководів. Деякі дисків виділяються для зберігання ECC (код корекції помилок). Оскільки більшість дисководів за замовчуванням зберігають коди з ECC для кожного сектора, RAID-2 не дає особливих переваг у порівнянні з RAID-3 і тому практично не застосовується.

RAID-3. Як і у випадку з RAID-2, дані розподіляються за страйпами розміром в один сектор, а один з дисководів масиву відводиться для зберігання інформації про парність:

RAID-3 покладається на коди з ECC, що зберігаються у кожному секторі виявлення помилок. У разі відмови одного з дисководів відновлення інформації, що зберігалася на ньому, можливе за допомогою обчислення виключає АБО (XOR) за інформацією на дисководах, що залишилися. Кожен запис зазвичай розподілено по всіх дисководах і тому цей тип масиву хороший для роботи в додатках з інтенсивним обміном з дисковою підсистемою. Оскільки кожна операція введення-виводу звертається до всіх дисків масиву, RAID-3 не може одночасно виконувати кілька операцій. Тому RAID-3 хороший для однокористувацького однозадачного оточення з довгими записами. Для роботи з короткими записами потрібна синхронізація обертання дисководів, оскільки інакше неминуче зменшення швидкості обміну. Застосовується рідко, тому що. програє RAID-5 з використанням дискового простору. Реалізація потребує значних витрат.
Мінімальна кількість дисководів у масиві "RAID-3" – 3шт.

RAID-4. RAID-4 ідентичний RAID-3 за винятком того, що розмір страйпів набагато більше одного сектора. І тут читання здійснюється з одного дисковода (крім дисковода, що зберігає інформацію про парності), тому можливе одночасне виконання кількох операцій читання. Тим не менш, оскільки кожна операція запису повинна оновити вміст дисководу парності, одночасне виконання кількох операцій запису неможливе. Цей тип масиву немає помітних переваг перед масивом типу RAID-5.
RAID-5. Цей тип масиву іноді називається «масив з парністю, що обертається». Даний тип масиву успішно долає властивий RAID-4 недолік - неможливість одночасного виконання кількох операцій запису. У цьому масиві, як і RAID-4, використовуються страйпивеликого розміру, але, на відміну від RAID-4, інформація про парність зберігається не на одному дисководі, а на всіх дисководах по черзі:

Операції запису звертаються до одного дисководу з даними та іншого дисководу з інформацією про парності. Оскільки інформація про парність для різних страйпів зберігається на різних дисководах виконання декількох одночасних операцій запису неможливе лише в тих поодиноких випадках, коли або страйпи з даними, або страйпи з інформацією про парність знаходяться на тому самому дисководі. Чим більше дисководів у масиві, тим рідше збігається розташування страйпів інформації та парності.
Область застосування: надійні масиви великого обсягу. Реалізація потребує значних витрат.
Мінімальна кількість дисководів у масиві "RAID-5" – 3шт.

RAID-1 чи RAID-5?
RAID-5 проти RAID-1 більш економно використовує дискове простір, оскільки у ньому для надмірності зберігається не «копія» інформації, а контрольне число. У результаті RAID-5 можна об'єднати будь-яку кількість дисководів, з яких тільки один буде містити надмірну інформацію.
Але більш висока ефективність використання дискового простору досягається за рахунок нижчої швидкості обміну інформацією. Під час запису інформації в RAID-5 треба щоразу оновлювати інформацію про парність. Для цього треба визначити, які саме біти парності змінилися. Спочатку зчитується стара інформація, що підлягає оновленню. Потім ця інформація перемножується XOR з новою інформацією. Результат цієї операції - бітова маска, в якій кожен біт = 1 означає, що в інформації про парність у відповідній позиції треба замінити значення. Потім оновлена ​​інформація про парність записується на місце. Отже, на кожну вимогу програми записати інформацію, RAID-5 здійснює два читання, два записи та дві операції XOR.
За те, що більш ефективно використовується дисковий простір (замість копії даних зберігається блок парності) доводиться платити: на генерацію та запис інформації про парність йде додатковий час. Це означає, що швидкість запису на RAID-5 нижче, ніж на RAID-1 у співвідношенні 3:5 або навіть 1:3 (тобто швидкість запису на RAID-5 становить від 3/5 до 1/3 швидкості запису RAID-1). Через це RAID-5 безглуздо створювати у програмному варіанті. Їх також не можна рекомендувати в тих випадках, коли швидкість запису має вирішальне значення.

Який спосіб реалізації RAID - програмний чи апаратний?

Прочитавши опис різних рівнів RAID, можна помітити, що ніде не згадуються будь-які специфічні вимоги до апаратури, яка необхідна для реалізації RAID. З чого можна зробити висновок, що все, що потрібно для реалізації RAID - підключити необхідну кількість дисководів до контролера, що є в комп'ютері, і встановити на комп'ютер спеціальне програмне забезпечення. Це правильно, але не зовсім!
Справді, є можливість програмної реалізації RAID. Прикладом може бути ОС Microsoft Windows NT 4.0 Server, у якій можлива програмна реалізація RAID-0, -1 і навіть RAID-5 (Microsoft Windows NT 4.0 Workstation забезпечує лише RAID-0 та RAID-1). Однак це рішення слід розглядати як вкрай спрощене, що не дозволяє повністю реалізувати можливості RAID-масиву. Досить зазначити, що з програмної реалізації RAID все навантаження з розміщення інформації на дисководах, обчислення контрольних кодів тощо. лягає на центральний процесор, що, природно, не збільшує продуктивності та надійності системи. З тих же причин, тут практично відсутні будь-які сервісні функції та всі операції із заміни несправного дисковода, додавання нового дисковода, зміни рівня RAID тощо проводяться з повною втратою даних і при повній забороні виконання будь-яких інших операцій. Єдина перевага програмної реалізації RAID - мінімальна вартість.
- спеціалізований контролер звільняє центральний процесор від основних операцій із RAID, причому ефективність контролера тим більше помітна, що стоїть рівень складності RAID;
- контролери, як правило, мають драйвери, що дозволяють створити RAID практично для будь-якої популярної ОС;
- вбудований BIOS контролера і програми управління, що додаються до нього, дозволяють адміністратору системи легко підключати, відключати або замінювати дисководи, що входять до RAID, створювати кілька RAID-масивів, причому навіть різних рівнів, контролювати стан дискового масиву і т.д. У «просунутих» контролерів ці операції можна робити «на лету», тобто. не вимикаючи системний блок. Багато операцій може бути виконано у «фоновому режимі», тобто. не перериваючи поточну роботу і навіть дистанційно, тобто. з будь-якого (звісно за наявності доступу) робочого місця;
- Контролери можуть оснащуватися буферною пам'яттю («кеш»), в якій запам'ятовуються кілька останніх блоків даних, що, при частому зверненні до тих самих файлів, дозволяє значно збільшити швидкодію дискової системи.
Недоліком апаратної реалізації RAID є відносно висока вартість RAID-контролерів. Однак, з одного боку, за все (надійність, швидкодія, обслуговування) треба платити. З іншого боку, останнім часом, з розвитком мікропроцесорної техніки, вартість RAID-контолерів (особливо молодших моделей) почала різко падати і стала порівнянною з вартістю звичайних дискових контролерів, що дозволяє встановлювати RAID-системи не тільки в дорогі мейнфрейми, а й у сервери. початкового рівня та навіть у робочі станції.

Як вибрати модель RAID-контролера?

Можна виділити кілька типів RAID-контролерів залежно від їх функціональних можливостей, конструктивного виконання та вартості:
1. Контролери дисководу із функціями RAID.
По суті це звичайний дисковий контролер, який завдяки спеціальній прошивці BIOS дозволяє об'єднувати дисководи в RAID-масив, як правило, рівня 0, 1 або 0+1.

Ultra (Ultra Wide) SCSI контролер компанії Mylex KT930RF (KT950RF).
Зовні цей контролер нічим не відрізняється від звичайного SCSI-контролера. Вся "спеціалізація" знаходиться в BIOS, який ніби розділений на дві частини - "Конфігурація SCSI" / "Конфігурація RAID". Незважаючи на невисоку вартість (менше $200) даний контролер має непоганий набір функцій:

- об'єднання до 8 дисководів в RAID 0, 1або 0+1;
- Підтримка Hot Spareдля заміни "на льоту" дисковода, що вийшов з ладу;
- Можливість автоматичної (без втручання оператора) заміни несправного дисковода;
- автоматичний контроль цілісності та ідентичності (для RAID-1) даних;
- наявність пароля для доступу до BIOS;
- програма RAIDPlus, що представляє інформацію про стан дисководів у RAID;
- драйвери для DOS, Windows 95, NT 3.5x, 4.0

Жорсткі диски виконують не останню роль комп'ютера. Там зберігається різна інформація користувача, із них здійснюється запуск ОС тощо. Жорсткі диски не вічні і мають певний запас міцності. А також кожен жорсткий диск має свої відмінні характеристики.

Швидше за все, колись ви чули про те, що зі звичайних жорстких дисків можна зробити так звані рейд-масиви. Це необхідно для того, щоб покращити роботу накопичувачів та забезпечити надійність зберігання інформації. Крім того, такі масиви можуть мати свої номери (0, 1, 2, 3, 4 тощо). У цій статті ми розповімо вам про RAID-масиви.

RAIDє сукупність жорстких дисків або дисковий масив. Як ми говорили, такий масив забезпечує надійність зберігання даних, і навіть підвищує швидкість читання чи запису інформації. Існують різні конфігурації RAID-масивів, які відзначаються номерами 1, 2, 3, 4 і т.д. та відрізняються функціями, які вони виконують. Завдяки використанню таких масивів із конфігурацією 0 ви значно покращите продуктивність. Одиничний RAID-масив гарантує цілковиту безпеку ваших даних, оскільки якщо один з дисків вийде з ладу, то інформація перебуватиме на другому жорсткому диску.

По суті, RAID-масив– це 2 або n-на кількість жорстких дисків, підключених до материнської плати, що підтримує можливість створення рейдів. Програмно ви можете вибрати конфігурацію рейду, тобто вказати, яким чином ці диски повинні працювати. Для цього потрібно вказати налаштування в БІОС.

Для установки масиву нам потрібна материнська плата, яка підтримує технологію рейд, 2 однакових (повністю за всіма параметрами) жорстких дисків, які і підключаємо до материнської плати. У БІОС необхідно виставити параметр SATA Configuration: RAID.При завантаженні комп'ютера натискаємо клавіші CTR-I,і вже там здійснюємо налаштування RAID. І вже після цього зазвичай здійснюємо установку Windows.

Варто звернути увагу, що якщо ви створюєте або видаляєте рейд, то вся інформація, яка є на накопичувачах, видаляється. Тому необхідно заздалегідь зробити її копію.

Давайте розглянемо конфігурації RAID, які ми вже говорили. Їх кілька: RAID 1, RAID 2, RAID 3, RAID 4, RAID 5, RAID 6 тощо.

RAID-0 (striping), він же є масивом нульового рівня або «нульовим масивом». Даний рівень значно підвищує швидкість роботи з дисками, але не забезпечує додаткової відмовостійкості. Насправді ця конфігурація є рейд-масивом суто формально, адже за такої конфігурації відсутня надмірність. Запис у такому зв'язуванні відбувається блоками, по черзі записуваними різні диски масиву. Головним мінусом є ненадійність зберігання даних: при виході з ладу одного з дисків масиву, вся інформація знищується. Чому так виходить? А виходить це тому, що кожен файл може бути записаний блоками відразу на кілька вінчестерів, і при несправності будь-якого з них порушується цілісність файлу, а отже відновити його не є можливим. Якщо ви цінуєте швидкодію і регулярно робите бекапи, цей рівень масиву можна застосовувати на домашньому ПК, що дасть відчутний приріст у продуктивності.

RAID-1 (mirroring)- "дзеркальний режим". Цей рівень RAID-масивів можна назвати рівнем для параноїків: цей режим майже не дає жодного приросту до продуктивності системи, але абсолютно захищає ваші дані від пошкодження. Навіть вивівши з ладу один із дисків, точна копія втраченого зберігатиметься на іншому диску. Цей режим, як і перший, також можна реалізувати на домашньому ПК людям, які надзвичайно дорожать даними на їх дисках.

При побудові цих масивів використовується алгоритм відновлення інформації за допомогою кодів Хеммінга (американський інженер, який розробив цей алгоритм в 1950 для корекції помилок при роботі електромеханічних обчислювачів). Для забезпечення цього RAID контролером створюються дві групи дисків — одна для зберігання даних, друга група для зберігання кодів корекції помилок.

Подібний тип RAID набув малого поширення в домашніх системах через надмірну надмірність кількості жорстких дисків - так, в масиві з семи жорстких дисків під дані будуть відведені лише чотири. При зростанні кількості дисків надмірність знижується, що відображено у наведеній таблиці.

Основною перевагою RAID 2 є можливість корекції помилок, що виникають «на льоту» без зниження швидкості обміну даними між дисковим масивом і центральним процесором.

RAID 3 та RAID 4

Ці два типи дискових масивів дуже схожі за схемою побудови. В обох для зберігання інформації використовується кілька жорстких дисків, один із яких використовується виключно для розміщення контрольних сум. Для створення RAID 3 та RAID 4 достатньо трьох вінчестерів. На відміну від RAID 2 відновлення даних "на льоту" неможливе - інформація відновлюється після заміни жорсткого диска, що вийшов з ладу, протягом деякого часу.

Різниця між RAID 3 та RAID 4 полягає в рівні розбиття даних. У RAID 3 інформація розбивається на окремі байти, що призводить до серйозного уповільнення під час запису/читання великої кількості дрібних файлів. RAID 4 відбувається розбиття даних на окремі блоки, розмір яких не перевищує розмір одного сектора на диску. В результаті підвищується швидкість обробки невеликих файлів, що є критичним для персональних комп'ютерів. З цієї причини RAID 4 набув більшого поширення.

Істотним недоліком масивів, що розглядаються, є підвищене навантаження на жорсткий диск, призначений для зберігання контрольних сум, що істотно знижує його ресурс.

RAID-5. Так званий стійкий до відмови масив незалежних дисків з розподіленим зберіганням контрольних сум. Це означає, що на масиві з n дисків, n-1 диск буде відведено під безпосереднє зберігання даних, а останній зберігатиме контрольну суму ітерації n-1 страйпу. Щоб пояснити наочніше, уявімо, що нам потрібно записати певний файл. Він поділиться на порції однакової довжини та почергово почне циклічно записуватися на всі n-1 дисків. На останній диск записуватиметься контрольна сума байтів порцій даних кожної ітерації, де контрольна сума буде реалізована порозрядною операцією XOR.

Варто відразу попередити, що при виході з ладу будь-якого з дисків, він перейде в аварійний режим, що істотно знизить швидкодію, т.к. для складання файлу воєдино будуть проводитися зайві маніпуляції для відновлення його «зниклих» елементів. При виході з експлуатації одночасно двох і більше дисків, інформацію, що зберігається на них, неможливо буде відновити. В цілому, реалізація рейд-масиву п'ятого рівня забезпечує досить високу швидкість доступу, паралельний доступ до різних файлів та хорошу відмовостійкість.

Значною мірою зазначену вище проблему вирішує побудова масивів за схемою RAID 6. У цих структурах під зберігання контрольних сум, які також циклічно і рівномірно розносяться на різні диски, виділяється обсяг пам'яті, що дорівнює обсягу двох жорстких дисків. Замість однієї обчислюються дві контрольні суми, що гарантує цілісність даних при одночасному виході з експлуатації відразу двох вінчестерів у масиві.

Переваги RAID 6 — висока ступінь захищеності інформації та менше, ніж RAID 5, падіння продуктивності у процесі відновлення даних під час заміни пошкодженого диска.

Недолік RAID 6 — зниження загальної швидкості обміну даними приблизно на 10% через збільшення обсягу необхідних обчислень контрольних сум, а також через зростання обсягу інформації, що записується/зчитується.

Комбіновані типи RAID

Крім розглянутих вище основних типів широко застосовуються різні комбінації, які компенсують ті чи інші недоліки простих RAID. Зокрема, поширене використання схем RAID 10 і RAID 0+1. У першому випадку пару дзеркальних масивів поєднують у RAID 0, у другому навпаки - два RAID 0, поєднують у дзеркало. І в тому, і в іншому випадку до захищеності інформації RAID 1 додається підвищена продуктивність RAID 0.

Нерідко з метою підвищення рівня захисту важливої ​​інформації використовуються схеми побудови RAID 51 або RAID 61 - дзеркаловання і так високозахищених масивів забезпечує виняткову безпеку даних при будь-яких збоях. Однак у домашніх умовах такі масиви реалізовувати недоцільно через надмірну надмірність.

Побудова масиву дисків - від теорії до практики

Побудовою та управлінням роботою будь-якого RAID займається спеціалізований RAID-контролер. На превеликий полегшення рядового користувача персонального комп'ютера, у більшості сучасних материнських плат ці контролери вже реалізуються на рівні південного мосту чіпсету. Так що для побудови масиву жорстких дисків достатньо потурбуватися про придбання необхідної їх кількості та визначення бажаного типу RAID у відповідному розділі налаштування BIOS. Після цього в системі замість кількох жорстких дисків ви побачите лише один, який за бажанням можна розбивати на розділи та логічні диски. Зверніть увагу, що тим, хто ще користується ОС Windows XP, потрібно встановити додатковий драйвер.

І насамкінець ще одна порада — для створення RAID купуйте жорсткі диски однакового обсягу, одного виробника, однієї моделі та бажано з однієї партії. Тоді вони будуть оснащені однаковими наборами логіки, і робота масиву цих жорстких дисків буде найбільш стабільною.

Теги: , https://сайт/wp-content/uploads/2017/01/RAID1-400x333.jpg 333 400 Leonid Borislavsky /wp-content/uploads/2018/05/logo.svg?3Leonid Borislavsky 2017-01-16 08:57:09 2017-01-16 07:12:59 Що таке RAID-масиви і навіщо вони потрібні

Короткий огляд технології RAID

У цьому документі описуються базові елементи технології RAID та наводиться короткий огляд різних рівнів RAID.

  • RAID 2, 3

    RAID 4, 5

    Таблиця: переваги та недоліки основних рівнів RAID

RAID- це акронім від Redundant Array of Independent Disks.

Дисковий масив - це набір дискових пристроїв, що працюють разом, щоб підвищити швидкість та надійність системи вводу/виводу. Цим набором пристроїв керує спеціальний RAID-контролер ( контролер масиву), який інкапсулює в собі функції розміщення даних масиву; а для решти системи дозволяє представляти весь масив як один логічний пристрій введення/виводу. За рахунок паралельного виконання операцій читання і запису на декількох дисках, масив забезпечує підвищену швидкість обмінів в порівнянні з одним великим диском.

Масиви також можуть забезпечувати надмірне зберігання даних, щоб дані не були втрачені у разі виходу з ладу одного з дисків. Залежно від рівня RAID, проводиться або дзеркаловання або розподілення даних по дисках.

Рівні RAID

Кожен із чотирьох основних рівнів RAID використовує унікальний метод запису даних на диски, тому всі рівні забезпечують різні переваги. Рівні RAID 1,3 та 5 забезпечують дзеркалювання або зберігання бітів парності; і тому дозволяють відновити інформацію у разі збою одного з дисків.

RAID рівня 0

Технологія RAID 0 також відома як розподіл даних ( data striping). З використанням цієї технології, інформація розбивається на шматки (фіксовані обсяги даних, зазвичай іменовані блоками); і ці шматки записуються на диски і зчитуються з них паралель. З погляду продуктивності це означає два основних переваги:

    підвищується пропускна здатність послідовного введення/виводу за рахунок одночасного завантаження кількох інтерфейсів.

    знижується латентність випадкового доступу; декілька запитів до різних невеликих сегментів інформації можуть виконуватись одночасно.

Нестача: рівень RAID 0 призначений виключно для підвищення продуктивності і не забезпечує надмірності даних. Тому будь-які дискові збої вимагатимуть відновлення інформації із резервних носіїв.

Контролер Масиву

Диск 1

Диск 2

Диск 3

Диск 4

Диск 5

Сегмент 1

Сегмент 2

Сегмент 3

Сегмент 4

Сегмент 5

Сегмент 6

Сегмент 7

Сегмент 8

Сегмент 9

Сегмент 10

Рис. 1. Схема роботи масиву та розподіл даних по дисках для RAID 0. Примітка: сегмент- це 2 дискові блоки по 512 байт.

RAID рівня 1

Технологія RAID 1 також відома як дзеркало ( disk mirroring). У цьому випадку копії кожного шматка інформації зберігаються на окремому диску; або, звичайно, кожен (використовується) диск має "двійника", який зберігає точну копіюцього диска. Якщо відбувається збій одного з основних дисків, цей замінюється своїм "двійником". Продуктивність довільного читання може бути покращена, якщо для читання інформації буде використовуватися той із "двійників", головка якого розташована ближче до необхідного блоку.

Час запису може бути трохи більше, ніж для одного диска, залежно від стратегії запису: запис на два диски може здійснюватися або паралель (для швидкості), або суворо послідовно (для надійності).

Рівень RAID 1 добре підходить для програм, які вимагають високої надійності, низької латентності під час читання, а також якщо не потрібна мінімізація вартості. RAID 1 забезпечує надмірність зберігання інформації, але у разі слід підтримувати резервну копію даних, т.к. це єдиний спосіб відновити випадково віддалені файли чи директорії.

Диск 1 (дані)

Диск 2 (копія диска 1)

Диск 3 (дані)

Диск 4 (копія диска 3)

Диск 5 (вільний)

Сегмент 1

Сегмент 1

Сегмент 2

Сегмент 2

Сегмент 3

Сегмент 3

Сегмент 4

Сегмент 4

Рис. 2. Розподіл даних із дисків для RAID 1.

RAID рівнів 2 та 3

Технологія RAID рівнів 2 та 3 передбачає паралельну ("в унісон") роботу всіх дисків. Ця архітектура вимагає зберігання бітів парності кожного елемента інформації, розподіленого по дисках. Відмінність RAID 3 від RAID 2 полягає тільки в тому, що RAID 2 використовує для зберігання бітів парності кілька дисків, тоді як RAID 3 використовує лише один. RAID 2 використовується дуже рідко.

Якщо відбувається збій одного диска з даними, система може відновити його вміст за вмістом інших дисків з даними та диска з інформацією парності.

Продуктивність у цьому випадку дуже велика для великих обсягів інформації, але може бути дуже скромною для малих обсягів, оскільки читання декількох невеликих сегментів інформації неможливо перекривається.

Диск 1 (дані)

Диск 2 (дані)

Диск 3 (дані)

Диск 4 (дані)

Диск 5 (інформація парності)

Байт парності

Байт парності

Рис. 3. Розподіл даних на диски для RAID 3.

RAID рівнів 4 та 5

RAID 4 виправляє деякі недоліки технології RAID 3 за рахунок використання великих сегментів інформації, що розподіляються по всіх дисках, крім диска з інформацією парності. При цьому для невеликих обсягів інформації використовується лише диск, на якому потрібна інформація. Це означає, що можливе одночасне виконання кількох запитів на читання. Однак запити на запис породжують блокування під час запису інформації парності. RAID 4 використовується дуже рідко.

Технологія RAID 5 дуже подібна до RAID 4, але усуває пов'язані з нею блокування. Відмінність полягає в тому, що інформація парності розподіляється на всіх дисках масиву. У разі можливі як одночасні операції читання, і записи.

Ця технологія добре підходить для програм, які працюють з невеликими обсягами даних, наприклад, для систем обробки транзакцій.

Диск 1

Диск 2

Диск 3

Диск 4

Диск 5

Сегмент парності

Сегмент 1

Сегмент 2

Сегмент 3

Сегмент 4

Сегмент 5

Сегмент парності

Сегмент 6

Сегмент 7

Сегмент 8

Сегмент 9

Сегмент 10

Сегмент парності

Сегмент 11

Сегмент 12

Рис. 4. Розподіл даних із дисків для RAID 5.

Переваги та недоліки основних рівнів RAID

Рівень RAID

Механізм забезпечення надійності

Ефективна ємність масиву

Продуктивність

Область застосування

додатки без істотних вимог до надійності

дзеркало

висока чи середня

додатки без істотних вимог до вартості

парність

програми, що працюють з великими обсягами даних (графіка, CAD/CAM та ін.)

парність

програми, що працюють з невеликими обсягами даних (обробка транзакцій)

Тепер подивимося які види і чим вони відрізняються.

Каліфорнійський університет у Берклі представив такі рівні специфікації RAID, які були прийняті як стандарт де-факто:

  • RAID 0- дисковий масив підвищеної продуктивності з чергуванням, без стійкості до відмови;
  • - дзеркальний дисковий масив;
  • RAID 2зарезервований для масивів, що застосовують код Хеммінгу;
  • RAID 3 та 4- дискові масиви з чергуванням та виділеним диском парності;
  • - дисковий масив з чергуванням та «невиділеним диском парності»;
  • - дисковий масив із чергуванням, що використовує дві контрольні суми, що обчислюються двома незалежними способами;
  • - масив RAID 0, побудований із масивів RAID 1;
  • - масив RAID 0, побудований із масивів RAID 5;
  • - масив RAID 0, побудований із масивів RAID 6.

Апаратний RAID-контролер може підтримувати кілька різних RAID-масивів одночасно, сумарна кількість жорстких дисків яких не перевищує кількість гнізда для них. При цьому контролер, вбудований в материнську плату, в налаштуваннях BIOS має всього два стани (увімкнено або вимкнено), тому новий жорсткий диск, підключений до незадіяного роз'єму контролера при активованому режимі RAID, може ігноруватися системою, поки він не буде асоційований як ще один RAID -Масив типу JBOD (spanned), що складається з одного диска.

RAID 0 (striping - «чергування»)

Режим, за якого досягається максимальна продуктивність. Дані поступово розподіляються по дисках масиву, диски об'єднуються в один, який може бути розмічений на кілька. Розподілені операції читання та запису дозволяють значно збільшити швидкість роботи, оскільки кілька дисків одночасно читають/записують свою порцію даних. Користувачеві доступний весь обсяг дисків, але це знижує надійність зберігання даних, оскільки при відмові одного з дисків масив зазвичай руйнується і відновити дані практично неможливо. Область застосування - програми, що вимагають високих швидкостей обміну з диском, наприклад, відеозахоплення, відеомонтаж. Рекомендується використовувати з високонадійними дисками.

(mirroring - «дзеркалювання»)

масив із двох дисків, що є повними копіями один одного. Не слід плутати з масивами RAID 1+0, RAID 0+1 та RAID 10, у яких використовується більше двох дисків та складніші механізми дзерклювання.

Забезпечує прийнятну швидкість запису та виграш за швидкістю читання при розпаралелювання запитів.

Має високу надійність – працює доти, доки функціонує хоча б один диск у масиві. Імовірність виходу з експлуатації відразу двох дисків дорівнює добутку можливостей відмови кожного диска, тобто. значно нижче за ймовірність виходу з ладу окремого диска. Насправді при виході з ладу однієї з дисків слід терміново вживати заходів - знову відновлювати надмірність. Для цього із будь-яким рівнем RAID (крім нульового) рекомендують використовувати диски гарячого резерву.

Подібний до RAID10 варіант розподілу даних по дисках, що допускає використання непарного числа дисків (мінімальна кількість - 3)

RAID 2, 3, 4

різні варіанти розподіленого зберігання даних з дисками, виділеними під коди парності та різними розмірами блоку. В даний час практично не використовуються через невисоку продуктивність і необхідність виділяти багато дискової ємності під зберігання кодів ЕСС та/або парності.

Основним недоліком рівнів RAID від 2-го до 4-го є неможливість робити паралельні операції запису, оскільки зберігання інформації про парності використовується окремий контрольний диск. RAID 5 не має цього недоліку. Блоки даних та контрольні суми циклічно записуються на всі диски масиву, немає асиметричності конфігурації дисків. Під контрольними сумами мається на увазі результат операції XOR (що виключає або). Xorмає особливість, яка дає можливість замінити будь-який операнд результатом, і, застосувавши алгоритм xor, отримати в результаті бракує операнд. Наприклад: a xor b = c(де a, b, c- три диски рейд-масиву), якщо aвідмовить, ми можемо отримати його, поставивши його місце cі провівши xorміж cі b: c xor b = a.Це можна застосувати незалежно від кількості операндів: a xor b xor c xor d = e. Якщо відмовляє cтоді eвстає на його місце і провівши xorв результаті отримуємо c: a xor b xor e xor d = c. Цей метод по суті забезпечує стійкість до відмови 5 версії. Для зберігання результату xor потрібно всього 1 диск, розмір якого дорівнює розміру іншого диска в raid.

Переваги

RAID5 набув широкого поширення, в першу чергу завдяки своїй економічністі. Об'єм дискового масиву RAID5 розраховується за формулою (n-1) * hddsize, де n – число дисків у масиві, а hddsize – розмір найменшого диска. Наприклад, для масиву з чотирьох дисків по 80 гігабайт загальний обсяг буде (4 – 1) * 80 = 240 гігабайт. На запис інформації на тому RAID 5 витрачаються додаткові ресурси і падає продуктивність, оскільки потрібні додаткові обчислення та операції запису, зате при читанні (порівняно з окремим вінчестером) є виграш, тому що потоки даних з кількох дисків масиву можуть оброблятися паралельно.

Недоліки

Продуктивність RAID 5 помітно нижче, особливо в операціях типу Random Write (записи у довільному порядку), у яких продуктивність падає на 10-25% від продуктивності RAID 0 (чи RAID 10), оскільки вимагає більшої кількості операцій із дисками (кожна операція записи, крім так званих full-stripe write-ов, сервера замінюється на контролері RAID чотирма - дві операції читання і дві операції записи). Недоліки RAID 5 виявляються при виході з ладу одного з дисків - весь том перетворюється на критичний режим (degrade), всі операції запису та читання супроводжуються додатковими маніпуляціями, різко падає продуктивність. При цьому рівень надійності знижується до надійності RAID-0 з відповідною кількістю дисків (тобто n разів нижче надійності одиночного диска). Якщо до повного відновлення масиву відбудеться вихід з ладу, або виникне непоновна помилка читання хоча б на ще одному диску, то масив руйнується, і дані на ньому відновленню звичайними методами не підлягають. Слід також взяти до уваги, що процес RAID Reconstruction (відновлення даних RAID за рахунок надмірності) після виходу з ладу диска викликає інтенсивне навантаження читання з дисків протягом багатьох годин безперервно, що може спровокувати вихід будь-якого з дисків, що залишилися з ладу в цей найменше. захищений період роботи RAID, а також виявити раніше не виявлені збої читання в масивах cold data (даних, яких не звертаються при звичайній роботі масиву, архівні та малоактивні дані), що підвищує ризик збою при відновленні даних.

Мінімальна кількість дисків, що використовуються, дорівнює трьом.

RAID 6 - схожий на RAID 5, але має більш високий рівень надійності - під контрольні суми виділяється ємність 2-х дисків, розраховуються 2 суми за різними алгоритмами. Потребує потужніший RAID-контролер. Забезпечує працездатність після одночасного виходу з експлуатації двох дисків - захист від кратної відмови. Для організації масиву потрібно мінімум 4 диски. Зазвичай використання RAID-6 викликає приблизно 10-15% падіння продуктивності дискової групи щодо RAID 5, що викликано великим обсягом обробки для контролера (необхідність розраховувати другу контрольну суму, а також читати та перезаписувати більше дискових блоків під час запису кожного блоку).

RAID 0+1

Під RAID 0+1 може матися на увазі в основному два варіанти:

  • два RAID 0 об'єднуються у RAID 1;
  • масив об'єднуються три і більше диска, і кожен блок даних записується на два диски даного масиву; таким чином, при такому підході, як і в «чистому» RAID 1, корисний об'єм масиву становить половину від сумарного об'єму всіх дисків (якщо це однакова ємність).

RAID 10 (1+0)

RAID 10 - дзеркальний масив, дані в якому записуються послідовно на кілька дисків, як в RAID 0. Ця архітектура є масивом типу RAID 0, сегментами якого замість окремих дисків є масиви RAID 1. Відповідно, масив цього рівня повинен містити як мінімум 4 диски ( і завжди парна кількість). RAID 10 поєднує в собі високу відмовостійкість та продуктивність.

Твердження, що RAID 10 є найнадійнішим варіантом для зберігання даних цілком обґрунтовано тим, що масив буде виведений з ладу після виходу з ладу всіх накопичувачів в тому самому масиві. При одному вийшов з ладу накопичувачі, шанс виходу з ладу другого в тому самому масиві дорівнює 1/3 * 100 = 33%. RAID 0+1 вийде з ладу при двох накопичувачах, що вийшли з ладу різних масивах. Шанс виходу з ладу накопичувача в сусідньому масиві дорівнює 2/3*100=66%, однак оскільки накопичувач у масиві з накопиченням, що вже вийшов з ладу, вже не використовується, то шанс того, що наступний накопичувач виведе з ладу масив цілком дорівнює 2/2 * 100 = 100%

масив, аналогічний RAID5, проте крім розподіленого зберігання кодів парності використовується розподіл резервних областей - фактично задіюється жорсткий диск, який можна додати масив RAID5 як запасного (такі масиви називають 5+ або 5+spare). У RAID 5 масиві резервний диск простоює до тих пір, поки не вийде з ладу один з основних жорстких дисків, у той час як у RAID 5EE масиві цей диск використовується разом з іншими HDD весь час, що позитивно впливає на продуктивність масиву. Наприклад, масив RAID5EE з 5 HDD зможе виконати на 25% більше операцій вводу/виводу за секунду, ніж RAID5 масив із 4 основних та одного резервного HDD. Мінімальна кількість дисків для такого масиву – 4.

об'єднання двох (або більше, але це дуже рідко застосовується) масивів RAID5 у страйп, тобто. комбінація RAID5 і RAID0, що частково виправляє головний недолік RAID5 - низьку швидкість запису даних за рахунок паралельного використання кількох таких масивів. Загальна ємність масиву зменшується на ємність двох дисків, але на відміну від RAID6, без втрати даних такий масив переносить відмову лише одного диска, а мінімально необхідна кількість дисків для створення масиву RAID50 дорівнює 6. Поряд з RAID10, це найбільш рекомендований рівень RAID для використання у додатках, де потрібна висока продуктивність у поєднанні прийнятною надійністю.

об'єднання двох масивів RAID6 у страйп. Швидкість запису підвищується приблизно вдвічі, відносно швидкості запису RAID6. Мінімальна кількість дисків для створення такого масиву - 8. Інформація не втрачається при відмові двох дисків з кожного RAID 6 масиву