В статье исследованы RAID массивы на предмет отказоустойчивости, рентабельности и бестродействия. Обоснована важность правильного выбора необходимой конфигурации RAID, который учитывает многие факторы, такие как: быстродействие, надежность сохранения данных и экономичность. Рассмотрены особенности работы RAID различных уровней и определена основная сфера их применения. Исследование проведено для конфигурациий RAID (0,1,5,6,10). В ходе исследования была оценена отказоустойчивость и степень надежности хранения данных в каждой конфигурации массивов, а также определены основные области применения каждого из массивов.
Одну из основных ролей в вычислительной технике отводят устройствам долговременного хранения памяти – жестким дискам [1, 5, 6, 8, 9, 11]. На них хранится важная информация, такая как операционная система, пользовательские файлы и другие данные. К сожалению, скорость работы системы ограничивается скоростью работы каждого отдельного элемента и жесткие диски не исключение.
При организации работы ситемы, необходимо учитывать предполагаемую нагрузку на систему и чаще всего жесткий диск самостоятельно не справляется с нагрузкой. [1–12]. При этом необходимо учесть безопасность хранения данных и обеспечить возможность восстановления данных при выходе системы из работы. Решений данных проблем не так много и основным методом, который используют при проектировании системы, является объединение жестких дисков в массив RAID.
RAID (Redundant Array of Independent Disks) – (избыточный массив независимых дисков) – технология хранения данных, которая объединяет диски в логический элемент для повышения быстродействия жестких дисков [1, 5].
Цель исследования – провести анализ различных конфигураций RAID на предмет отказоустойчивости, быстродействия и надежности хранения данных.
Определение области исследования. Различные конфигурации RAID применяются для разных систем. Использование RAID повышает эффективность работы системы, а также является дешевым способом модернизации системы. Для создания дискового массива необходимы абсолютно идентичные жесткие диски, одного производителя. Это нужно для правильной организации чтения и записи данных на диск. И в случае с использованием современных моделей жестких дисков, при объединении их в RAID, мы получаем стабильную и надежную систему, обеспечивающую качественный доступ к файловой системе даже при большом количестве запросов со стороны пользователей.
Различные дисковые массивы предназначены для выполнения разного рода поставленных задач, и при организации работы сети важно правильно подобрать необходимую конфигурацию RAID. Для этого необходимо учесть многие факторы, такие как: быстродействие, надежность сохранения данных и экономичность.
Для анализа были взяты самые широко используемые на предприятиях массивы 5,6 и 10 уровня. Эти конфигурации RAID будут состоять из полностью одинаковых дисков 10,000 об/мин SATA 3.5, объемом 1Тб в количестве: 8, 20, 100 шт.
Анализ проводится по следующим параметрам:
– эффективный объем и эффективность использования дискового пространства;
– отказоустойчивость;
– количество операций ввода/вывода (IOPS) с нагрузками: 80 % чтение/20 % запись, 20 % чтение/80 % запись, 50 % чтение/50 % запись.
Результаты исследования. Рассчет эффективного объема и эффективности использования дискового пространства. Эффективный объем и эффективность использования дискового пространства в первую очередь влияют на рентабельность рейда с финансовой точки зрения.
Из табл. 1 и рис. 1 видно, что самым затратным с финансовой точки зрения яляется RAID10, ввиду того, что он предоставляет только 50 % всего отведенного под него дискового пространства, а остальную память использует под клонирование данных.
Таблица 1
Эффективность использования дискового пространства
Количество дисков |
|||
8 |
20 |
100 |
|
RAID5 |
87,5 % |
95 % |
99 % |
RAID6 |
75 % |
90 % |
98 % |
RAID10 |
50 % |
50 % |
50 % |
При создании конфигурации из малого количества дисков, выгоднее всего оказывается конфигурация RAID5.
Рассчет отказоустойчивости массива. Отказоустойчивость показывает количество дисков, которые можут выйти из строя и при этом система останется работоспособной.
Если смотреть на надежность каждой из конфигураций (табл. 2), то бесспорным лидером в безопасности хранения данных является RAID10. Показатели RAID6 и RAID5 остаются без изменения, даже при увеличении количества дисков в массиве.
Таблица 2
Исследование отказоустойчивости массивов (ед. дисков)
Количество дисков |
|||
8 |
20 |
100 |
|
RAID 5 |
1 |
1 |
1 |
RAID 6 |
2 |
2 |
2 |
RAID 10 |
1–4 |
1–10 |
1–50 |
Рассчет быстродействия системы при различных нагрузках на систему. Количество операций ввода/вывода (англ. Input/Output Operations Per Second (IOPS)) – один из ключевых параметров при измерении производительности систем хранения данных, жестких дисков (НЖМД), твердотельных диски (SSD) и сетевых хранилища данных (SAN).
По сути, IOPS это количество блоков, которое успевает считаться или записаться на носитель. Чем больше размер блока, тем меньше кусков, из которых состоит файл, и тем меньше будет IOPS, так как на чтение куска большего размера будет затрачиваться больше времени [2].
Рассчет быстродействия было произведено при конфигурации системы из 8, 20 и 100 дисков.
Рис. 1. Эффективность использования дискового пространства в зависимости от количества дисков в рейде
Рис. 2. Измерение IOPS при нагрузке 80/20 в зависимости от количества дисков в рейде
Таблица 3
Измерение IOPS при нагрузке 80/20
Чтение 80 %/ Запись 20 % |
|||
8 |
20 |
100 |
|
RAID5 |
884 |
2210 |
11050 |
RAID6 |
866,6667 |
2166,667 |
10833,33 |
RAID10 |
936 |
2340 |
11700 |
Нагрузка при повышенной интенсивности записи данных на диски. Благодаря простоте организации работы массива, RAID10 лидирует также и при записи данных (табл. 4, рис. 3). Касательно RAID6 и RAID5, тут лидирует RAID5 по причине того, что в RAID5 более простая организация процесса записи.
Таблица 4
Измерение IOPS при нагрузке 20/80
Чтение 20 % / Запись 80 % |
|||
8 |
20 |
100 |
|
RAID5 |
416 |
1040 |
5200 |
RAID6 |
346 |
866 |
4333 |
RAID10 |
624 |
1560 |
7800 |
Нагрузка при одинаковой нагрузке на чтение и запись данных. При равной нагрузке RAID5 и RAID6 по характеристикам практически идентичны, а RAID10 все также показывает наивысшую скорость передачи данных (табл. 5, рис. 4).
Рис. 3. Измерение IOPS при нагрузке 20/80 в зависимости от количества дисков в рейде
Рис. 4. Измерение IOPS при равномерной нагрузке в зависимости от количества дисков в рейде
Таблица 5
Измерение IOPS при равномерной нагрузке
Чтение 50 % / Запись 50 % |
|||
8 |
20 |
100 |
|
RAID5 |
650 |
1625 |
8125 |
RAID6 |
606 |
1516 |
7583 |
RAID10 |
780 |
1950 |
9750 |
Анализ полученных результатов. Исходя из исследований, можно выделить, что каждая конфигурация RAID имеет свое предназначение. Простые схемы такие как RAID0 и RAID1 используются в стационарных компьютерах, когда требуется дешевое и простое решение в организации защиты данных или увелицении быстродействия системы. Более сложные структуры позволяют создавать банк данных для выполнения поставленной задачи. RAID0 дает высокий прирост быстродействия системы прямо пропорционально количеству используемых в массиве дисков.
RAID1 применяется как бюджетный вариант для офиса, где требуется обезопасить данные от потери. Прироста быстродействия данный массив практически не дает.
Проанализировав результаты исследования, был сделан вывод, что самым стабильным является массив с конфигурацией RAID10. Он имеет высокую скорость работы и высокую степень надежности. Главным минусом RAID10 и вообще минусом применением любой комбинации с RAID1 является удвоенная стоимость дискового пространства [4]. RAID10 имеет. Так как все данные дублируются на зеркальные диски, вероятность потери этих данных сводится к минимуму. Данная конфигурация широко применяется в банковских и государственных структурах.
Самым распространенным в настоящее время является использование RAID5 [1, 5]. Этот вариант используется для дешевой организации файловых хранилищ. Его надежность пониже, чем у RAID10, зато он намного экономичнее.
Главным преимуществом RAID6 можно выделить возможность продолжения работы при выходе из строя одного из элементов массива, но такая организация получается сложнее, чем у RAID5 и поэтому он не так широко распространеню.
Заключение. Самым отказоустойчивым оказался RAID10. Этот массив широко применяется во многих структурах, где потеря данных неприемлима. Бюджетным вариантом является использование RAID5 и RAID6, которые используются как файловое хранилище с малым объемом данных.