Scientific journal
International Journal of Experimental Education
ISSN 2618–7159
ИФ РИНЦ = 0,425

1 1 1
1
2858 KB

В статье исследованы RAID массивы на предмет отказоустойчивости, рентабельности и бестродействия. Обоснована важность правильного выбора необходимой конфигурации RAID, который учитывает многие факторы, такие как: быстродействие, надежность сохранения данных и экономичность. Рассмотрены особенности работы RAID различных уровней и определена основная сфера их применения. Исследование проведено для конфигурациий RAID (0,1,5,6,10). В ходе исследования была оценена отказоустойчивость и степень надежности хранения данных в каждой конфигурации массивов, а также определены основные области применения каждого из массивов.

Одну из основных ролей в вычислительной технике отводят устройствам долговременного хранения памяти – жестким дискам [1, 5, 6, 8, 9, 11]. На них хранится важная информация, такая как операционная система, пользовательские файлы и другие данные. К сожалению, скорость работы системы ограничивается скоростью работы каждого отдельного элемента и жесткие диски не исключение.

При организации работы ситемы, необходимо учитывать предполагаемую нагрузку на систему и чаще всего жесткий диск самостоятельно не справляется с нагрузкой. [1–12]. При этом необходимо учесть безопасность хранения данных и обеспечить возможность восстановления данных при выходе системы из работы. Решений данных проблем не так много и основным методом, который используют при проектировании системы, является объединение жестких дисков в массив RAID.

RAID (Redundant Array of Independent Disks) – (избыточный массив независимых дисков) – технология хранения данных, которая объединяет диски в логический элемент для повышения быстродействия жестких дисков [1, 5].

Цель исследования – провести анализ различных конфигураций RAID на предмет отказоустойчивости, быстродействия и надежности хранения данных.

Определение области исследования. Различные конфигурации RAID применяются для разных систем. Использование RAID повышает эффективность работы системы, а также является дешевым способом модернизации системы. Для создания дискового массива необходимы абсолютно идентичные жесткие диски, одного производителя. Это нужно для правильной организации чтения и записи данных на диск. И в случае с использованием современных моделей жестких дисков, при объединении их в RAID, мы получаем стабильную и надежную систему, обеспечивающую качественный доступ к файловой системе даже при большом количестве запросов со стороны пользователей.

Различные дисковые массивы предназначены для выполнения разного рода поставленных задач, и при организации работы сети важно правильно подобрать необходимую конфигурацию RAID. Для этого необходимо учесть многие факторы, такие как: быстродействие, надежность сохранения данных и экономичность.

Для анализа были взяты самые широко используемые на предприятиях массивы 5,6 и 10 уровня. Эти конфигурации RAID будут состоять из полностью одинаковых дисков 10,000 об/мин SATA 3.5, объемом 1Тб в количестве: 8, 20, 100 шт.

Анализ проводится по следующим параметрам:

– эффективный объем и эффективность использования дискового пространства;

– отказоустойчивость;

– количество операций ввода/вывода (IOPS) с нагрузками: 80 % чтение/20 % запись, 20 % чтение/80 % запись, 50 % чтение/50 % запись.

Результаты исследования. Рассчет эффективного объема и эффективности использования дискового пространства. Эффективный объем и эффективность использования дискового пространства в первую очередь влияют на рентабельность рейда с финансовой точки зрения.

Из табл. 1 и рис. 1 видно, что самым затратным с финансовой точки зрения яляется RAID10, ввиду того, что он предоставляет только 50 % всего отведенного под него дискового пространства, а остальную память использует под клонирование данных.

Таблица 1

Эффективность использования дискового пространства

Количество дисков

8

20

100

RAID5

87,5 %

95 %

99 %

RAID6

75 %

90 %

98 %

RAID10

50 %

50 %

50 %

При создании конфигурации из малого количества дисков, выгоднее всего оказывается конфигурация RAID5.

Рассчет отказоустойчивости массива. Отказоустойчивость показывает количество дисков, которые можут выйти из строя и при этом система останется работоспособной.

Если смотреть на надежность каждой из конфигураций (табл. 2), то бесспорным лидером в безопасности хранения данных является RAID10. Показатели RAID6 и RAID5 остаются без изменения, даже при увеличении количества дисков в массиве.

Таблица 2

Исследование отказоустойчивости массивов (ед. дисков)

Количество дисков

8

20

100

RAID 5

1

1

1

RAID 6

2

2

2

RAID 10

1–4

1–10

1–50

Рассчет быстродействия системы при различных нагрузках на систему. Количество операций ввода/вывода (англ. Input/Output Operations Per Second (IOPS)) – один из ключевых параметров при измерении производительности систем хранения данных, жестких дисков (НЖМД), твердотельных диски (SSD) и сетевых хранилища данных (SAN).

По сути, IOPS это количество блоков, которое успевает считаться или записаться на носитель. Чем больше размер блока, тем меньше кусков, из которых состоит файл, и тем меньше будет IOPS, так как на чтение куска большего размера будет затрачиваться больше времени [2].

Рассчет быстродействия было произведено при конфигурации системы из 8, 20 и 100 дисков.

ter1.wmf

Рис. 1. Эффективность использования дискового пространства в зависимости от количества дисков в рейде

ter2.tif

Рис. 2. Измерение IOPS при нагрузке 80/20 в зависимости от количества дисков в рейде

Нагрузка при повышенной интенсивности чтения данных на диски.Как видно из табл. 3 и графика, представленного на рис. 2, самую большую производительность выдает RAID10 благодаря параллельному считыванию данных сразу со всех дисков.

Таблица 3

Измерение IOPS при нагрузке 80/20

Чтение 80 %/ Запись 20 %

8

20

100

RAID5

884

2210

11050

RAID6

866,6667

2166,667

10833,33

RAID10

936

2340

11700

Нагрузка при повышенной интенсивности записи данных на диски. Благодаря простоте организации работы массива, RAID10 лидирует также и при записи данных (табл. 4, рис. 3). Касательно RAID6 и RAID5, тут лидирует RAID5 по причине того, что в RAID5 более простая организация процесса записи.

Таблица 4

Измерение IOPS при нагрузке 20/80

Чтение 20 % / Запись 80 %

8

20

100

RAID5

416

1040

5200

RAID6

346

866

4333

RAID10

624

1560

7800

Нагрузка при одинаковой нагрузке на чтение и запись данных. При равной нагрузке RAID5 и RAID6 по характеристикам практически идентичны, а RAID10 все также показывает наивысшую скорость передачи данных (табл. 5, рис. 4).

ter3.tif

Рис. 3. Измерение IOPS при нагрузке 20/80 в зависимости от количества дисков в рейде

ter4.tif

Рис. 4. Измерение IOPS при равномерной нагрузке в зависимости от количества дисков в рейде

 

Таблица 5

Измерение IOPS при равномерной нагрузке

Чтение 50 % / Запись 50 %

8

20

100

RAID5

650

1625

8125

RAID6

606

1516

7583

RAID10

780

1950

9750

Анализ полученных результатов. Исходя из исследований, можно выделить, что каждая конфигурация RAID имеет свое предназначение. Простые схемы такие как RAID0 и RAID1 используются в стационарных компьютерах, когда требуется дешевое и простое решение в организации защиты данных или увелицении быстродействия системы. Более сложные структуры позволяют создавать банк данных для выполнения поставленной задачи. RAID0 дает высокий прирост быстродействия системы прямо пропорционально количеству используемых в массиве дисков.

RAID1 применяется как бюджетный вариант для офиса, где требуется обезопасить данные от потери. Прироста быстродействия данный массив практически не дает.

Проанализировав результаты исследования, был сделан вывод, что самым стабильным является массив с конфигурацией RAID10. Он имеет высокую скорость работы и высокую степень надежности. Главным минусом RAID10 и вообще минусом применением любой комбинации с RAID1 является удвоенная стоимость дискового пространства [4]. RAID10 имеет. Так как все данные дублируются на зеркальные диски, вероятность потери этих данных сводится к минимуму. Данная конфигурация широко применяется в банковских и государственных структурах.

Самым распространенным в настоящее время является использование RAID5 [1, 5]. Этот вариант используется для дешевой организации файловых хранилищ. Его надежность пониже, чем у RAID10, зато он намного экономичнее.

Главным преимуществом RAID6 можно выделить возможность продолжения работы при выходе из строя одного из элементов массива, но такая организация получается сложнее, чем у RAID5 и поэтому он не так широко распространеню.

Заключение. Самым отказоустойчивым оказался RAID10. Этот массив широко применяется во многих структурах, где потеря данных неприемлима. Бюджетным вариантом является использование RAID5 и RAID6, которые используются как файловое хранилище с малым объемом данных.