Система хранения данных должна включать следующие подсистемы и компоненты:
1. Устройства хранения данных: дисковые массивы и ленточные библиотеки. Современные высокопроизводительные дисковые массивы используют технологию Fibre Channel для подключения к ним серверов и доступа к дискам внутри массива. Они могут масштабироваться до десятков терабайт дискового пространства и обладают встроенным интеллектом для выполнения специальных функций: виртуализации дискового пространства, разграничения доступа к дисковому пространству, создания Point-In-Time (PIT) копий данных и репликации данных между массивами. К устройствам хранения данных также относятся ленточные, магнитооптические и CD/DVD библиотеки.
2. Инфраструктуру доступа серверов к устройствам хранения данных, которая создается в настоящее время на основе технологии "сеть хранения данных" (Storage Area Network - SAN). SAN является высокопроизводительной информационной сетью, ориентированной на быструю передачу больших объемов данных.
В основе концепции SAN лежит возможность соединения любого из серверов с любым устройством хранения данных, работающим по протоколу Fibre Channel. Сеть хранения данных образуют волоконно-оптические соединения, Fibre Channel Host Bus Adapters (FC-HBA) и FC-коммутаторы, обеспечивающие в настоящее время скорость передачи 200 Мбайт/с и удаленность между соединяемыми объектами до нескольких десятков километров.
3. Систему резервного копирования и архивирования данных, предназначенную для создания резервных копий и восстановления данных. Она позволяет защитить данные от разрушения не только в случае сбоев или выхода из строя аппаратуры, но и в результате ошибок программных средств и пользователей.
4. Программное обеспечение управления хранением данных, предназначенное для решения задач управления хранением данных, например, для разметки дисковых томов или повышения производительности доступа к данным прикладного ПО. Это достигается за счет того, что встроенное в массивы программное обеспечение собирает статистику по интенсивности работы с данными и исходя из нее принимает решение о перемещении данных на диски, производительность которых соответствует скорости обращения к данным.
5. Систему управления, предназначенную для мониторинга и управления уровнем качества сервиса хранения данных. Она тесно интегрируется с системой управления вычислительным комплексом. Основой системы управления СХД являются средства управления аппаратными ресурсами сети хранения данных. Их интеграция с другими системами дает возможность контролировать ресурсы СХД и управлять ими на всех уровнях - от дисков в массиве до файловой системы сервера.
Для защиты от отказов отдельных дисков используют технологии RAID (кроме RAID-0), использующие дублирование данных, хранимых на дисках. Уровень RAID-5 хотя и не создает копий блоков данных, но все же сохраняет избыточную информацию, что тоже можно считать дублированием. Для защиты от логического разрушения данных (разрушение целостности базы данных или файловой системы), вызванного сбоями в оборудовании, ошибками в программном обеспечении или неверными действиями обслуживающего персонала, применяется резервное копирование, которое тоже является дублированием данных. Для защиты от потери данных вследствие выхода из строя устройств хранения по причине техногенной или природной катастрофы данные дублируются в резервный центр.
Отказоустойчивость доступа серверов к данным достигается дублированием путей доступа. Применительно к SAN дублирование заключается в следующем: сеть строится как две физически независимые сети, идентичные по функциональности и конфигурации. В каждый из серверов устанавливается как минимум по два адаптера FC-HBA. Первый из них подключается к одной половинке SAN, а второй - к другой. Отказ оборудования, изменение конфигурации или регламентные работы на одной из частей SAN не влияют на работу другой. В дисковом массиве отказоустойчивость доступа к данным обеспечивается дублированием RAID-контроллеров, блоков питания, интерфейсов к дискам и к серверам. Для защиты от потери данных зеркалируют участки кэш-памяти, участвующие в операции записи, а электропитание кэш-памяти резервируют батареями. Пути доступа серверов к дисковому массиву тоже дублируются. Внешние интерфейсы дискового массива подключаются к обеим половинкам SAN.
Все предлагаемые решения обладают высокой степенью масштабирования, что позволяет сначала использовать небольшую и относительно дешевую систему хранения данных и по мере своего развития модернизировать ее в систему хранения данных корпоративного уровня, отвечающую заданным требованиям по надежности хранения и доступности информации.
Структура системы хранения данных имеет несколько уровней.
1. Система хранения данных начального уровня (рис. 1.18).
Строится на основе дисковых массивов с аппаратной реализацией RAID и интерфейсами FC, которые обладают возможностью непосредственного подключения нескольких серверов, а максимальный объем хранимой информации может достигать нескольких терабайт. Для обеспечения резервного копирования информации в рамках предлагаемого решения используются ленточные библиотеки с интерфейсом FC, что позволяет вынести их за пределы вычислительного центра и тем самым обеспечить сохранность данных и возможность их восстановления в случае локальных катастроф, например пожара. Для обеспечения высокого уровня надежности хранения данных у выбираемых моделей дисковых массивов дублированы все основные элементы конструкции.
Рис. 1.18. Система хранения данных начального уровня
Данное решение может быть модернизировано в систему хранения данных среднего уровня.
2. Система хранения данных среднего уровня (рис. 1.19).
Данное решение строится на основе 8- или 16-портовых коммутаторов начального уровня. Они обеспечивают возможность более гибкого распределения дисковых ресурсов между серверами, а также позволяют применять современные технологии резервного копирования данных.
При реализации решения для хранения наиболее важных данных могут использоваться модели дисковых массивов, у которых отсутствует единая точка отказа, что исключает возможность потери доступности данных в случае выхода из строя оборудования.
Рис. 1.19. Система хранения данных среднего уровня
3. Корпоративная система хранения данных (рис. 1.20).
Основная задача, решаемая при построении системы такого уровня, - обеспечение высокой степени доступности данных и защищенности их как от локальных катастроф, так и от глобальных (в пределах страны) технологических катаклизмов.
Первая проблема может быть решена благодаря возможности технологии FC работать на больших расстояниях, что позволяет создать два разнесенных в пространстве вычислительных центра и зеркалировать или синхронно реплицировать наиболее важные данные между ними, защита которых от глобальных катастроф обеспечивается с помощью асинхронного удаленного зеркалирования (remote mirroring) данных через Интернет на дисковые массивы с последующим перенесением информации на ленты. Корпоративная система хранения данных обладает едиными средствами мониторинга и управления.
Общие принципы регулирования:
Страницы: 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28