СХД (Система хранения данных)
Система хранения данных (СХД) — комплекс аппаратных и программных средств, который предназначен для хранения и оперативной обработки информации, как правило, большого объема. Информация — это файлы, в том числе медиа, структурированные (СУБД) и неструктурированные данные (big data), резервные копии, архивы. В качестве носителей информации используются жесткие диски, в основном SSD (системы All Flash Array), а также гибридные решения, сочетающие SSD- и HDD-накопители в одной СХД.
От пользовательского жесткого диска СХД отличаются сложной архитектурой, возможностью объединять хранилища в сеть передачи данных, наличием отдельного ПО для управления системой хранения, продвинутыми технологиями резервного копирования, сжатия и виртуализации.
Системы хранения данных различаются по нескольким параметрам, от выбора которых зависит применение СХД.
[text_with_btn btn=»Оставить контакты» link=»»]Подобрать СХД[/text_with_btn]
ITPOD Storage Full Flash FF-300
[important]Задачи и функции СХД:
[important_item col=»2″] [important_content title=»» img=»» subtitle_arr=»» with_mark=»false» without_margin=»true»][/important_content] [/important_item][important_item col=»2″] [important_content title=»» img=»» subtitle_arr=»Хранение данных» with_mark=»true» without_margin=»true»][/important_content] [/important_item][important_item col=»2″] [important_content title=»» img=»» subtitle_arr=»Управление данными» with_mark=»true» without_margin=»true»][/important_content] [/important_item][important_item col=»2″] [important_content title=»» img=»» subtitle_arr=»Высокая доступность» with_mark=»true» without_margin=»true»][/important_content] [/important_item][important_item col=»2″] [important_content title=»» img=»» subtitle_arr=»Высокая производительность» with_mark=»true» without_margin=»true»][/important_content] [/important_item][important_item col=»2″] [important_content title=»» img=»» subtitle_arr=»Защита данных» with_mark=»true» without_margin=»true»][/important_content] [/important_item][important_item col=»2″] [important_content title=»» img=»» subtitle_arr=»Мониторинг и управление» with_mark=»true» without_margin=»true»][/important_content] [/important_item][important_item col=»2″] [important_content title=»» img=»» subtitle_arr=»Масштабируемость» with_mark=»true» without_margin=»true»][/important_content] [/important_item][/important]Как устроена система хранения данных
Системы хранения данных состоят из ключевых элементов, таких как массивы жёстких дисков или твердотельных накопителей (HDD или SSD), кэш-память, дисковый контроллер, внешний корпус и несколько блоков питания для обеспечения надёжности. Основное преимущество СХД заключается в высокой скорости обработки данных, которая превосходит показатели дисков внутри серверов. Эти системы классифицируются на три типа: файловые, блочные и объектные, каждая из которых определяет формат хранения информации, метод доступа и управляемость, а также скорость взаимодействия с данными.
Уровни хранения данных
Блочное хранилище
СХД используется как обычный диск, который можно форматировать, устанавливать на него ОС, создавать логические диски. Данные хранятся не файлами, а блоками, что ускоряет операции ввода-вывода. Чаще используется в сетях типа SAN (Storage Attached Network). Подходит для высокопроизводительных вычислений, СУБД, хранения больших объемов данных, в качестве сред разработки (Dev/Test). Из недостатков: а) сложность настройки и обслуживания, которые требуют соответствующей квалификации; б) высокая стоимость.
Файловое хранилище
Данные хранятся в виде файлов, которые размещаются в каталогах. Такая СХД используется для хранения «холодной» информации, которая не требуется для операционных вычислений. На файловых хранилищах, как правило, строятся NAS (Network Attached Storage). Недостатки: при накоплении больших объемов данных усложняется иерархия папок, и скорость работы СХД постепенно снижается. Не подходит для нагрузок, которые требуют высокой скорости отклика.
Объектное хранилище
Тип СХД, который ориентирован на работу с большими неструктурированными данными объемом до петабайтов. Информация хранится не в виде файлов, а в виде «объектов» с уникальными идентификатором и метаданными. Поэтому объектное хранилище похоже по структуре на БД. Используется в аналитике, big data, машинном обучении, для хранения «тяжелых» медиа-файлов и резервных копий, разработки и эксплуатации приложений в облаке, хостинга веб-сайтов. По скорости уступает блочному хранилищу в задачах, связанных с транзакционными нагрузками.
Принцип работы СХД — NAS, SAN и DAS
DAS (Direct Attach Storage)
Система хранения данных, подключенная напрямую к серверу или рабочей станции через интерфейсы, такие как SATA, SAS или USB, без использования сети. Это решение обеспечивает высокую скорость доступа и надежность за счет минимизации сетевых компонентов. DAS идеально подходит для задач, где требуется быстрый доступ к данным на одном устройстве, например, для серверов баз данных.
Преимущества DAS:
- Простота развертывания и управления;
- Быстрая передача данных;
- Экономичность в части аппаратных затрат.
Недостатки DAS:
- Необходимость выделенного сервера;
- Ограничено количество подключений, поддерживает не более двух серверов.
NAS (Network Attache Storage)
Файловый сервер, который включен в локальную сеть. Доступ к дисковому хранилищу организован через протоколы NFS (в UNIX/Linux-системах) или CIFS (Windows). NAS используется для работы с данными файлового типа, к которым нужен коллективный одновременный доступ — например, к общим документами Word и Excel. NAS работает «поверх» существующей локальной сети, через общие коммутаторы/маршрутизаторы.
Преимущества NAS:
- Экономичность и широкая доступность;
- Легкость настройки и управления;
- Гибкость, возможность быстрого увеличения емкости хранилища;
- Возможность работы с устройствами под любой операционной системой.
Недостатки NAS:
- Хранение данных исключительно в файловом формате;
- Более медленный доступ к данным через сеть в сравнении с локальными системами;
- Невозможность работы некоторых приложений с сетевыми дисками.
SAN (Storage Area Network)
Сеть, которая годится для использования разнотипных хранилищ (диски, оптические приводы, ленточные массивы), но которые воспринимаются операционной системой как единое логическое хранилище данных, или как сетевой логический диск. Протоколы: iSCSI (IP-SAN) и FibreChannel (FC). Для подключения компьютеров используются адаптеры HBA (Host Bus Adapter). В SAN применяется в основном блочный тип хранения данных.
Разделение SAN/NAS уже не так строго, как было в начале 2000-х, поскольку с появлением протокола iSCSI производители стали выпускать гибридные решения.
Преимущества SAN:
- Высокая производительность и минимальная задержка;
- Гибкость и масштабируемость;
- Блочный метод хранения данных;
- Надежность обмена и хранения данных;
- Снижение нагрузки подсети от служебного трафика.
Недостатки SAN:
- Сложность проектирования;
- Значительные затраты на внедрение и эксплуатацию;
- Невозможность некоторых приложений и систем работать с протоколом iSCSI.
Как выбрать СХД
В первую очередь нужно понимать, какие задачи она будет решать. Перед обращением к поставщику (или интегратору) следует определиться с несколькими базовыми параметрами.
-
Тип данных
Разные типы данных требуют разной скорости доступа, технологий обработки, компрессии и так далее. К примеру, СХД для работы с большими медиа-файлами отличается от той, что подходит для работы с транзакционной СУБД, или от системы, которая будет работать с неструктурированными данными для нейросети.
-
Объем данных
От этого зависит выбор дисковых накопителей. Иногда можно обойтись SSD потребительского класса — если известно, что емкость СХД даже в худшем случае не будет превышать 300 Гб, а скорость доступа не критична.
-
Отказоустойчивость
Для оценки способности СХД восстанавливаться после сбоев используют два показателя — RPO и RTO. Они помогают рассчитать стоимость потери данных за определенное время, а также избежать лишних затрат на резервное копирование.
RPO (recovery point objective)
Период, за который будут потеряны данные, — между моментом аварии и временем, когда создалась последняя резервная копия. Если RPO равен 12 часам, при выходе из строя хранилища возможна потеря данных, накопившихся за последние 12 часов. RPO влияет на выбор технологии аварийного восстановления и зависит от стоимости потери конкретного объема данных.
RTO (recovery time objective)
Время, за которое восстанавливается доступ к СХД. Значение RTO важно для оценки стоимости простоя системы.
-
Резервное копирование
Частота создания бэкапов выбирается исходя из конкретных задач и требуемого уровня защиты. То же касается и размещения: рабочие данные и их резервную копию можно хранить в географически распределённых СХД (например, в дата-центрах, расположенных в разных странах и даже континентах).
Кроме бэкапов, делают снэпшоты — моментальные «снимки», которые используют для отката на последнюю рабочую версию системы.
Чтобы резервные копии занимали меньше места, применяется дедупликация. При этом в копию переписываются только те данные, которые изменились. Различие между резервными копиями в среднем не превышает 2%, поэтому дедупликация помогает сэкономить дисковое пространство.
-
Производительность
Если СХД закупается под новый проект (сервис), о нагрузке которого судить сложно, лучше пообщаться с коллегами, которые уже решали эту задачу. Или обратиться к опытному поставщику, который подобные проекты уже запускал. Идеальный вариант — потестировать СХД.
-
Вендор
Иногда даже для ресурсоемкого сервиса подойдет бюджетное или среднеуровневое решение (StarWind, Huawei, Fujitsu). Однако у топовых производителей — NetApp, HPE, Dell EMC — линейка продуктов достаточно широкая, и сравнительно недорогие СХД здесь также можно найти. Среди отечественных решений стоит обратить внимание на СХД ITPOD. Вендор предлагает гибкие и адаптируемые варианты для различных нужд бизнеса и ориентируется на предоставление производительных и экономически эффективных технологий. В любом случае, желательно сильно не расширять количество вендоров на одной инфраструктуре.