Top.Mail.Ru

Что такое система хранения данных и зачем она нужна

Что такое система хранения данных и зачем она нужна

Система хранения данных — это отдельное решение для хранения информации, которое рассчитано на серьёзную нагрузку. В отличие от просто хранилища на сервере, такая система создается для того, чтобы данные хранились упорядочено, были хорошо защищены и оставались доступными разным сервисам и пользователям.

СХД обычно используют в крупных компаниях и дата-центрах: такие организации работают с большими массивами данных, регулярно к ним обращаются, а любой простой может стать причиной больших убытков. 

Система делает работу с данными более надежной и предсказуемой: благодаря СХД можно расширять объём по мере роста, ускорять доступ, распределять нагрузку и справляться с форс мажорами без потери критичной информации.

Из чего обычно состоит СХД

→ Накопители (HDD или SSD). Это диски, на которых находятся данные. HDD обычно выбирают, когда важнее объем и более низкая стоимость. SSD подходит для кейсов, когда важна скорость работы.

→ Память для ускорения. Часть данных система держит под рукой, чтобы чаще используемая информация открывалась быстрее.

→ Управляющий модуль. Он распределяет данные по дискам, следит, чтобы всё работало правильно, и помогает защитить информацию при сбоях.

→ Корпус, питание и охлаждение. Отметим, что в большинстве СХД питание и охлаждение дублируются, чтобы отказ одного элемента не приводил к остановке всей системы.

В итоге получается не просто набор дисков, а единая система, которую можно настраивать под задачи бизнеса.

Какие бывают СХД по способу подключения

Хранилище рядом с сервером (DAS)

Такое хранилище подключают напрямую к одному серверу без сети. Подобный формат работы можно достаточно быстро развернуть, однако совместный доступ для нескольких серверов организовать сложнее. По сути, хранилище привязано к конкретной машине.

Сетевое файловое хранилище (NAS)

NAS — это устройство, к которому по сети подключаются разные компьютеры и серверы, чтобы работать с файлами. Оно удобно там, где нужен общий доступ: папки, документы, медиатеки, проекты, резервные копии. Обычно в NAS есть управление пользователями и правами, чтобы каждый видел только то, что ему нужно.

Хранилище для серверных задач (SAN)

SAN — вариант для более тяжёлых нагрузок. В таком случае хранилище подключают к серверам через отдельную быструю сеть, и для серверов оно выглядит как обычные «локальные диски». Этот подход часто выбирают для виртуализации и баз данных — там, где важны скорость и стабильность.

В каком виде могут храниться данные

Внутри СХД данные могут быть организованы разными способами. Это влияет на то, насколько с ними удобно работать.

  1. Файловое хранение. Похоже на привычные папки и файлы. Хорошо подходит, когда людям или приложениям нужно работать с документами, общими каталогами и файлами проекта.
  2. Блочное хранение. Сервер получает диск, а дальше сам решает, как его использовать: форматирует, создаёт разделы, размещает базы данных. Часто применяется там, где важны скорость и ровная работа под нагрузкой.
  3. Объектное хранение. Подходит для больших объёмов: архивов, фотографий, видео, резервных копий, данных для аналитики. Его сильная сторона в более простом масштабировании: можно быстро наращивать объём почти и хранить очень много данных.

На практике компании нередко смешивают подходы: например, базы и виртуальные машины держат на одном типе хранения, а архивы и бэкапы на другом.

Надёжность и восстановление после сбоев

Любая система может дать сбой: может выйти из строя диск, пропасть питание, случиться ошибка в конфигурации или внешняя проблема. Поэтому важна не только «железная» надёжность, но и то, насколько быстро и правильно система умеет восстанавливаться.

Обычно используют несколько мер: резервное копирование, дублирование важных компонентов, копирование данных на другой узел, а также защиту от перегрузок и атак.

Чтобы понимать, насколько всё это эффективно, часто смотрят на два показателя:

  1. RPO — сколько данных можно потерять в худшем случае. Например, если резервная копия делается раз в час, то при серьёзном сбое можно потерять данные примерно за последний час.
  2. RTO — сколько времени допускается на восстановление. То есть как быстро сервис должен снова заработать после сбоя.

Как выбрать СХД под свои задачи

При выборе СХД обычно отталкиваются от реальной нагрузки и планов на рост.

  1. Объём. Сколько данных уже есть и как быстро они растут.
    2. Скорость. Насколько важны быстрая работа и стабильный отклик.
    3. Надёжность. Есть ли резервирование, копии, понятный план восстановления.
    4. Расширение. Можно ли без проблем добавить объём и производительность позже.
    5. Совместимость. Поддерживаются ли нужные системы и способы подключения.
    6. Бюджет. Важно сравнивать не только цену, но и то, что входит в поддержку и обслуживание.

В дата-центрах часто предлагают два сценария: либо отдельную СХД целиком, либо выделенную часть хранилища внутри общей системы . Первый вариант обычно берут, когда данных очень много и нужен полный контроль. Второй — когда важна конкретная задача: база данных, виртуальные машины, медиахранилище.

Что дальше

Объемы данных растут, и требования к хранению тоже становятся строже: нужно больше скорости, меньше простоев, понятнее контроль. Поэтому производители регулярно выпускают новые решения и улучшают уже существующие.

В последнее время в СХД есть тренд на использование SSD, потому что это предоставляет более ровную и предсказуемую работу даже под нагрузкой. Но при таком подходе важно аккуратно обращаться с записью данных, чтобы накопители служили дольше. Из-за этого в современных СХД много внимания уделяют оптимизации работы с дисками и защите от лишнего износа.