Смартфоны        23.06.2022   

Обзор систем резервного копирования и восстановления данных на мировом и российских рынках. Задачи и средства резервного копирования и хранения данных Зачем вообще нужен бэкап

Чего больше всего боятся пользователи современных информационных систем? Мы не станем проводить опросы и на их основании составлять список мучающих их ночных кошмаров. Мы просто констатируем, что на одном из первых мест в этом мрачном списке находится угроза потери данных. И если потеря данных на домашнем компьютере в большинстве случаев вызывает досаду, то потеря информации в корпоративной сети может стать фатальной как для сотрудника, так и для компании в целом. Но для того, кто ответственен за резервное копирование, фатальность этой потери абсолютно неотвратима. Однако насколько это справедливо?

Современных информационных системах проблеме резервного копирования придается первоочередное значение. Компании тратят огромные средства на приобретение отказоустойчивых дисковых массивов, специализированных устройств резервного копирования и хранения, нанимают высококлассных профессионалов для их обслуживания - и все равно продолжают терять данные. Естественно, летят головы. Однако зачастую проблема заключается в неправильном использовании прекрасно отлаженных и настроенных систем. Образно говоря, пользователи пытаются забивать гвозди микроскопом.

В феврале этого года в одном крупном издательском холдинге случилось страшное: были потеряны данные одного из проектов. При этом были отмечены следующие странности:

1. Структура папок проекта осталась без изменения - пропали только файлы.

2. На ленте резервного копирования (которое, кстати, выполнялось ежедневно) файлов обнаружено не было, хотя структура папок присутствовала в полном объеме.

Необходимые меры для создания системы резервного копирования

Система резервного копирования является одним из необходимых условий обеспечения непрерывности бизнеса. По данным Gartner, 43% компаний, пострадавших от катастроф и переживших крупную необратимую потерю корпоративных данных, не смогли продолжить свою деятельность.

Для того чтобы система резервного копирования отвечала своему назначению и работала оптимальным образом, необходимо выполнить полный цикл проектных работ, что, впрочем, рекомендуется сделать для любой создаваемой системы. Полный цикл работ, направленный на создание или модернизацию системы резервного копирования, как правило, включает следующие этапы:

Технический аудит вычислительной системы на предмет создания или модернизации системы резервного копирования;

Разработка концепции системы резервного копирования - выработка рекомендаций по построению, модернизации и развитию системы резервного копирования. Данный вид работ не является обязательным, но рекомендуется для больших, динамически развивающихся систем;

Проектирование системы резервного копирования - разработка технической и рабочей документации;

Разработка плана-графика перехода со старой системы резервного копирования на новую. Данный вид работ необходим при модернизации системы резервного копирования, приведшей к значительному изменению существующей системы;

Поставка и настройка оборудования и программного обеспечения;

Разработка процедур эксплуатации - организация процессов эксплуатации системы резервного копирования, разработка регламентов и расписаний системы резервного копирования. Этот вид работ очень важен: без организованного должным образом процесса эксплуатации не будет эффективно работать ни одна система, в том числе система резервного копирования;

Составление программы тренинга персонала заказчика по резервному копированию и восстановлению данных. Для системы резервного копирования тренинг персонала играет особую роль. Поскольку цель системы резервного копирования - восстановление данных после сбоев, то персонал, осуществляющий данную процедуру, будет работать в условиях внештатной ситуации и дефицита времени на восстановление работоспособности системы. Следовательно, выполнение операций восстановления данных должно быть доведено администраторами до автоматизма, что достигается только регулярной практикой.

Расследование, традиционно для России, пошло по двум направлениям: установление виновных и принятие мер к исключению возможностей повторения подобной ситуации в будущем.

Прежде всего претензии были предъявлены к программному обеспечению резервного копирования. Причина, по которой это было сделано, оказалась весьма прозаичной: именно ПО резервного копирования должно проходить по всей структуре диска для копирования информации на ленту, а следовательно, при каком-либо сбое в работе теоретически способно уничтожить файлы. Поскольку это предположение исходило от пострадавших, одного лишь заявления о том, что это невозможно, было явно недостаточно. Оставляя в стороне вероятность появления столь уникального сбоя в сертифицированном и легально приобретенном программном продукте, мы были вынуждены найти простой и наглядный способ убеждения неспециалистов в абсурдности данного предположения. Задача эта является крайне сложной (а в большинстве случаев - невозможной), однако нам это удалось. Дело в том, что ПО резервного копирования при работе с файлами использует одну из учетных записей домена; следовательно, оно ограничено в своих разрушительных возможностях правами используемой учетной записи. По умолчанию используется учетная запись локального администратора, что позволяет получить полный доступ ко всей информации, хранящейся на сервере. С одной стороны, этот подход оправдан тем, что исключает ситуацию, когда резервное копирование не может быть выполнено из-за отсутствия прав доступа к резервируемой информации. С другой стороны, права администратора подразумевают полный доступ, позволяющий удалять информацию. В рассматриваемой ситуации ПО резервного копирования работало под специально созданной учетной записью, имеющей доступ ко всей информации, однако без возможности ее изменения (доступ read-only). Именно этот факт и позволил IT-департаменту доказать непричастность ПО резервного копирования к имевшему место инциденту.

Таким образом, после прекращения возникшей было паники была предпринята попытка осмыслить происшедшее и найти ее наиболее приемлемое объяснение. Прежде всего было установлено, что еще за три месяца до рассматриваемого момента папка потерянного проекта была пустой. Данный факт нашел свое отражение в протоколах работы ПО резервного копирования и был приобщен к делу. Затем было установлено, что на сервере хранился завершенный проект, к которому никто не обращался в течение как минимум трех месяцев. В результате после удаления информации с сервера она сохранялась на лентах в течение месяца (период ротации магнитных носителей в используемой схеме резервирования), после чего ленты были перезаписаны, а эта информация оказалась окончательно утрачена.

Требования к системе резервного копирования

Поскольку любая современная информационная система строится на основе сети, система резервного копирования также должна быть сетевой, то есть обеспечивать сохранение данных, поступающих от всех узлов сети. В целом к сетевой системе резервного копирования выдвигаются следующие функциональные требования:

Построение системы по принципу «клиент-сервер» . В применении к резервному копированию терминология «клиент-сервер» означает следующее: компонент системы резервного копирования, обеспечивающий управление всеми процессами и устройствами, называется сервером, а компонент, отвечающий за сохранение или восстановление конкретных данных, - клиентом. В частности, такая система должна обеспечивать:

Управление с выделенных компьютеров резервным копированием во всей сети;

Удаленное резервное копирование данных, содержащихся на серверах и рабочих станциях;

Централизованное использование устройств резервного копирования.

Многоплатформенность . Современная информационная сеть является гетерогенной. Соответственно и система резервного копирования должна полноценно функционировать в такой сети, то есть предполагается, что ее серверная часть будет работать в различных операционных средах и поддерживать клиенты на самых разных аппаратно-программных платформах.

Автоматизация типовых операций . Процесс резервного копирования неизбежно содержит много циклов различных операций. Например, копирование может осуществляться каждый день в определенное время.

Другой пример цикла — это процесс перезаписи информации на носителях резервных копий. Если ежедневная резервная копия должна храниться неделю, то по истечении этого срока соответствующий носитель можно использовать заново. Такой процесс последовательной замены носителей резервных копий называется ротацией.

К циклическим работам относится и профилактическое обслуживание устройств резервного копирования, например чистка узлов лентопротяжного механизма стримера при помощи специальной кассеты по истечении определенного срока работы.

Таким образом, система резервного копирования должна выполнять циклические работы в автоматическом режиме и минимизировать число ручных операций. В частности, она должна поддерживать:

Выполнение резервного копирования по расписанию;

Ротацию носителей;

Обслуживание устройств резервного копирования по расписанию.

Следует отметить, что автоматизация работ является одним из ключевых условий снижения затрат на сопровождение системы резервного копирования.

Поддержка различных режимов резервного копирования . Предположим, что каждый день необходимо создавать резервную копию некоторого набора файлов, например содержащихся в одном каталоге. Как правило, в течение рабочего дня изменения вносятся лишь в отдельные файлы, вследствие чего ежедневное копирование информации, оставшейся неизмененной с момента создания предыдущей резервной копии, является излишним. Исходя из этого система должна обеспечивать различные режимы резервного копирования, то есть поддерживать возможность сохранения только той информации, которая была изменена с момента создания предыдущей копии.

Быстрое восстановление серверов сети после аварии . Сервер сети может выйти из строя по различным причинам, например из-за аварии системного жесткого диска или вследствие ошибок программного обеспечения, приведших к разрушению системной информации. В этом случае его восстановление требует переустановки ОС, конфигурирования устройств, инсталляции приложений, восстановления файловой системы и учетных записей пользователей. Все эти операции очень трудоемки, и на любом из этапов данного процесса возможно возникновение ошибок.

Таким образом, для восстановления сервера необходимо иметь резервную копию всей хранящейся на нем информации, включая системные данные, чтобы как можно быстрее привести его в рабочее состояние.

Резервное копирование данных в интерактивном (on-line) режиме . Зачастую информационная система включает различные приложения «клиент-сервер», которые должны функционировать круглосуточно. Примером этого являются почтовые системы, системы коллективной работы (например, Lotus Notes) и SQL-серверы. Осуществить резервное копирование баз данных таких систем обычными средствами невозможно, поскольку они все время открыты. Поэтому в них часто встроены собственные средства резервного копирования, но их использование, как правило, не вписывается в общую технологию, принятую в организации. Исходя из этого система резервного копирования должна обеспечивать сохранение баз данных приложений «клиент-сервер» в интерактивном режиме.

Развитые средства мониторинга и управления. Для управления процессами резервного копирования и отслеживания их состояния система резервного копирования должна иметь графические средства мониторинга и управления и широкий набор средств оповещения о событиях.

Итак, хронологию утери информации мы установили. Теперь перед нами встала очень непростая задача - определить виновных. С одной стороны, система резервного копирования не справилась с задачей сохранения информации. С другой стороны, в течение месяца эта информация сохранялась на лентах и могла быть восстановлена по первому требованию пользователя. Но этого требования не поступило, ибо проект был завершен и с ним никто не работал. В результате правы все, виновных нет, как нет и информации. Сложившаяся ситуация - хороший пример неправильного использования правильной технологии. Давайте ответим на вопрос: какая задача стоит перед системами резервного копирования? Приоритетная задача - это оперативное и максимально полное восстановление информации при возникновении сбоя. Другое дело, что в рассматриваемом примере факт наличия сбоя не был отслежен - и соответственно не было произведено восстановление данных. Но это никак не может быть поставлено в вину службе администрирования и резервного копирования.

Рассматриваемая ситуация является примером, наглядно демонстрирующим необходимость ведения как минимум двухуровневой системы резервного копирования - ежедневное резервное копирование текущей информации и отдельное резервирование редко используемой информации (в нашем случае - завершенных проектов). К сожалению, необходимость такого подхода к проблеме защиты информации, как правило, не находит понимания у руководства.

Чем же закончилась сия печальная история? А вот чем:

1. Было принято решение сохранять завершенные проекты на DVD.

2. Период ротации магнитных носителей был увеличен до трех месяцев.

3. Была разработана и принята политика хранения и резервирования информации в рамках всего холдинга.

P.S. Данные все-таки были найдены в одном из файловых залежей, коих немало в любой сети.

Каждый пользователь компьютера наверняка знает, что ни одна система не застрахована от появления ошибок и даже критических сбоев, когда обычными средствами восстановить ее не представляется возможным. Для этого и разработаны программы для и включая утилиты, позволяющие создавать бэкап-копии жестких дисков и логических разделов. Рассмотрим наиболее популярные утилиты разного уровня сложности.

Программы и восстановления данных: целесообразность использования

Некоторые пользователи несколько неправильно себе представляют, насколько мощными являются утилиты такого типа. К сожалению, они ошибочно полагают, что самым простым вариантом станет обычное копирование пользовательских файлов в другие логические разделы, отличные от системного. Есть и еще одна категория юзеров, считающих, что можно скопировать весь системный раздел в другое место, а потом, в случае сбоя, из этой копии. Увы, ошибаются и те, и другие.

Конечно, к пользовательским файлам такая методика применима, но ведь не каждому хочется загромождать другой логический том кучей информации или постоянно держать под рукой внешний носитель вроде USB HDD, кучу дисков или флэшек, емкость которых явно ограничена. А при больших объемах данных следует учесть еще и время копирования из одного тома в другой. Программы резервного копирования и восстановления и системы, и разделов работают несколько иначе. Конечно, в большинстве случаев понадобятся съемные носители, однако созданная бэкап-копия будет занимать во много раз меньше места.

Основной принцип работы и варианты функционирования

Как правило, большинство сегодня известных и широко применяемых утилит в основном используют принципы создания образов и сжатия копируемых данных. При этом образы чаще всего применяются именно для создания копий операционной системы, что позволяет в дальнейшем восстановить ее после непредвиденного критического сбоя, а утилиты для копирования разделов или пользовательских файлов предполагают именно сжатие по типу архивирования.

Что же касается вариантов резервирования, их может быть два. В принципе, практически любая программа для резервного копирования системы предлагает использовать внешний носитель (DVD-диск, флэшку и т. д.). Связано это только с тем, что при восстановлении системы придется загружаться не из системного раздела, а именно со съемного носителя. Образ в логическом разделе распознан не будет.

Другое дело - программы резервного копирования дисков. В них можно произвести сохранение нужной информации именно в других логических разделах или, опять же, использовать съемные носители. Но что делать, если используемый объем винчестера исчисляется сотнями гигабайт? Никакой не позволит записать эту информацию даже в сжатом виде. Как вариант можно использовать внешний HDD, если он, конечно, имеется в наличии.

Что же касается выбора подходящей утилиты для сохранения пользовательских файлов, лучшее решение - программа резервного копирования файлов по расписанию. Такая утилита способна производить данную операцию без участия пользователя, сохраняя все сделанные за определенный промежуток времени изменения. В резервную копию могут добавляться новые данные, равно как и старые - удаляться из нее. И все это в автоматическом режиме! Преимущество налицо - ведь пользователю в настройках нужно только задать временной интервал между точками копирования, дальше все происходит без него.

«Родная» программа для резервного копирования Windows

Итак, для начала остановимся на собственном средстве Windows-систем. Многие считают, что встроенная в систему программа резервного копирования Windows работает, мягко говоря, не очень хорошо. В основном ее не хотят использовать только в связи с тем, что утилита затрачивает слишком много времени на создание копии, а сама копия занимает достаточно много места.

Однако и достоинств у нее хватает. Ведь кому как не специалистам Microsoft знать все тонкости и нюансы, связанные с компонентами, которые крайне необходимы для корректного восстановления Windows? И многие юзеры явно недооценивают возможности встроенного в систему средства. Ведь не зря же такая программа резервного копирования и восстановления включена в основной набор системы?

Получить доступ к этой утилите проще всего можно из стандартной "Панели управления", где выбирается раздел резервного копирования и восстановления. Здесь можно использовать три основных пункта: создание образа, создание диска и настройку копирования. Первый и второй сложностей не вызывают. Зато третий достаточно интересен. Система предложит сохранить копию на съемном носителе, предварительно определив само устройство. Но если посмотреть на параметры, можно сохранить копию и в сети, что прекрасно подойдет для «локалок». Так что в некоторых случаях такая программа для резервного копирования системы станет неплохим средством для создания бэкапа с возможностью последующего восстановления Windows именно из этой копии.

Самые популярные утилиты

Теперь посмотрим на утилиты, которые, по мнению многих экспертов, сегодня являются наиболее востребованными у пользователей. Сразу отметим, что рассмотреть все программы резервного копирования просто невозможно, поэтому остановимся на некоторых из них, учитывая уровень популярности и сложности их использования. Приблизительно список таких утилит может выглядеть следующим образом:

  • Acronis True Image.
  • Norton Ghost.
  • Back2zip.
  • Comodo BackUp.
  • Backup4all.
  • ABC Backup Pro.
  • Active Backup Expert Pro.
  • ApBackUP.
  • File Backup Watcher Free.
  • The Copier.
  • Auto Backup и многие другие.

Теперь постараемся посмотреть на первую пятерку. Учтите! На данный момент рассматриваются программы резервного копирования, в основном применяемые для рабочих станций (пользовательских компьютеров). Решения для серверных систем и сетей будут рассмотрены отдельно.

Acronis True Image

Безусловно, это одна из самых мощных и популярных утилит, пользующаяся заслуженным успехом и доверием многих юзеров, хоть и относится к программам начального уровня. Тем не менее, возможностей у нее хватает.

После запуска приложения пользователь попадает в основное меню, где можно выбрать несколько вариантов действий. В данном случае нас интересует раздел создания резервной копии и восстановления (в меню есть еще дополнительные утилиты, которые сейчас по понятным причинам рассматриваться не будут). После входа активируется "Мастер", который и поможет создать бэкап. В процессе можно выбрать, копию чего именно нужно создать (система для восстановления «с нуля», файлы, настройки и т. д.). В "Типе копирования" лучше выбирать "Инкрементное", поскольку оно поможет сэкономить место. Если объем носителя достаточно велик, можно использовать полное копирование, а для создания нескольких копий - разностное. При создании копии системы будет предложено сделать загрузочный диск.

Вот что интересно: утилита показывает достаточно высокие показатели по скорости создания бэкап-копии, времени, сжатию. Так, например, на сжатие данных порядка 20 Гб понадобится в среднем 8-9 минут, а размер конечной копии составить чуть более 8 Гб.

Norton Ghost

Перед нами еще одна мощнейшая утилита. Как обычно, после старта программы запускается "Мастер", помогающий пройти все шаги.

Данная утилита примечательна тем, что с ее помощью можно создать на винчестере скрытый раздел, где будет храниться копия (причем из нее можно восстановить и данные, и систему). Кроме того, в ней можно изменять множество параметров: тип контроль считывания, тип записи, сжатие, число точек для одновременного доступа и т. д. Что же касается производительности, те же 20 Гб приложение сжимает до размера чуть более 7,5 Гб, что по времени занимает около 9 минут. В общем, результат довольно неплохой.

Back2zip

А вот программа резервного копирования по расписанию. Она отличается тем, что ее инсталляция занимает всего пару секунд, а после запуска она автоматически создает новое задание и начинает копирование данных, предполагая, что пользовательские файлы хранятся в папке «Мои документы». К сожалению, это и главный минус.

При старте задание нужно удалить, а затем выбрать исходную конечную папки. "Мастера" в привычном понимании тут нет, все выполняется из главного окна. В планировщике можно задавать интервал копирования от 20 минут до 6 часов. В целом, самое простое решение для пользователей начального уровня.

Comodo BackUp

Перед нами еще одна интереснейшая утилита, способная конкурировать даже с коммерческими продуктами. Ее главной особенностью является наличие целых пяти режимов работы и огромное количество настроек.

Интересно, что утилита способна реагировать на изменения в файлах, входящих в состав бэкапа, в режиме реального времени. Как только исходный файл изменяется и сохраняется, приложение тут же создает его копию, добавляя и замещая конечный элемент в бэкапе. Не говоря о планировщике, отдельно можно отметить старт создания копий либо в момент старта, либо при выходе.

Backup4all

Наконец, посмотрим еще на одну бесплатную утилиту, позволяющую, так сказать, одним махом сделать резервные копии для всего, что может понадобиться в дальнейшем одновременно.

Эта утилита интересна тем, что позволяет сохранять копии не только на внешних или внутренних носителях, но и в сетях, или даже на FTP-серверах. Здесь имеется достаточно много редактируемых параметров и настроек, среди которых можно выделить четыре метода копирования, а также поддержку Кроме того, интерфейс очень прост, а отображение папок и заданий представлено в виде древовидной структуры по типу "Проводника". Также пользователь может разделять копируемые данные по категориям вроде документов, рисунков и т. д., присваивать каждому проекту собственный ярлык. Естественно, имеется и "Планировщик задач", в котором можно указать, например, создание копий исключительно в момент низкой нагрузки на процессор.

Решения для серверных систем

Для серверных систем и сетей также имеются специализированные программы резервного копирования. Среди всего этого многообразия можно выбелить три самых мощных:

  • Symantec Backup Exec 11d System Recovery.
  • Yosemite Backup Standard Master Server.
  • Shadow Protect Small Business Server Edition.

Как считается, такие утилиты являются хорошим инструментом резервирования применительно к малому бизнесу. При этом восстановление «с нуля» может производиться с любой рабочей станции, находящейся в сети. Но самое главное состоит в том, что резервирование нужно произвести только один раз, все последующие изменения будут сохранены автоматически. Все приложения имеют интерфейс по типу "Проводника" и поддерживают дистанционное управление с любого терминала в сети.

Вместо послесловия

Остается добавить, что здесь были рассмотрены далеко не все программы резервного копирования/восстановления данных, позволяющие создавать бэкапы и систем, и файлов, а затем восстанавливать их из созданных копий. Однако, думается, что даже краткие сведения о приведенных программах многим дадут представление о том, как это работает, и зачем все это нужно. Вопрос выбора подходящего ПО по понятным причинам мы оставляем открытым, поскольку он уже зависит от предпочтений самого юзера или системного администратора.

Cистема резервного копирования может работать вот так

Чем корпоративный бэкап отличается от домашнего?
Масштаб - инфраструктуры до петабайта. Скорость – тысячи транзакций в секунду, поэтому, например, нужно уметь забирать бэкап из базы данных на лету, не останавливая запись. Зоопарк систем: рабочие машины, мобильные телефоны и планшеты, профили людей в «облаке», копии баз данных CRM/ERP, все это на разных ОС и в тяжелых разветвленных системах.

Ниже я расскажу про решения от IBM, EMC, CommVault, Symantec и то, что они дают как бизнесу в целом, так и IT-отделу. Плюс о некоторых подводных камнях.

Давайте посмотрим на эти особенности бэкапа в обычных российских компаниях. В том числе таких, которые бэкапятся только на случай изъятия оборудования.

Начинаем ликбез. Бэкап вообще нужен?

Обычно такой вопрос задают люди, далекие от IT. Правильный вопрос - «какой бэкап нужен»? В начале этого года мне на глаза попадался отчет, что в среднем по миру утеря данных стоит до трети стоимости компании, в США и Европе - до половины. Проще говоря, отсутствие свежего бэкапа может в некоторых случаях означать уход с рынка.

Зачем вообще нужен бэкап?

Конечно, для защиты от сбоев, атак и человеческой глупости. В целом, вопрос немного наивный, но все же давайте разберемся чуть подробнее.
  • Во-первых, он защищает данные от утери. Основные причины утери - это сбои оборудования, падение удаленных площадок (например, при пожаре в ЦОДе), изъятие оборудования. Более мелкие случаи - утеря ноутбуков и так далее.
  • Также бэкап защищает целостность данных: страхует от ошибок оператора, например. Это вторая по распространенности причина: человек может взять и «запороть» важные данные не той командой.
  • В-третьих, в корпоративной среде «горячий» бэкап может понадобиться для быстрого развертывания сервисов при чрезвычайном происшествии, это очень актуально у тех, для кого особенно критична непрерывность IT-процессов, например, у телеком операторов или банков.

Как обычно приходят к сложным системам?

Тут все просто: с ростом компании. Сначала используются простые средства: копирование вручную, затем скриптами по расписанию или настройкой утилиты, после появляется серверное приложение, которое этим управляет. На этой стадии обычно добавляются требования к уровню бэкапа от безопасников или финансового отдела (управляющего рисками компании) - и вот тогда начинается внедрение. Каждая задача классифицируется по важности и оценивается, например, биллинг должен накатываться через 5 минут после аварии на активную дублирующую систему в другом ЦОДе, а данные сотрудников офиса - через 2 часа на заранее подготовленное, но законсервированное оборудование. На этом уровне появляется необходимость плотной интеграции с приложениями, а чуть позже - и с аппаратными массивами для хранения.

Как выглядит интеграция на практике?

Как правило, когда наши специалисты приходят ставить тотальный бэкап, в крупной компании уже есть несколько подсистем резервного копирования. Чаще всего, речь идет об уже настроенных приложениях файлового бэкапа и регулярном снятии отпечатков баз данных (например, о ночном бэкапе базы 1С) и складированию их на отдельное устройство. Бывают, конечно, и феерические случаи. Например, одна розничная сеть вообще не делала бэкап баз о наличии товара на складе - и в случае сбоя отправляла людей делать инвентаризацию.

Или вот еще пример - в филиале есть копия базы данных, которая используется только для чтения. Все данные, которые создаются на ее основе, временные. При падении копия этой базы запрашивается из головной организации и идет три дня. Люди сидят и ждут. Понятно, что данные не теряются, но если бы был правильный бэкап, они бы смогли продолжить работу уже через 20 минут.

Что самое важное в ПО для резервного копирования?

Давайте рассмотрим главные параметры.

Архитектура
Архитектура решения несомненно важна. Разделение системы на функциональные модули является обычной практикой для всех корпоративных решений по резервному копированию. Важным моментом является отделение слоя хранения от логического уровня управления данными, как это сделано, например в CommVault Simpana – одно задание резервного копирования может использовать как диск, так и ленту или даже облачное хранилище.


Пример архитектуры ПО резервного копирования (CommVault Simpana)

Функции централизованного управления.
Важно управлять всеми операциями. Бэкап крупных систем достаточно сложен, поэтому важно, чтобы администратор точно представлял, что происходит. При разветвленной структуре, например, в крупном ЦОД с сотнями систем, к каждой не «подойдешь» и не посмотришь, есть у нее резервная копия или нет. Тут нужна система, которая может построить отчет, посмотреть, что все данные и приложения копируются или не копируются, на что нужно обратить внимание, известить администратора о каких-то проблемах.


Централизованное управление СРК

У лидеров рынка появляются системы, которые позволяют посмотреть, что и где хранится, какие типы данных, что именно можно оптимизировать и так далее. Можно построить прогноз на год вперед.

Конкретные массивы и БД
Первое - поддержка массивов, заточенность под конкретные базы данных. Нужно получать данные снизу и использовать их в более сложных функциях, вроде создания аппаратных снимков. Сами системы резервного копирования уже умеют выполнять операции с массивами для обеспечения защиты данных, не затрагивая производственные системы, которые работают с этими массивами, или минимизируя нагрузку на них,

Проще говоря, система должна уметь налету делать копию базы данных, с которой сейчас производятся транзакции, и не запрашивать эту копию у серверного приложения. То есть должна грамотно и незаметно для приложения и пользователей забирать данные с дискового массива.

К примеру, системы CommVault или ЕМС поддерживают практически все имеющиеся на корпоративном рынке ОС и коммерческие приложения (в частности, базы данных Oracle, Microsoft, у CommVault есть еще поддержка PostgreSQL и MySQL, Documentum, SAP).

Дедупликация - архитектура
Важна грамотная дедупликация. Хорошая дедупликация в разы снижает требования по цене к дисковым массивам и очень хорошо жмет трафик. Грубо говоря, если первый бэкап пользовательских данных с виртуальных машин был на 10 Gb, то каждый следующий, за день, может быть на 50-60 Mb - из-за разницы между слепками систем. При этом у лидеров рынка резервного копирования (про них ниже) для внешних систем копии видны как отдельные слепки, то есть так, как если бы каждый раз делался тотальный бэкап. Это невероятно ускоряет восстановление.

Особо отмечу, дедупликация в современных системах делается на источнике, то есть на той системе, откуда данные забираются, что сильно снижает нагрузку на каналы. Это очень важно для разветвленных сетей, у которых не всегда есть достаточно широкий канал, по которому можно передать полную резервную копию. Обычная «серийная» копия для сложных систем уровня SAP - это всего пара процентов от полного объема базы.

Подсистема дедупликации, по-хорошему, должна удобно масштабироваться. В идеале, линейно с добавлением узлов хранения путем организации некоторого Grid или Cloud. При этом узлы не должны быть отдельными островами со своими наборами данных, а связаны в единое дедупликационное пространство. И совсем хорошо, если эти узлы распараллеливают нагрузку и параллельно ее обрабатывают. Отмечу, что сейчас многие заказчики бросаются меряеть коэффиценты дедупликации при сравнении продуктов. Но это не совсем правильно: современные SATA диски уже по 4ТБ в объеме каждый. Плюс-минус пару дисков и все системы смогут хранить одинаковый объем данных – и лучше докупить один диск в начале, чем при необходимости роста перестраивать всю систему.

Балансировка нагрузки
Еще в таких системах есть функции по обеспечению отказоустойчивости операции и балансировки нагрузки, что важно в больших ЦОДах, когда объемы данных в одной системе могут достигать десятков и сотен Tb. Например, у платформы виртуализации может быть очень большой объем данных и большое количество виртуальных машин. Сама система, в данном случае, должна позволять построить набор серверов, которые будут передавать данные, получать их с платформы и записывать на хранилище, при этом так, чтобы они между собой имели возможность взаимодействовать, а в случае повышения или снижения нагрузки перераспределять ее автоматически. Функция простая и очевидная, но достаточно критичная, потому что влияет на скорость и оперативность создания резервных копий.

Важна непрерывность . При отказах любых компонентов можно обеспечить успешное прохождение заданий за окно резервного копирования (ночь обычно). CommVault Simpana позволяет это делать автоматически при отказах медиа-серверов, баз данных дедупликации. В других системах есть ограничения или требуются дорогостоящие аппаратные решения. На рисунке можно видеть два сервера с агентами, которые работают в связке и если один ломается, вступает в работу другой. При этом оба они пишут на один и тот же диск, имеют общую базу дедупликации:

Физическое хранение

Чаще всего речь идет о хранении на дисковых массивах, где обеспечивается дополнительная защита данных. Первый слой - важные данные обязательно хранятся на двух независимых удаленных площадках (например, в разных ЦОДах). Второй слой - эти данные хранятся на разных накопителях. Например, файл из 10 блоков может быть записан на 11 накопителей - и при выходе из строя любого из них остальные будут содержать достаточное количество данных для восстановления недостающего звена. Вот пример одной из таких .

Диски и лента + «облако»

Так получается, что ленточные накопители все еще используются. Чаще всего «горячие» данные (скажем, процентов 10 самых важных) хранятся на дисках, откуда их можно быстро получить, а уже второй уровень - на ленте. Это практично и дешево, плюс лента позволяет хранить данные чуть ли не десятилетиями без замены оборудования, они просто вынимаются и кладутся на полку. Частый случай - логи и другие документы банков, которые нужно хранить определенный срок. Система бэкапа умеет выделять такие данные на диске, отчуждать их и архивировать на ленточном накопителе. При этом всегда есть возможность в случае аварии найти эту информацию и восстановить. Записывать, кстати, можно как полные копии, так и дедуплицированные – если необходимо, умная система может собрать все обратно так, как будто последний слепок был полным.

А вот CommVault Simpana умеет еще напрямую складывать копию данных из корпоративного хранилища в «облако» (некоторые наши заказчики так делают с «облаком» КРОК – мы даже проводили сертификацию). Эта дополнительная копия может рассматриваться заказчиком как долговременный архив. Для его хранения не нужно думать об аппаратной части. Еще такая копия может быть использована для аварийного восстановления систем. Например, один из заказчиков делает так: копия всех виртуальных машин отправляется в наше «облако» на хранение. В случае падения основного ЦОДа заказчика, мы можем запустить все эти виртуальные машины на своей инфраструктуре. При этом оплата до запуска идет только за емкость – то есть получается очень экономично.

Прямая работа с пользователями

Если вы не сталкивались с корпоративным бэкапом, то у вас может сложиться впечатление, что обратно данные накатывает только IT-отдел, причем делает это вручную. Но, например, у CommVault это не совсем так.

В этой ситуации пользователь может сам зайти на портал (на картинке ниже) и накатить себе конкретно свои данные, если они были в копии. Обычно на таком портале также есть поисковик по резервным копиям и архивам (в рамках прав пользователя). К этому же архиву можно открыть доступ и сотрудникам информационной безопасности - это в разы уменьшит количество запросов к IT-отделу с вопросами вроде: «А у кого был документ такой-то».

Да, вы правильно поняли. Если пользователь потерял файл, случайно удалил письмо или же захотел найти старую версию документа для сравнения – он просто идет и делает все сам за считанные секунды без лишних сложностей. И даже не звонит и не пишет в IT-отдел.

Отдельно стоит сказать про поиск . Все неструктурированные данные (файлы, почта, объекты SharePoint и т.п.) которые попадают в систему, хорошо бы проиндексировать и организовать поисковик. Simpana это умеет. С одной стороны пользователи через консоль самообслуживания могут найти любой объект сами по ключевым словам. С другой стороны, служба безопасности может проводить целенаправленные мероприятия по анализу всей этой информации, в том числе для поиска внутренних угроз. Ну и система может устанавливать сроки хранения данных в зависимости от содержимого этих данных.

Как быстро все можно накатить обратно?

Предположим, у нас есть сложная система с базой данных Oracle в качестве хранилища. Данные физически «размазаны» по нескольким серверам в одном ЦОД. Используется CommVault.
  • Первый случай - пользователь взял и удалил данные со своей рабочей станции. Восстанавливает либо он сам, либо администратор: заходит в интерфейс, выбирает участок. Все остальное делает система. Пользователь видит красивый веб-интерфейс, администратор может работать с ним же или с консолью.
  • Теперь у нас падает почтовый сервер Exchange. Сценарий все еще достаточно простой: опять же, либо сам пользователь, либо администратор определяет, какие данные необходимо восстановить, подключается, заходит в систему, открывает консоль восстановления, выбирает область, жмет кнопку «восстановить».
  • Теперь у нас пропадают данные из базы нашего большого коммерческого приложения за сегодня. Например, все транзакции по купле-продаже. В этом случае бэкап-система будет стучаться к механизму RMAN, который есть в Oracle (это своего рода API по восстановлению данных). Но поскольку у нас уже все интегрировано, то администратор также только выбирает, что именно надо восстановить. Дальше уже сам RMAN вместе с бэкап-системой решает, что конкретно делать: восстанавливать целиком базу или какой-то TableSpace, т.е. отдельную таблицу, и так далее.
  • А теперь у нас ночью взрывается ЦОД. В этом случае администратор выбирает другой ЦОД и накатывает на «чистое» оборудование последнюю копию. Система сама собирает ему наиболее свежий полный слепок из дедуплицированных данных и отдает нужную информацию каждой подсистеме и приложению. Обычные пользователи, скорее всего, даже не замечают произошедшего. Может быть и так, что в другом ЦОДе частично данные уже есть, среплицированы или просто восстанавливаются по расписанию, тогда все еще проще и восстановление происходит уже даже не на чистую систему.

Развитие систем от версии к версии

С развитием систем резервного копирования появляется поддержка новых коммерческих приложений. Речь о стандартных сервис-паках в рамках поддержки. У CommVault, например, есть хорошая политика выпускать апдейты совместимости к текущей версии, а не заставлять покупать следующий релиз: это удобно, потому что инфраструктура компании развивается постоянно.

В новых версиях софта появляются новые фичи, вроде копирования за один проход, например, с одновременным переносом в архив с файл-серверов. Или относительно недавно объединились операции архивирования и бэкапа в Exchange - теперь они делаются тоже за один проход. В последнее время появилась приятная для крупных облачных систем возможность архивирования виртуальных машин: если машина долго не используется или выключена, то, в соответствии с набором правил, она может быть удалена с платформы виртуализации, и останется только резервная копия.

Недавно появились клиенты для iOS и Android для управления копиями своей рабочей станции: удобно, если кто-то уезжает в командировку и забывает презентацию, например. Или когда в дороге ломается ноутбук. Здесь тоже не нужно будить админа в два ночи: пользователь может сделать все сам.

Вендоры

По отчету Gartner - среди лидеров, с которыми мы активно работаем, в частности, IBM, Symantec, ЕМС и CommVault.


Квадрат Gartner: лидеры сверху-справа, нишевые игроки снизу-слева.

IBM Tivoli Storage Manager (TSM) - довольно гибкий продукт в плане настройки и организации схемы резервного копирования на предприятии. Совмещая различные компоненты TSM, заказчик получает возможность выстраивать нужный функционал под свои задачи. Но, зачастую, для этого требуется больше времени на проектирование и внедрение. TSM часто используется в составе комплексных решений на базе оборудования и ПО от IBM.

EMC . Являясь компанией производящей не только ПО, но и оборудование, нацелена, прежде всего, на интеграцию всех своих решений. Поэтому если инфраструктура в большей мере построена на СХД Clariion, VNX, data domain, стоит посмотреть на продукты по резервному копированию от EMC, которые позволят обеспечить однородную структуру системы. Кстати, и продукт EMC Avamar тоже является программно-аппаратным решением.

Symantec представлен на рынке резервного копирования своим флагманским продуктом NetBackup, ориентированным на enterprise-сегмент, и более «легковесным» BackupExec, традиционно используемым в средах, построенных в основном на продуктах Microsoft. NetBackup славится поддержкой большого спектра операционных систем, СУБД и бизнес-приложений, развернутых в том числе в виртуальном окружении. А также умеет использовать продвинутые возможности современных СХД. NetBackup является хорошим выбором для среды с большой долей UNIX-систем. С недавнего времени продукты от Symantec поставляются не только как ПО, но и как ПАК, что ускоряет их развертывание и настройку.

CommVault . Пожалуй, самым важным является то, что это целостный продукт, который закрывает практически все потенциальные потребности заказчиков. Это унифицированная платформа, объединяющая в себе функционал копирования, архивирования и доступа к данным. Плюс традиционно хорошая интеграция с платформами виртуализации, дедупликация и интеграция с облачными хранилищами. Ну и как говорилось выше, очень сильно разгружает IT-отдел за счет грамотной политики прав доступа пользователей к элементам архива. По опыту ряда внедрений, CommVault будет хорошим выбором при наличии большого количества разнородного ПО и оборудования. В гомогенных средах на базе *unix возможно стоит думать о других продуктах, но в гетерогенных – она сразу позволяет избавиться от хаоса и всегда быть спокойным за то, что бэкап есть, он свежий, и быстро накатится обратно, если что. А это, как вы наверняка знаете, весьма бережет нервы.

В целом, надо смотреть, конечно, по месту. Если у вас есть вопросы, что выбрать под вашу инфраструктуру, пишите на [email protected], поможем оценить все аспекты и предупредить о возможных подводных камнях.

В статье проведен обзор наиболее популярных систем резервного копирования и восстановления данных как во всем мире, так и в России. Рассматриваются продукты основных производителей систем резервного копирования и восстановления данных, приводятся данные об их основных функция и различиях. Особый акцент делается на продуктах, представленных на российском рынке.

Введение

Работа с любыми данными всегда связана с потенциальной возможностью их потери. Данные могут быть потеряны в результате различных факторов: человеческих ошибок (как пользователей, так администраторов сети), физической кражи, в результате деструктивных действий вредоносных программ, поломки устройств хранения данных. Если были потеряны личные данные (например, архив с фотографиями), то ущерб является субъективным и будет выражаться в негативных эмоциях пользователя. А, в случае потери служебной информации, ущерб может проявиться в экономической сфере - в финансовых убытках, потери конкурентных преимуществ, срывах или невыполнении контрактов и даже разорении организации.

Для защиты от потери информации используются системы резервного копирования и восстановления данных (Backup & Recovery). Система резервного копирования и восстановления данных - это программный или программно-аппаратный комплекс для создания копий данных с определенной периодичностью для их последующего восстановления. Помимо защиты от потери данных системы резервного копирования также позволяют обеспечить организовать непрерывность работы сотрудников за счет быстрого восстановления операционной системы (при наличии ее образа) или восстановления данных на другом компьютере.

Как работают системы резервного копирования и восстановления данных

Создание копии данных является достаточно простым процессом, однако реальные потребности пользователей зачастую бывают весьма разнообразны и сложны. Например, многие пользователи хотят иметь возможность делать резервные копии из произвольной точки или сохранять очень большие объемы данных. Для предприятий актуальной является проблема управления большим количеством данных, их хранением и быстрым восстановлением. Для решения каждого класса задач и существуют различные системы резервного копирования и восстановления данных.

Главные разделительные линии между различными системами резервного копирования и восстановления данных проходят по сферам их использования – для персональных нужд, в небольших компаниях и «домашних офисах» (SMB/SOHO/ROBO) или в средних (Enterprise) и крупных компаниях (Large Enterprise). В зависимости от этого различается цена систем резервного копирования и восстановления данных, используемые типы хранилищ, типы платформ, предоставляемые функции и т.д. Рассмотрим некоторые из этих критериев.

Одно из основных различий для систем резервного копирования и восстановления данных – это тип носителей для хранения данных. Для хранения резервных копий может использоваться лента, оптические диски (CD, DVD, Blu-Ray и т.д.), «жесткие» диски (HDD), твердотельные диски (SSD), сетевые хранилища. Каждый из них имеет свои достоинства и недостатки. Например, хранение данных на лентах только на первый взгляд кажется анахронизмом. Современные ленточные устройства достаточно дешевы и гарантируют длительное хранение данных. Но вот восстановление данных с таких носителей может быть очень долгим. Поэтому они больше подходят для архивации данных. «Жесткие» диски позволяют выполнять резервное копирование и восстановление достаточно быстро, однако у них высокая цена и не самое долгое время жизни.

Альтернативой «жестким» дискам является использование «облачных» хранилищ, в которых тип систем хранения скрыт от пользователей. Конечно, в качестве «железа» в них используются какие-либо диски, но проблема сохранности дисков ложится на поставщика услуг. А что же цена? Обеспечение дополнительных гарантий сохранности требует больших денег на содержание «облачной» инфраструктуры (может поддерживаться дублирование данных, «горячая» замена дисков, RAID-массивы). Однако при этом эффективность использования дискового пространства может быть выше, т.к. «облаком» может пользоваться несколько клиентов и эффективность его использование будет выше, чем у системы резервного копирования и восстановления данных, установленной непосредственно в компании. В результате этого эффективность той или иной системы сложно посчитать априорно, поэтому в каждой конкретной ситуации выбору системы хранения должен предшествовать экономический расчет.

Еще одно различие – это тип используемых платформ. Система резервного копирования и восстановления данных может быть реализована в виде программного обеспечения, программно-аппаратного комплекса или в виде услуги (software-as-a-service). Программное обеспечение стоит дешевле и требует отдельных систем хранения. Поэтому такие системы подходят для персонального использования и небольших компаний. Для крупных компаний такие системы могут использоваться в связке со специальными хранилищами данных. Для средних и крупных предприятий больше подходят системы резервного копирования и восстановления данных, выполненные в виде программно-аппаратных комплексов (PBBA, Purpose-Built Backup Appliance). Данные устройства подразделяются на две категории:

  1. PBBA target systems (целевые системы ). Данные комплексывыступает только в качестве целевого устройства для резервного копирования. Такое решение требует использования дополнительного программного обеспечения для автоматизации, управления и консолидации резервного копирования, которое, в свою очередь, должно быть размещено на дополнительном серверном оборудовании с развернутой операционной системой для интеграции всех перечисленных компонент. К таким устройствам относятся EMC Data Domain, HP StoreOnce и т.д.
  2. PBBA integrated systems (интегрированные системы). Это полностью законченные решения, не требующее дополнительных составляющих для полноценной работы. Они включают в себя сервера, дисковые массивы и программное обеспечение для осуществления резервного копирования. Такие системы имеют большую интеграцию между аппаратурой и программным обеспечением и могут включать дополнительные инструменты для работы с сетью (например, балансировку нагрузки). Такие решения не требуют дополнительных инвестиций в инфраструктуру, имеют меньшие затраты на развертывание и интеграцию, а также проще сопровождать и администрировать. К таким устройствам относятся EMC Avamar, Symantec Appliance BE+NBU и т.д.

В настоящее время ряд компаний предоставляет использование резервного копирования как услуги. В этом случае хранилище чаще всего располагается в «облаке» и все управление таким хранилищем осуществляет поставщик услуг, пользователь только заливает и восстанавливает данные.

Системы резервного копирования и восстановления данных отличаются и по функциям, которые они предоставляют. Условное можно выделить «базовые» и «расширенные» функции. К базовым функциям можно отнести работу по расписанию, сжатие и шифрование резервных копий. Дополнительные функции более разнообразны:

  1. Дублирование позволяет осуществлять одновременное копирование на несколько источников, что увеличивает надежность хранения данных.
  2. Дедупликация позволяет проводить анализ и сжатие дублируемых данных. В результате уменьшается нагрузка на каналы передачи данных и место для хранения данных.
  3. Создание образов системы. Периодическое копирование не только данных, но и образов системы позволяет быстро восстановить рабочее место сотрудника даже в случае повреждения операционной системы или персонального компьютера, что обеспечивает непрерывность его работы.
  4. Балансировка нагрузки. Позволяет оптимизировать нагрузку на несколько хранилищ для наиболее быстрого выполнения операций с резервными копиями.
  5. Совместимость с программным обеспечением (операционными системами и СУБД). Позволяет создавать «слепки» файлов и баз данных, которые могут меняться в процессе создания резервной копии, для их корректной целостной передачи и восстановления.
  6. Различные инструменты для удаленного администрирования. Это достаточно разнообразный набор функций, позволяющих автоматизировать работу администратора. К ним может относиться удаленная установка агентов на компьютеры пользователей, проверка созданных архивов, ручное или автоматическое слияние резервных копий и т.д.
  7. Работа с виртуальными устройствами.
  8. Работа с «облачными» хранилищами.
  9. Алгоритмы восстановления данных. При потере данных для увеличения скорости восстановления данных используются различные алгоритмы, позволяющие восстанавливать только нужные данные, исключать дублирование при восстановлении и т.д.

Мировой рынок систем резервного копирования и восстановления данных

Количество систем резервного копирования и восстановления данных в мире достаточно ограничено. Магический квадрат от компании Gartner указывает, что первые места на рынке занимают такие компании, как CommVault, EMC, IBM и Symantec.

Рисунок 1. «Магический квадрат» Gartner для систем резервного копирования и восстановления данных

В 2013 году аналитическая компания IDC выпустила подробный отчет (Worldwide Quarterly Purpose Built Backup Appliance Tracker) о рынке специализированных устройств для резервного копирования (PBBA, Purpose Built Backup Appliance). Согласно его данным, выручка компаний в данном сегменте за второй квартал 2013 года составила 720,2 млн. $, что на 7,3% больше, чем год назад.

Таблица 1. Доходы производителей в сфере специализированных устройств резервного копирования (в миллионах долларов)

Производитель

2 квартал 2012

2 квартал 2013

Объем продаж

Доля рынка

Объем продаж

Доля рынка

Из приведённой таблицы видно, что более половины рынка занимает компания EMC (62.6%). На второй позиции находится компания Symantec (12.4%), третье место занимает IBM с долей рынка 7.3%. Четвертое и пятое место занимают компании HP (5.3%) и Quantum (2.5%), все остальные компании занимают на рынке менее 2% и в сумме составляют 10% рынка. Из заметных тенденций можно указать на уменьшение доли рынка компании IBM на 40.4% и увеличение доли компании Symantec на 71.3%.

Лидеры в данной категории практически полностью совпадают с лидерами рынка систем для резервного копирования и восстановления данных в целом, что говорит о том, что именно специализированные устройства для резервного копирования во многом формируют выручку компаний. Единственное крупное различие – это компания CommVault, которая выпускает преимущественно программные продукты и позиционирует их как единую систему резервного копирования и архивации .

Российский рынок систем резервного копирования и восстановления данных

На российском рынке представлены основные мировые игроки рынка систем резервного копирования и восстановления данных, которые продвигают свои решения через региональных партнеров. На рынке представлены продукты компаний EMC, IBM, HP, Symantec, Dell, NetApp, CA Technologies, которые в большинстве ориентированы на крупные компании. Компания CommVault представлена на российском рынке в меньшем объеме, в основном ее решения предлагает компания КРОК. Также популярностью пользуются решения российских производителей Acronis и Paragon Software Group. Их решения особенно актуальны в связи с политикой экономии многих компаний, которые начинают уделять особое внимание показателям «цена/качество». Для защиты только виртуальных систем используются решения российской фирмы Veeam Software, однако их мы рассмотрим в рамках следующей специализированной статьи.

Компаний различного уровня на рынке России достаточно много, поэтому мы рассмотрим наиболее крупные и/или популярные из них. При этом акцент сделаем на корпоративные решения, так как именно они в основном и определяют рынок в данном сегменте рынка.

EMC

Основной системой компании EMC является EMC Avamar . Это комплексное программно-аппаратное решение для резервного копирования и восстановления данных, позволяющее работать как реальными, так и виртуальными устройствами. Поддерживается функция дедупликации сегментов переменной длины, которая осуществляется на устройстве клиента. Проводится оптимизации передачи данных при работе с разными типами сетей. Восстановление производится за один шаг. В EMC Avamar может быть настроена работа с конкретным типом программного обеспечения (например, базами данных Oracle) и виртуальными устройствами.

Для оптимизации управления данными используется дополнительное программное обеспечение EMC Data Protection Adviso . Оно автоматизирует мониторинг и анализ резервных копий, обеспечивает отправку оповещений администраторам при возникновении различных событий и позволяет создавать отчеты о работе резервного копирования.

Системы резервного копирования и восстановления данных являются достаточно «гибкими» и при необходимости могут масштабироваться за счет увеличения дискового пространства. EMC Avamar также могут интегрироваться с системами хранения данных EMC Data Domain . Данные системы представлены большой линейкой продуктов от небольших устройств (DD160, DD620), способных хранить несколько терабайт, до очень больших хранилищ (DD990) на несколько петабайт.

IBM

В сфере резервного копирования компания IBM представлена продуктом IBM Tivoli Storage Manager . Это программный продукт, который занимается созданием резервных копий и управлением устройствами хранения. IBM Tivoli Storage Manager совместим с большим количеством различных систем хранения данных. Он обеспечивает работу в локальных (LAN), глобальных (WAN) сетях и развивающихся сейчас сетях хранения данных (SAN).

Tivoli Storage Manager включает в себя средства для удалённого администрирования из любой точки сети или через Интернет. Администратор может автоматизировать различные этапы работы системы резервного копирования и восстановления данных за счет создания политик хранения. Набор политик, настроенный администратором, позволяет не только проводить штатные операции, но и оперативно реагировать на возникновение различных незапланированных ситуаций. За счет использования иерархической системы хранения в системе под управлением Tivoli Storage Manager могут использоваться различные типы устройств хранения (например, ленты и «жесткие» диски).

Tivoli Storage Manager позволяет проводить оптимизацию хранящихся данных за счет их сжатия, консолидации и использования «инкрементного» копирования. Для корпоративного программного обеспечения (базы данных, электронная почта) используются дополнительные клиенты, оптимизирующие работу с конкретным типом приложений.

Symantec

Компания Symantec предоставляет два продукта для резервного копирования и восстановления данных - это Symantec Backup Exe и Symantec NetBackup, которые предназначены для работы в средних и крупных сетях. Данные приложения включают в себя весь набор необходимых для резервного копирования функций (дедупликация, автоматическая целевая репликация, миграция между компьютерами, работа с физическими и виртуальными устройствами, работа в гетерогенной среде и т.д.). Данные продукты могут работать с различными системами хранения данных.

Отдельно стоит упомянуть дополнительные технологии по работе с виртуальными машинами. Технология виртуализации Symantec V-Ray объединяет в себе виртуальные и физические резервные копии и дает пользователям единый доступ ко всем резервным копиям, включая VMware, Hyper-V и физические устройства, позволяя быстро восстанавливать виртуальные машины, приложения, базы данных, файлы, папки и даже отдельные элементы приложений. Встроенная технология bare metal recovery позволяет восстанавливать данные на оборудовании, отличном от исходного, и включает в себя функцию резервного копирования в виртуальную машину (B2V) и преобразования в виртуальную машину (P2V), давая пользователям возможность восстановить отказавшие системы в VMware или Hyper-V окружении.

Для удобства работы с системами резервного копирования и восстановления данных Symantec также выпустила на рынок программно-аппаратные устройства Symantec Backup Exec 3600 , Symantec NetBackup 5230 . Одним из преимуществ их использования является минимальное время для их развертывания на предприятии. Утверждается, что администратору понадобится 20-30 минут, чтобы устройства начали работать и полноценно выполнять свои функции.

CommVault

Компания CommVault предлагает систему управления данными, выполненную в виде программного обеспечения и построенную по модульному принципу. Модули обеспечивают архивацию, защиту, резервное копирование и управление данными. Для работы с данными используется единая консоль управления.

Функции резервного копирования в CommVault Simpana включают в себя дедупликацию, создание образов системы, автоматизацию резервного копирования, централизованное управление резервными копиями, создание отчетов, предоставление пользователям самостоятельного доступа к резервным копиям, использование политик для иерархического хранения данных, балансировку нагрузки и т.д. CommVault Simpana обеспечивает глубокую интеграцию в виртуальную инфраструктуру для расширенных средств управления данными для платформ Microsoft Hyper-V, VMware vCenter и VMware vCloud Director.

CommVault поддерживают большинство имеющиеся операционных систем и приложений (в частности, базы данных Oracle, Microsoft, PostgreSQL и MySQL, Documentum, SAP) для того, чтобы создавать резервные копии в процессе работы приложений с минимальной нагрузкой на них.

HP

Компания HP представляет на рынке большой набор различных решений. Программное обеспечение HP Data Protector предназначено для обеспечения автоматического резервного копирования и восстановления данных, а также централизованного управления соответствующими политиками и процессами. Оно поддерживает большинство известных платформ и приложений и позволяет выполнять следующие функции:

  • дедупликацию данных в соответствии с технологией HP StoreOnce Federated Deduplication как на клиентах (source based), так и на отдельно выделенном сервере (backup server) или же на системах хранения данных(target based);
  • резервное копирование и восстановление виртуальных сред, включая защиту как целиком виртуальных машин, так и отдельных данных внутри них;
  • интеграцию с функциональностью дисковых массивов по созданию аппаратных снимков (snapshots) для осуществления резервного копирования с нулевым простоем Zero Downtime Backup и мгновенного восстановления информации Instant Recovery (IR);
  • возможность восстановления отдельных элементов резервной копии (например, отдельного файла из бэкапа виртуальной машины).

Для хранения резервных копий используется линейка дисковых библиотек с дедупликацией HPStoreOnce. Решение базируется на серверной платформе HP Proliant Gen8, модели имеют емкость от 8ТБ до 2.2ПБ (до 35ПБ с учетом дедупликации) и поддерживают скорость резервного копирования до 139ТБ/час. Оно может одновременно работать в режиме VTL (Virtual Tape Library), эмулируя ленточные приводы, и выступать в качестве файлового хранилища с доступом по CIFS/NFS.

Dell

В последнее время компания Dell нарастила портфель решений для резервного копирования и восстановления за счет приобретения компаний Quest Software и AppAssure. Для крупных предприятий и компаний Dell предлагает решение NetVault для организации резервного копирования всей инфраструктуры, а для компаний малого и среднего бизнеса более простое решение Appasure. Для резервного копирования виртуальных машин используется приложение vRanger. Российские разработчики подразделения Dell представляют также специализированные решения Dell Software для гранулярного восстановления AD и Exchаnge, а также уникальную технологию автоматизированного восстановления Active Directory при потере данных.

Для примера рассмотрим устройства Dell PowerVault серии DL и DR (актуальны модели - DL4000 и Dell DR4100). Устройства позволяют выполнять следующие функции:

  • оптимизация и упрощение операций резервного копирования, что позволяет избавиться от связанных с ним простоев;
  • встроенная сквозная дедупликация и сжатие данных на уровне блоков в сочетании с оптимизацией размеров резервных копий, позволяющей сэкономить пространство для резервного копирования и уменьшить необходимость репликации в глобальной сети;
  • точечное восстановление с возможностью создания моментальных копий каждые пять минут;
  • работа с виртуальными машинами.

Устройства могут работать под управлением программного обеспечения других производителей, например EMC или Symantec.

Quantum

Компания Quantum поставляет системы резервного копирования и хранения данных. Поставляются ленточные (SuperLoader; Scalar i40, i80, i500, i6000) и дисковые (DXi V1000, 4000, 6500, 6700, 8500) устройства и устройства резервного копирования для виртуальных машин Quantum vmPRO 4000.

Устройства отличаются объемами используемых хранилищ и поддерживают большинство дополнительных функций, встречающихся у систем резервного копирования корпоративного уровня. Для оптимизации копирования используется оригинальные алгоритмы дедупликации компании Quantum. Для централизованного управление и мониторинга используется программное обеспечение StorageCare Vision.

NetApp

Системы резервного копирования и восстановления данных от NetApp позволяют работать как с ленточными, так и дисковыми массивами. SnapProtect - это программное обеспечение для комплексного управления резервным копированием на диски и ленточные накопители для систем NetApp FAS. Оно позволяет выполнять моментальные снимки и репликацию данных, за счет чего существенно уменьшается время на работу с резервными копиями и их размер. Также SnapProtect позволяет управлять созданием и восстановлением копий с помощью единой консоли управления.

NetApp SnapVault - это программное решение для быстрого выполнения резервного копирования с диска на диск и защиты данных на уровне блоков. Позволяет сократить время создания резервных копий за счет инкрементного копирования на уровне блоков данных. Обеспечивает быстрое восстановление данных за счет большого числа параметров и точек восстановления.

CA Technologies

Для резервного копирования и восстановления данных CA Tehnologies предлагает программное обеспечение CA ARCserve Backup . Оно позволяет выполнять достаточно большой объем функций:

  • дупликацию данных для сокращения объемов используемых хранилищ;
  • поддержку резервного копирования при работе с виртуальными машинами под управлением VMware, Microsoft Hyper-V™ и Citrix® XenServer;
  • поддержка резервного копирования в «облаке» для быстрого переноса данных между физически удаленными объектами;
  • использование резервного копирования на основе мгновенных снимков (ARCserve D2D) совместно с решением традиционного резервного копирования файлов (CA ARCserve Backup). При этом используется общий каталог резервных копий, чтобы ускорить и упростить процесс восстановления;
  • возможность централизованного управления процессами копирования и восстановления данных из единой консоли.

Для реализации специализированных задач используются дополнительные модули (CA ARCserve Central Reporting, CA ARCserve Replication , CA ARCserve High Availability), расширяющие функциональность CA ARCserve Backup.

Acronis

Компания Acronis предоставляет целую линейку программного обеспечения для организации резервного копирования и восстановления данных. Для домашнего использования предназначено приложение Acronis True Image , для малых предприятий используется Acronis Backup & Recovery Server for Windows, а для крупных предприятий - for Windows.

Наиболее функциональным является корпоративный продукт Acronis Backup & Recovery Advanced Server , позволяющий выполнять большое количество функций:

  • файловое резервное копирование и резервное копирование на основе образа. Можно создавать образ всего диска с операционной системой для последующего восстановления на этот же или аналогичный компьютер;
  • дублирование резервных копий в несколько хранилищ (например, локальное и сетевое);
  • поиск в хранилище и выборочное восстановление файлов;
  • дедупликация (отдельный модуль) позволяет не копировать повторяющиеся данные. Причем поиск копий производится не только на компьютере конкретного пользователя, а всех пользователей сети;
  • возможность восстановления рабочих станций и серверов на оборудовании, отличном от того, с которого была сделана резервная копия, или на виртуальную машину (отдельный модуль);
  • функции администрирования (удаленная установка, возможность включать компьютеры перед проведением резервного копирования, возможность выполнять команды до и после копирования; определение нагрузки на диск и сеть в процессе копирования и т.д.);
  • централизованное управление созданием резервных копий;
  • использование хранилища в «облаке» (отдельный модуль).

Наличие такого набора функций дает возможность продуктам компании Acronis быть реальным конкурентом продуктам мировых лидеров в данной области. Предоставляемый функционал позволяет продуктам Acronis претендовать на все сегменты рынка.

Paragon

Еще одна российская компания, выпускающая системы резервного копирования и восстановления данных. В ее портфеле целый ряд продуктов для резервного копирования и обслуживания жестких дисков – Paragon Hard Disk Manager 12 Suite, Professional, Business, Premium editions (для персональных пользователей и SMB); Paragon Protect and Restore 3 (для крупных компаний); Drive Backup 11 Workstation; Drive Backup 11 Server и т.д. На весну 2014 года на российском рынке анонсируется выпуск Paragon Hard Disk Manager 14, который уже продается на западе.

При помощи данных продуктов можно организовывать полнофункциональный процесс резервного копирования и восстановления данных. Для быстрой миграции или восстановления системы после сбоя используются образы системы. Причем их можно ставить и на компьютеры, аппаратное обеспечение которых отличается от исходного компьютера. Реализованы различные схемы копирования – инкрементное и дифференцированное, позволяющие сокращать объемы копируемых данных. Используется гранулярное восстановление данных и мощный набор фильтров, позволяющий настраивать автоматическое восстановление данных. Поддерживается работа как с реальными, так и виртуальными устройствами. Однако полноценная дедупликация отсутствует. Централизованное управление резервным копированием возможно после установки дополнительного приложения Paragon Remote Management .

Большинство продуктов компании Paragon рассчитаны на персональных пользователей и маленькие и средние компании. Однако последние продукты компании, такие как Hard Disk Manager 12 Premium, выходят за рамки SMB и предоставляет дополнительные инструменты для работы в крупных компаниях.

Перечисленными решениями полностью не ограничивается рынок систем резервного копирования и восстановления данных в России. Есть менее распространенные продукты, например, Handy Backup Server Network (компания «Новософт») или BakBone NetVault . Однако их представленность на российском рынке мала или не поддается точной оценке, поэтому они и не попали в список рассматриваемых нами решений.

В наш обзор не вошли бесплатные системы для резервного копирования и восстановления данных, т.к., не имея данных об объемах продаж сложно оценить их присутствие на рынке. Из наиболее популярных бесплатных программ для резервного копирования на российском рынке отметим приложение Clonezilla . Оно позволяет создавать образы системы или копии данных на локальном или удалённом компьютере. Корпоративная версия Clonezilla Server позволяет управлять резервным копированием в локальной сети компании.

Выводы

Системы резервного копирования и восстановления данных являются необходимым элементом безопасности любых рабочих мест – как личных, так и корпоративных. Сегодняшний уровень этого класса решений позволяет сделать процесс резервного копирования быстрым и удобным для пользователей. Внимание также уделяется не только быстроте создания резервных копий, но и скорости их восстановления. При использовании специализированных алгоритмов время восстановления данных существенно уменьшается. Используемые для этого алгоритмы позволяют существенно сокращать время восстановления данных. Представленные на рынке системы постоянно развиваются и включают в себя новые технологии работы с данными. Так многие системы предлагают возможность хранить данные в облаке, использовать виртуальные машины, позволяют работать с новыми типами протоколов и устройств хранения данных. Это говорит о взаимном интересе производителей и потребителей данного класса решений. Стоит отметить, что в будущем системы резервного копирования и восстановления будут все теснее интегрироваться с решениями по хранению резервных копий и решениями для организации совместного доступа и удаленной работы с данными в «облаке».

Рынок систем резервного копирования и восстановления данных достаточно зрел. На мировом уровне уже достаточно давно сложился набор лидеров в данной области, которые год от года стремятся поддерживать высокий уровень своих решений. Это компании EMC, CommVault, Symantec, IBM, HP, Quantum, NetApp, CA Technologies. На российском рынке представлены продукты всех указанных лидеров. Спецификой рынка является присутствие российских игроков – Acronis и Paragon, продукты которых занимают свои ниши и востребованы на рынке.

В наших будущих публикациях мы планируем рассмотреть рынок систем облачного резервного копирования и восстановления данных.

Книга предназначена для читателей, хорошо знакомых с компьютерными системами и индустрией информационных технологий и желающих расширить познания в области систем хранения данных и архитектуры Windows NT, непосредственно связанной с подобными системами. В книге описываются корпоративные системы хранения данных, в то время как системам потребительского уровня уделяется меньше внимания. В этом издании сделана попытка поддержать интересы специалистов по программному обеспечению, мало знакомых с технологиями хранения данных, и профессионалов в области систем хранения данных, которые стремятся получить дополнительные знания по архитектуре обработки и хранения данных в Windows NT. В то же время книга будет интересна всем читателям, намеревающимся получить исчерпывающие сведения по описанной теме.

Книга:

Разделы на этой странице:

Существуют различные схемы резервного копирования, которые применяются, например, в центре хранения данных. Стоит отметить, что различные категории резервного копирования могут использоваться совместно. Резервное копирование классифицируется следующим образом:

на базе архитектуры;

на основе функциональных возможностей;

на базе сетевой инфраструктуры.

Рассмотрим каждый тип классификации подробнее.

5.3.1 Классификация резервного копирования на базе архитектуры

Один из типов классификации резервного копирования основан на архитектуре. Резервное копирование зависит от объектов, к которым оно применяется, и от того, насколько приложение резервного копирования поддерживает подобные объекты. Доступные архитектурные типы резервного копирования описаны в разделах 5.3.1.1–5.3.1.3.

5.3.1.1 Резервное копирование на уровне дисковых образов и логических блоков

В этом случае приложение резервного копирования работает с блоками данных. Обычно подобная схема резервного копирования требует прекращения доступа к копируемым данным со стороны всех приложений на сервере. Приложение получает доступ к жесткому диску независимо от его внутренней структуры, после чего выполняет операции чтения/записи на уровне логических блоков.>

Преимущество такого типа резервного копирования состоит в быстродействии операций резервного копирования и восстановления данных, что особенно важно для восстановления данных после критических сбоев в работе систем. Недостаток заключается в том, что существует запрет на доступ к диску со стороны приложений и даже операционной системы. Еще один недостаток – это копирование излишнего количества неиспользуемых логических блоков с резервной копии при резервировании диска с разрешенными файлами. Некоторые приложения резервного копирования предоставляют соответствующую программную логику, необходимую для обнаружения и пропуска неиспользованных логических блоков. Такие резервные копии называются разреженными копиями дискового образа.

Наконец, довольно сложно получить только определенный файл или несколько файлов, в отличйе от восстановления всех данных на диске. Для этого программное обеспечение резервного копирования должно обработать метаданные файловой системы, сохраненные на магнитной ленте, и вычислить расположение на ленте необходимого файла. Некоторые программы позволяют восстанавливать определенные файлы из резервной копии на уровне образа, однако лишь для некоторых операционных систем. Другие приложения пытаются оптимизировать восстановление файла из резервной копии уровня образа, записывая на ленту метаданные файла, например таблицу расположения файлов для файловой системы FAT16.

Версия NTFS, которая поставляется вместе с Windows 2000, уже содержит все метаданные в файлах, например битовую карту, которая соответствует расположению логических блоков. Программа восстановления данных находит необходимые метаданные, из которых рассчитывает расположение на магнитной ленте каждого необходимого логического блока требующегося файла. После этого лента прокручивается, в одном направлении и все необходимые участки считываются в процессе перемотки, что позволяет получить все данные для восстановления файла. Лента не перематывается в обоих направлениях, поэтому сокращается не только время восстановления, но и срок жизни ленты. К описываемым приложениям резервного копирования относится, например, программа Legato Celestra.

Обратите внимание, что иногда выбор метода резервного копирования ограничен. Если база данных использует чистый дисковый том без файловой системы, то выбирать приходится только между резервной копией на уровне образа и резервной копией на уровне приложения (такой тип резервного копирования рассматривается в разделе 5.3.1.3).

5.3.1.2 Резервное копирование на уровне файлов

В этом типе резервного копирования программа резервирования пользуется услугами операционной и файловой систем. Одно из преимуществ заключается в эффективности восстановления конкретного файла или набора файлов. Еще одно преимущество состоит в возможности одновременного доступа к файлам со стороны операционной системы и приложений, когда проводится резервное копирование.

Не обошлось здесь, впрочем, и без недостатков. Резервное копирование выполняется дольше, особенно по сравнению с резервным копированием на уровне образа. Если проводится копирование большого количества небольших файлов, нагрузка на операционную и файловую систему при доступе к метаданным каталогов может оказаться значительной. Кроме того, существует проблема открытых файлов, которая, была описана ранее.

Еще один недостаток связан с безопасностью. Эта проблема возникает вне зависимости от метода создания резервной копии (на уровне образа или файла) и заключается в том, что резервное копирование выполняется на правах учетной записи администратора или оператора резервного копирования, а не пользователя. Это единственный способ восстановить файлы различных пользователей в ходе одной операции восстановления. Необходимым условием является корректная настройка метаданных файлов, например списков управления доступом и данных о владельцах файлов. Решение проблемы требует поддержки со стороны API файловой и операционной систем, что необходимо для настройки метаданных при восстановлении данных из резервной копии. Кроме того, приложение резервного копирования и восстановления должно корректно использовать предоставленные возможности.

5.3.1.3 Резервное копирование на уровне приложения

В этом случае резервное копирование и восстановление данных выполняется на уровне приложения, например Microsoft SQL Server или Microsoft Exchange.. Резервное копирование проводится с помощью API, предоставленного приложением. В данном случае резервная копия состоит из набора файлов и объектов, которые формируют состояние системы на определенный момент времени. Основная проблема заключается в том, что операции резервного копирования и восстановления тесно связаны с приложением. Если с выходом нового приложения изменится API или функции уже существующего API, администратору придется переходить к новой версии программы резервирования.

Приложения используют чистый диск без файловой системы или записывают на него огромный файл, в котором размещены собственные метаданные приложения. В качестве примера подобного приложения можно указать Microsoft Exchange. В Windows ХР и Windows Server 2003 поддерживаются важные функции NTFS, благодаря которым возможно восстановление таких файлов. Файл восстанавливаемся логическими блоками и в конце маркируется новой функцией Win32 API, которая называется SetFileValidData.

5.3.2 Классификация резервного копирования на базе функциональных возможностей

Еще один метод классификации приложений резервного копирования заключается в классификация на базе функций, предоставляемых в процессе резервного копирования. Обратите внимание, что обычно в центрах хранения данных используется, как минимум, два, а чаще всего все типы резервирования, описанные ниже, а именно: полное, дифференциальное и инкрементное.

5.3.2.1 Полное резервное копирование

При полном резервном копировании (full backup) полный набор файлов или объектов, а также связанные с ними метаданные копируются на носитель резервной копии. Преимущество состоит в том, что используется только один набор носителей для восстановления в случае отказа в работе системы. Недостаток заключается во времени копирования, так как копируются все данные. Полное резервное копирование часто выполняется на уровне дискового образа или на уровне блоков.

5.3.2.2 Дифференциальное резервное копирование

При дифференциальном резервном копировании (differential backup) архивируются все изменения, которые произошли с момента последнего полного резервного копирования. Так как дифференциальные резервные копии могут создаваться на уровне образа или на уровне файлов, этот набор изменений будет представлять собой набор изменившихся дисковых блоков (для резервной копии на уровне образа) или набор изменившихся файлов (для резервной копии на уровне файлов). Основное преимущество дифференциального резервного копирования состоит в значительном уменьшении времени копирования по сравнению с полным резервным копированием. С другой стороны, восстановление после сбоя занимает больше времени. Восстановление после сбоя потребует проведения двух операций по восстановлению данных. В ходе первой будут восстанавливаться данные из полной резервной копии, а во время второй – данные из дифференциальной резервной копии.

При использовании недорогих подсистем хранения данных дифференциальное резервное копирование на уровне файлов применяется в тех случаях, когда приложения создают множество небольших файлов и после создания полной резервной копии меняют некоторые файлы. В то же время такое резервное копирование не применяется, если жесткий диск используется приложениями управления базами данных, которые постоянно вносят небольшие изменения в огромные файлы баз данных. Таким образом, при резервировании на уровне файла будет создана копия целого файла. Примером такой программы служит Microsoft Exchange, которая постоянно стремится вносить небольшие изменения в огромные файлы баз данных.

При использовании старших моделей подсистем хранения данных дифференциальное резервное копирование на уровне образа можно использовать в любой ситуации, включая резервное копирование файлов приложений баз данных. Причина такой эффективности состоит в хранении большого объема метаданных, которые позволяют быстро определить изменившиеся с момента резервного копирования дисковые блоки. Таким образом, будет проведено резервное копирование только изменившихся дисковых блоков, а большое количество не изменившихся дисковых блоков не будут скопированы. Даже несмотря на более высокую эффективность резервного копирования при использовании старших моделей подсистем хранения данных, остается необходимость в использовании API, который позволит начать резервирование в определенный момент времени и продолжить ввод-вывод данных после завершения резервного копирования. Метод работы старшей модели подсистемы хранения заключается в сокращении операций ввода-вывода данных, которые должны быть остановлены при резервном копировании.

5.3.2.3 Инкрементное резервное копирование

При инкрементном резервном копировании (incremental backup) архивируются только изменения с момента последнего полного или дифференциального резервного копирования. Очевидно, что этот вид резервного копирования требует меньше времени, так как на резервный носитель не копируются файлы, которые не изменились с момента создания последней полной или добавочной резервной копии. Недостатком этого метода является длительность операции восстановления после сбоя, так как оно выполняется с помощью набора из нескольких носителей, соответствующих последней полной резервной копии и нескольким добавочным резервным копиям.

В случае отсутствия старших моделей подсистемы хранения добавочное резервное копирование выполняется при изменении или добавлении различных наборов файлов. При использовании старших моделей подсистемы хранения может применяться добавочное резервное копирование на основе блоков, так как в этом случае доступен достаточный объем метаданных для идентификации изменившихся блоков.

5.3.3 Классификация резервного копирования на основе сетевой инфраструктуры

Один из способов классификации резервного копирования основан на сетевой топологии и ее влиянии на выбор наилучшего метода резервирования подключенных узлов. Типы резервного копирования, зависящие от сетевой инфраструктуры (резервирование DAS, NAS, SAN, не зависящее от локальной сети и от сервера) рассматриваются в разделах 5.3.3.1–5.3.3.4.

5.3.3.1 Резервирование DAS

Эта старейшая разновидность резервного копирования возникла- во времена, когда устройства хранения подключались непосредственно к серверу. Несмотря на развитие сетевых устройств хранения, резервирование DAS остается достаточно популярным для копирования данных, размещенных на серверах Windows. Схема резервирования DAS представлена на рис. 5.3. / Преимуществом резервирования DAS является простота его использования. Приложение на сервере считывает данные с соответствующего дйсково- го тома и записывает их на магнитную ленту. Однако резервирование DAS имеет ряд недостатков.

Использование нескольких накопителей на магнитной ленте (по одному на каждый сервер, нуждающийся в резервном копировании), что требует существенных финансовых затрат. Другими словами, совместное использование одного накопителя несколькими серверами практически невозможно.

Высокая общая стоимость владения (ТСО), так как для резервного копирования с помощью нескольких накопителей на магнитной ленте требуется иметь в штате несколько администраторов.

Хранение нескольких лент может привести к путанице.

Поскольку данные на нескольких серверах часто дублируются, но не синхронизированы, одинаковые данные переносятся и на ленту, поэтому хранение похожих данных на нескольких лентах может привести к путанице.

Рис. 5.3. Резервирование DAS

Наконец, но не в последнюю очередь, сервер должен обрабатывать запросы чтения/записи данных между диском и накопителем на магнитной ленте.

5.3.3.2 Резервирование NAS

Как отмечалось в главе 3, эра хранилищ DAS закончилась с появлением систем типа клиент/сервер, когда клиенты и серверы стали совместно использовать ресурсы локальной сети. Это позволило сформировать архитектуру, в которой к накопителю на магнитной ленте, подключенному к серверу, получают доступ несколько сетевых серверов.

На рис. 5.4 показан типичный сценарий резервирования NAS. В левой области диаграммы указано несколько серверов. Это могут быть серверы приложений или файловые серверы и серверы печати. В правой области находится сервер резервного копирования и подключенный к нему накопитель на магнитной ленте. Этот накопитель может использоваться для резервного копирования информации с нескольких серверов приложений, файловых серверов и серверов печати. Таким образом, резервирование NAS позволяет совместно использовать накопитель на магнитной ленте для резервного копирования данных нескольких серверов, что приводит к снижению общих затрат.

Резервированию NAS свойственны некоторые недостатки.

Операция резервного копирования отражается на пропускной способности локальной сети, что зачастую требует сегментации LAN для перенаправления потоков резервного копирования в отдельный сетевой сегмент.

Время работы узлов увеличивается. Другими словами, возрастает время, в течение которого серверы должны быть доступны для обслуживания пользовательских запросов и транзакций. Кроме того, увеличивается объем данных, хранящихся на сервере, что требует большего времени на резервирование этих данных.

Рис. 5.4. Схема резервирования NAS

Учитывая актуальность описанных проблем, обеспечение эффективности резервного копирования становится единственным критерием при проектировании сетей и определении точного количества необходимых устройств резервирования.

5.3.3.3 Резервирование SAN

Развитие сетей хранения данных привело к появлению новых концепций резервного копирования. Новые возможности основаны та том, что сеть хранения данных может обеспечить достаточную пропускную способность между любыми двумя устройствами и, в зависимости от топологии, способна предоставить одновременную связь с малыми задержками между несколькими парами устройств. С другой стороны, использование топологии кольца Fibre Channel с количеством устройств больше 30 не дает возможности создавать несколько соединений с высокой пропускной способностью и малыми задержками, так как общая пропускная способность кольца будет совместно разделена между всеми подключенными устройствами.

На рис. 5.5 представлена архитектура типичного приложения SAN для резервного копирования. Обратите внимание на мост Fibre Channel. Большинство накопителей на магнитной ленте не поддерживают интерфейс Fibre Channel (они используют параллельный интерфейс SCSI), поэтому для подключения таких устройств понадобится мост. На рис. 5.5 серверы Windows NT подключены одновременно к локальной сети и к сети хранения данных.

Топология резервного копирования (см. рис. 5.5) имеет ряд преимуществ.

Накопитель на магнитной ленте может находиться довольно далеко от сервера, данные которого резервируются. Такие накопители обычно оснащены интерфейсом SCSI, хотя в последнее время всё чаще появляются накопители с интерфейсом Fibre Channel. Это означает, что их можно подключать только к одной шине SCSI, в результате чего усложняется совместное использование накопителя несколькими серверами. Сети хранения данных на основе Fibre Channel благодаря поддержке различных устройств позволяют успешно решать проблемы совместного использования. Обратите внимание: при этом все равно требуется метод, обеспечивающий корректный доступ к накопителю на магнитной ленте с использованием соответствующих разрешений. Примеры подобных методов представлены ниже.

Рис. 5.5. Резервное копирование средствами сети хр&нения данных

Метод зонирования позволяет в определенный момент времени получить доступ к накопителю на магнитной ленте одному серверу. Проблема заключается в обеспечении соответствия серверов требованиям зонирования. Кроме того, необходимо обеспечить корректное использование сменщика лент или накопителя с поддержкой нескольких кассет.

Следующий метод – использование таких команд интерфейса SCSI, как Reserve и Release.

Метод подключения накопителя на магнитной ленте к серверу позволяет получить совместный доступ к устройству посредством специального программного обеспечения сервера. Совместное использование накопителя на магнитной ленте является весьма привлекательным решением, поскольку накопители – довольно дорогие устройства. К описанным накопителям относится, например, устройство Tivoli от компании IBM.

Технология резервного копирования без локальной сети получила свое название потому, что передача данных выполняется за пределами локальной сети средствами SAN. Это снижает нагрузку на локальную сеть, благодаря чему приложения не страдают от снижения пропускной способности сети при резервировании данных.

Резервное копирование без локальной сети позволяет более эффективно использовать ресурсы с помощью совместного использования накопителей на магнитной ленте.

Резервное копирование и восстановление данных без локальной сети более устойчиво к ошибкам, поскольку резервирование может проводиться несколькими устройствами одновременно, если одно устройство отказало в работе. Аналогичным образом несколько устройств могут использоваться при восстановлении данных, что позволяет эффективнее планировать использование ресурсов.

Наконец, операции резервного копирования и восстановления завершаются значительно быстрее, так как сети хранения данных обеспечивают более высокую скорость передачи данных.

5.3.3.4 Резервирование, не зависящее от сервера

Такое резервное копирование иногда называют резервным копированием без сервера или даже сторонним копированием. Обратите внимание, что резервное копирование, не зависящее от сервера, обычно представляет собой резервирование, не зависящее от локальной сети, что избавляет от необходимости перемещать данные с определенного узла. Идея такого способа резервного копирования состоит в применении команды SCSI Extended Copy.

В основе резервного копирования, не зависящего от сервера, лежит инициатива ассоциации SNIA, которая была реализована в командах SCSI Extended Сору, утвержденных комитетом INCITS, а точнее, техническим подкомитетом Т10 (документ ANSI INCITS.351:2001, SCSI Primary Commands-2). Обратите внимание: в стандарте SCSI уже описывалась поддержка команд копирования, однако ранее для использования команд требовалось подключение всех устройств SCSI к одной шине (с тех пор команда Сору считается устаревшей; более подробная информация представлена на Web-узле http: //www.110. org). Команда Extended Copy добавляет такие дополнительные возможности, как использование источника и пункта назначения данных через различные шины SCSI. При этом в полной мере сохраняется адресация, поддерживаемая синтаксисом команды.

В резервном копировании, не зависящем от сервера, сервер резервирования может обрабатывать другие запросы, пока данные копируются с помощью агента перемещения данных. Данные переносятся непосредственно от источника данных в точку назначения, а именно в резервный носитель (вместо копирования из источника на сервер резервного копирования с последующим переносом на резервный носитель).

Рис. 5.6. Резервное копирование, не зависящее от сервера

Осознавая преимущества резервного копирования, не зависящего от сервера, не следует забывать, что восстановление данных представляет собой совершенно другую проблему. Операции восстановления, не зависящие от сервера, остаются крайне редким явлением. Резервные копии, созданные с помощью этой технологии, очень часто восстанавливаются традиционными методами, в которых подразумевается использование сервера с неким программным обеспечением для резервного копирования и восстановления данных.

Принцип резервного копирования, не зависящего от сервера, демонстрируется на рис. 5.6. Для упрощения схемы на рисунке показано минимальное количество компонентов, необходимых для иллюстрации резервного копирования. На практике сети хранения данных имеют более сложную структуру. На рис. 5.6 показан сервер под управлением Windows, подключенный к коммутатору Fibre Channel с помощью адаптера шины Fibre Channel. Кроме того, используется маршрутизатор Fibre Channel-K-SCSI, к которому подключается накопитель на магнитной ленте с интерфейсом SCSI и дисковые устройства. Дисковые и ленточные устройства не обязательно должны подключаться к одному маршрутизатору.

Приложение сервера резервного копирования на сервере Windows находит агента перемещения данных на маршрутизаторе с помощью технологии Plug and Play. Приложение резервного копирования определяет дополнительную информацию о резервировании (идентификатор дискового устройства, начальный логический блок, объем копируемых данных и т.д.). Программное обеспечение сервера резервирования изначально передает последовательность команд накопителю на магнитной ленте для резервирования устройства и монтирования необходимого носителя. Далее программное обеспечение сервера резервного копирования передает команду Extended Сору агенту перемещения данных, который выполняется на маршрутизаторе. Агент координирует перенос необходимых данных. По завершении копирования агент возвращает сервисную информацию программе резервирования, выполняемой на сервере Windows.

В процессе резервного копирования, не зависящего от сервера, важную роль играют несколько компонентов, включая источник и точку назначения данных, агент перемещения и сервер резервного копирования.

Источник данных – это устройство, содержащее данные, для которых необходимо создать резервную копию. Обычно выполняется резервное копирование целого тома или дискового раздела. К источнику данных должен получать доступ непосредственно агент перемещения данных (о нем идет речь несколько ниже). Это означает, что устройства хранения, подключенные к серверу, не могут быть источниками данных для резервного копирования, не зависящего от сервера, так как прямая адресация вне сервера невозможна.

Точка назначения данных обычно представляет собой накопитель на магнитной ленте, на который записываются данные. В качестве устройства может выступать диск, если резервное копирование выполняется на диск, а не на ленту. Ленточные устройства обычно подключены к порту связной архитектуры, чтобы избежать повреждения данных, передаваемых на ленту, в случае отказа других частей сети хранения данных. Например, если накопитель на магнитной ленте подключен к кольцу Fibre Channel с разделением доступа, ошибка в работе другого устройства или подключение/отключение устройства от кольца может привести к остановке записи данных и повторной инициализации кольца, что нарушит целостность данных, записываемых на ленту.

Агент перемещения данных обычно встраивается в маршрутизатор с помощью прошивки, так как он должен обрабатывать команду SCSI Extended Сору, которая отправляется маршрутизатору в виде пакета Fibre Channel. Коммутаторы и концентраторы, обрабатывающие только заголовок кадра Fibre Channel, не совсем подходят для поддержки работы агента перемещения данных, однако в будущем это может измениться.

Агент перемещения данных активизируется после получения инструкций от сервера резервного копирования. Большинство накопителей на магнитной ленте, подключенных к SAN, представляют собой устройства SCSI. Поэтому требуется наличие маршрутизатора, который поддерживает преобразование пакетов между интерфейсами Fibre Channel и SCSI. На данный момент все чаще появляются накопители на магнитной ленте с интерфейсом Fibre Channel, а некоторые компании, например Exabyte, предоставляют прошивки для подобных накопителей, добавляющие функции агента перемещения данных. Кроме того, базовые библиотеки накопителей на магнитной ленте с интерфейсом Fibre Channel обычно имеют встроенные маршрутизаторы Fibre Channel-SCSI, что позволяет библиотеке использовать собственный агент перемещения данных. Обратите внимание, что агент может быть реализован в программном обеспечении младшей рабочей станции или даже сервера. Компании Crossroads, Pathlight (теперь ADIC) и Chaparral предоставляют маршрутизаторы со встроенными в прошивку агентами перемещения данных. Сеть хранения данных может иметь несколько агентов от нескольких производителей, что не мешает агентам сосуществовать в одной сети.

Конечно, для того чтобы агент перемещения данных можно было использовать, его нужно найти (с помощью команды SCSI Report LUNs) и обеспечить должную адресацию (посредством имени WWN) с сервера резервного копирования. Кроме того, агент может проводить два резервных копирования одновременно. Например, один сеанс копирования может проводиться на географически удаленный зеркальный ресурс, однако для этого сервер резервирования должен передать две команды.

Сервер резервного копирования отвечает за все команды и управление операциями. Перечислим еще раз все основные обязанности сервера резервирования.

Программное обеспечение сервера обеспечивает доступность накопителя на магнитной ленте, применяя соответствующие команды SCSI Reserve и Release.

Монтирование носителя для резервного копирования.

Определение точного адреса источника данных и размещения данных в логических блоках, а также объема данных для резервирования.

Получив всю необходимую информацию, сервер отправляет команду Extended Сору агенту перемещения данных. Затем агент отправляет последовательность команд Read источнику данных и записывает информацию в точке назначения.

Компании Computer Associates, CommVault, LEGATO и VERITAS предоставляют программы для резервирования, не зависящего от сервера. Поставщики маршрутизаторов с функциями резервного копирования, не зависящего от сервера, постоянно сотрудничают с компаниями – разработчиками программного обеспечения, чтобы сделать возможной совместимость своих продуктов. Дело в том, что для поддержки базовых команд SCSI Extended Copy производителями применяются различные команды.

Обратите внимание: несмотря на достаточно зрелый возраст технологии резервирования, не зависящей от сервера, поддержка восстановления, не зависящего от сервера, со стороны производителей крайне ограниченна.

5.3.3.5 Семейство операционных систем Windows Server и резервное копирование, не зависящее от сервера

В многочисленных рекламных материалах и маркетинговой литературе утверждается, что конкретный метод внедрения технологии резервного копирования, не зависящего от"сервера, совместим с Windows 2000. Рассмотрим эту концепцию более подробно. Далее описывается каждый из четырех компонентов, формирующих резервирование, не зависящее от сервера: источник данных, точка назначения данных, программное обеспечение сервера резервирования и агент перемещения данных.

В большинстве случаев агент перемещения данных, работающий вне сервера Windows NT, не может адресовать данные, хранящиеся на сервере Windows NT. Адаптеры шины, подключенные к серверу Windows NT, обычно работают, как инициаторы и не отвечают на команды Report LUNs. Если сервер Windows NT использует устройство хранения за пределами сервера, например массив RAID, подключенный к коммутатору Fibre Channel, то это устройство будет доступно агенту перемещения. Поэтому вместо утверждений о том, что устройство хранения, используемое Windows NT, не может быть источником данных для резервирования, не зависящего от сервера, следует уточнить, что источником данных не может быть устройство хранения, которое является внутренним для сервера Windows NT.

Использование внутреннего хранилища Windows NT в качестве точки назначения данных также невозможно, так как точка назначения тоже должна быть доступна агенту перемещения данных для адресаций.

Выполнение программы резервирования на компьютере под управлением Windows представляет собой неплохой вариант. Адаптер шины, подключенный к серверу Windows, может выдать последовательность команд Report LUNs каждому устройству (LUN 0), которое будет обнаружено. Затем программа резервирования просматривает все видимые устройства и логические единицы, после чего выясняет, какие из них могут выступать в роли агента стороннего копирования. Некоторые программы сообщают о дополнительных LUN, которые необходимы при выдаче команд Extended Сору. Множество программ резервирования, которые используют дополнительные LUN, проходят через процесс обнаружения устройств для проверки функций агента перемещения данных.

Промежуточный интерфейс SCSI (IOCTL) в Windows NT может использоваться для передачи команды Extended Сору агенту перемещения данных (команда передается с сервера резервного копирования под управлением Windows NT). Операционная система Windows NT не имеет встроенной поддержки агентов перемещения; технология Plug dnd Play позволяет обнаружить агент, но для регистрации последнего в системном реестре необходимы дополнительные драйверы.

Остается последний вопрос: можно ли запустить программное обеспечение агента перемещения данных на сервере или рабочей станции под управлением Windows NT? Одним из преимуществ такого решения является то, что агент перемещения сможет адресовать устройства хранения, «видимые» для сервера Windows, а также получать к ним доступ. Но сервер резервного копирования, размещенный вне Windows NT, не сможет обнаружить устройства хранения, подключенные к компьютеру с агентом перемещения данных. Агент должен иметь возможность работать в качестве инициатора и целевого устройства для команд SCSI. Поскольку адаптер шины, подключенный к компьютеру под управлением Windows NT, редко выполняет роль целевого устройства, команда Extended Сору может не дойти до агента перемещения данных.

Обратите внимание: в Windows NT для выдачи команд SCSI приложения используют промежуточный интерфейс (DeviceloControl с параметром IoControlCode, равным IOCTOL_SCSI_PASS__THROUGH или IOCTL_SCSI_PASS_ THROUGH_DIRECT).