3602 АДМИНИСТРИРОВАНИЕ СЛУЖБ БЕЗОПАСНОСТИ ИНФОРМАЦИОННЫХ СИСТЕМ

Лабораторная работа № 1

Архивирование и восстановление данных

 

ЦЕЛЬ РАБОТЫ

Изучение основных методов резервного копирования и восстановления информации. Освоение практических навыков администрирования при аварийно-восстановительных работах в информационных системах.

 

ТЕОРЕТИЧЕСКАЯ ЧАСТЬ

Архивирование и его виды

Архивирование данных производится по двум основным причинам: для промежуточного сохранения записей и для сохранения файлов, необходимых при восстановлении системы после сбоя. Сохранение файлов, в зависимости от их назначения, имеет особенности. Все файлы можно разделить на системные и файлы данных. Системные файлы – это файлы, которые не изменяются в процессе работы информационной системы или изменяются, если изменяются версии приложений или операционных систем. Они могут архивироваться достаточно редко. Файлы данных, как правило, изменяются достаточно часто. К ним относятся файлы, созданные в текстовых редакторах, файлы баз данных, файлы электронных таблиц, файлы конфигурации (системный реестр, базы данных DHCP, DNS) и т.д. Указанные файла требуют более частого архивирования.

В процессе работы компьютерные информационные системы подвержены многим опасностям. Компьютерная сеть организации может пострадать в результате диверсии, выполненной сторонними лицами или внутренними служащими, кражи оборудования и носителей информации, техногенных и стихийных катастроф. Аварии могут быть вызваны как преднамеренными действиями злоумышленников на физическом и программном уровне (вирусными атаками, провоцированием отказа служб), так и неправильным использованием привилегий и необдуманными поступками пользователей. Следствием последнего являются случайно удаленные файлы, поврежденные базы данных, удаленные папки программы электронной почты и т.д. Результатом аварий в компьютерных информационных системах является частичная или полная потеря данных.

Основным методом воссоздания потерянной информации является ее предварительное резервное копирование с последующим восстановлением из резервных копий. Резервное копирование (архивирование) и восстановление являются одними из главных задач администратора информационных систем.

Перед тем как использовать процедуру архивирования, администратору необходимо знать, как осуществляется копирование данных, и мысленно построить наиболее простую стратегию ее проведения. В процессе построения стратегии прежде всего следует:

-       выяснить, в течение какого интервала времени файл представляет ценность для аварийного восстановления, после которого его следует архивировать только для сохранения записей;

-       определить интервал времени, в течение которого сохраненная информация имеет ценность для предприятия;

-       разделить файлы на системные и файлы данных и разработать для них соответствующие алгоритмы архивирования.

При архивировании, как правило, создаются две копии (иногда более) -рабочая и резервная. Резервная копия – это точная копия файла (включая документацию), которая хранится на определенном носителе (обычно в сжатом виде) и располагается в безопасном месте на тот случай, если рабочая копия будет испорчена. Набор резервных копий – это резервный носитель (ленты или диски), содержащий копии всех файлов, которые получены во время архивирования. В качестве имени архива по умолчанию используются имя набора резервных копий и проставленная на нем дата. Можно также называть этот набор в соответствии с принятой администратором схемой сохранения или режимом. Во время будущих операций архивирования можно как дополнять набор резервных копий, так и заменять или переписывать имеющиеся в нем файлы.

К каждому носителю с резервными копиями должна прилагаться сопровождающая документация (“история”). Она формируется в процессе выполнения архивирования. Без данных “истории” средства восстановления не смогут обнаружить необходимые для восстановления файлы, и резервная копия будет бесполезной. Обычно сопровождающая информация записывается в форме меток или идентификационных данных, которые размещаются на самом носителе, его футляре, в таблицах и печатных каталогах, называемых каталогами резервных копий. Если набор резервных копий содержит несколько носителей, то каталог хранится на последнем носителе из набора в конце резервной копии. Этот каталог загружается первым в процессе процедуры восстановления.

Существует несколько типов архивирования, применение которых определяется тем, что копируется и как часто это производится.

1.  “Архивное” архивирование. При данном архивировании в файлах заголовка, метках и записях указывается состояние бита архива, устанавливаемое в процессе копирования данных. Бит архива – это флаг, отражающий факт изменения данных. Состояние этого бита – “включен” (логическая 1) или “выключен” (логический 0) – указывает программам архивирования, что со времени последней такой операции файл соответственно был или не был изменен.

2.  Копирующее архивирование. Это выполняемое “по случаю” копирование, при котором игнорируется состояние бита архива. Кроме того, после выполнения копирования бит архива не устанавливается. Такой вид архивирования полезен для быстрого получения копий в промежутках между процессами аварийно-восстановительных работ.

3.  Ежедневное архивирование. Это простое архивирование файлов в тот же день, когда они были изменены. Такое архивирование возможно, когда объем изменяемых за день файлов невелик.

4.  Стандартное архивирование. Это полное архивирование всех файлов, которое выполняется периодически. Полным называется архивирование, выполняемое в циклах по поддержанию готовности к аварийно-восстановительным работам. Во время полного архивирования копируются все файлы, а затем устанавливается бит архива, чтобы показать, что получены резервные копии файлов. Копирование и формируемая в его процессе сопровождающая документация – единственные средства, позволяющие выполнить последующие операции добавочного или разностного архивирования.

5.  Добавочное (дифференцированное) архивирование. Это архивирование всех файлов, которые были изменены со времени последнего полного или добавочного архивирования. При этом также устанавливается бит архива, который указывает на то, что выполнено архивирование данных. При применении схемы последовательного сохранения нескольких добавочных резервных копий для полного восстановления данных требуется использование всех носителей, на которых размещены последняя полная и все добавочные резервные копии.

6.  Разностное архивирование. Работает точно так же, как и добавочное архивирование, за исключением того, что с архивным битом ничего не делается. Другими словами, файлы, прошедшие архивирование, не отмечаются.

Восстановление данных

Восстановлением называется процедура, которая выполняется для перемещения на жесткие диски компьютера вместо потерянного или испорченного файла или набора файлов их работающей копии из архивных (резервных) данных.

Управление восстановлением – это важная часть процесса аварийно-восстановительных работ. От того, как поддерживается готовность к аварийно-восстановительным работам, будут зависеть время простоя системы и эффективность восстановления потерянного массива информации, полученного между последним архивированием и аварией.

При восстановлении используются следующие основные модели:

-         простое восстановление,

-         полное восстановление,

-          массовое восстановление.

В простой модели восстановления данные могут быть восстановлены только на момент последнего резервного копирования. Эта модель обеспечивает высокую эффективность выполнения массовых операций загрузки данных. Как следует из названия, простая модель копирования и восстановления наиболее легкая и удобная по сравнению с другими моделями. Максимально возможный объем данных, которые могут быть потеряны, определяется периодом времени между созданиями резервных копий.

В модели полного восстановления данные могут быть восстановлены в том виде, в котором она находилась вплоть до аварии. Модель поддерживает восстановление до контрольной точки, помеченной именованной транзакцией. Транзакция – это некоторое законченное, с точки зрения пользователя, действие в информационной системе. В модели полного восстановления массовые операции импорта протоколируются в журнал транзакций и, следовательно, могут быть полностью или частично восстановлены.

В модели массового восстановления операции импорта протоколируются в минимальном объеме. Это обеспечивает высокую производительность массовых операций загрузки, однако делает невозможным восстановление на любой заданный момент времени.

В зависимости от интервала времени, затрачиваемого на воссоздание информации, восстановление подразделяется на следующие виды.

1.  Восстановление в реальном времени (то есть сразу) или достаточно близко к нему. Данные, созданные не более чем несколько секунд назад, должны быть немедленно доступны пользователям и системам, даже если источник этих данных отключен. Это касается промышленных и медицинских систем, в которых задержка, определяемая восстановлением, допускается в течение долей и единиц секунд. Уровень времени в несколько секунд  называется уровнем критического восстановления.

2.  Если восстановление требуется в течение десяти минут, пока отключен первоначальный источник, то такое восстановление называется экстренным восстановлением.

3.  Когда на восстановление можно затратить один час, оно называется срочным восстановлением.

4.  Восстановление, требующее от одного до четырех часов, называется важным восстановлением.

5.  Все другие восстановления, которые выполняются за интервал времени, больший предыдущих, называются небрежными.

 

Выработка стратегии архивирования и восстановления

Архивирование не производится ежеминутно, поэтому полностью восстановить все данные на тот момент, когда произошла авария (если только авария не произошла сразу же после завершения архивирования), с помощью резервных копий невозможно. При восстановлении возможна потеря данных из-за того, что будут устанавливаться устаревшие данные из резервных копий. Необходимо решить, за какое время работы информационной системы потеря информации допустима. Затем, когда установлен этот допустимый уровень, необходимо отработать способы, которые позволят его поддерживать. Также необходимо определить, сколько такая поддержка будет стоить.

Так как при восстановлении будут использоваться устаревшие данные, необходимо определить срок их годности для восстановления. Существует следующий список сроков годности. Для восстановления можно использовать данные, созданные:

-         месяц назад или ранее,

-   от одной до четырех недель назад,

-         от четырех до семи дней назад,

-         один – три дня назад,

-         шесть – двенадцать часов назад,

-         от двух до пяти часов назад,

-         от одной до 60 минут назад.

Исходя из сроков годности данных, необходимо определить, какую из технологий архивирования можно использовать. Например, при сохранении на ленте последний уровень срока годности из-за низкой скорости копирования реализован быть не может.

При выработке стратегии восстановления необходимо оценить, насколько требуется немедленное восстановление данных (в реальном времени), и уточнить еще один фактор – возможны ли изъяны в резервных копиях. Это нужно принимать во внимание, если данные непрерывно меняются. Кроме того, файлы могут быть повреждены вирусами. Причем не только в работающей системе, но и в их резервной копии. Архивирование испорченных или зараженных вирусами файлов не обеспечивает достаточную сохранность информации. Гарантировать безопасность копий можно только с помощью предварительного тестирования их антивирусными программами высокой сложности или алгоритмов контроля качества данных.

Безопасность восстановления существенным образом зависит от требуемого времени восстановления. Чем быстрее реакция на запрос по восстановлению, тем выше шанс получить испорченные данные. Однако это не означает, что критические восстановления всегда рискованные, а восстановленные с их помощью данные – бракованные. Это означает другое. У данных, резервные копии которых получены ближе всего к моменту аварии, больше вероятность оказаться бракованными, чем у тех, что получены за несколько часов или дней до нештатной ситуации. Если авария произошла из-за порчи данных или вирусной инфекции, то вероятнее всего, что недавно резервированные данные также заражены.

Другим фактором, который следует учитывать, является то, что самые “чистые” резервные копии больше всего отличаются от данных, которые нужно восстанавливать, то есть они самые устаревшие.

При восстановлении данных необходимо руководствоваться следующим.

1.  Проверять, не вызовет ли восстановление данных их потерю, если файлы восстанавливаются на то же место, откуда их копировали. Например, если файл испорчен, но еще не устарел, а при восстановлении его заменяет файл, который не испорчен, но устарел, то потери могут быть большими. Лучше всего, прежде чем заменить испорченный файл, проверить возможность его исправления.

2.  Учитывать последствия восстановления. При восстановлении файла восстанавливается не только его содержимое, но также все атрибуты и вся информация, известная об этом файле на момент архивирования. Все новое, касающееся файла и его отношений с остальным миром, уже не будет отражено в восстановленном варианте. Примером является восстановление папки, к которой со времени последнего архивирования получило доступ несколько новых групп и пользователей. Восстановление заблокирует этих пользователей.

3.  Во время восстановления в то же место, откуда делалась резервная копия, доступ пользователей в это место следует заблокировать. Попытка пользователей открыть еще не полностью восстановленные файлы может привести к аварийному завершению восстановления.

4.  Перед проведением восстановления необходимо проверить, кто подсоединился к компьютеру, на котором оно производится, и какие файлы при этом открыты. Если при восстановлении будет осуществлена попытка замены восстанавливаемых файлов, система даст сообщение об ошибках доступа.

 

Особенности архивирования в SQL Server

Для уяснения принципов резервного копирования и восстановления информации в лабораторной работе используется программная оболочка (симулятор), имитирующая указанные процедуры для системы управления базами данных (СУБД) SQL Server 2000.

За логическую единицу работы и восстановления в СУБД принята транзакция. Транзакция представляет собой последовательный набор команд Transact-SQL (одна или несколько команд), образующих логически завершенный блок, который выполняется как единое целое. Независимо от количества команд в транзакции, либо все они будут выполнены, либо ни одна из них не выполнится. Если хотя бы одна из команд транзакции по какой-то причине не сможет выполниться, то происходит откат транзакции. При откате транзакции система восстанавливается в состояние, в котором она была до начала транзакции.

Большинство современных систем управления реляционными базами данных (БД) для обеспечения целостности данных используют журнал транзакций. Это гарантирует, что базы данных не будут содержать промежуточных или неопределенных значений. Журнал транзакций обеспечивает выполнение всех промежуточных модификаций, и только после того, как транзакция завершится, и целостность данных будет проверена, происходит фиксация изменений в самой базе данных.

Современные базы данных для повышения эффективности работы используют распределенное хранение информации. При этом база данных содержит совокупность файлов, размещенных на различных физических устройствах. В лабораторной работе рассматривается случай распределенной БД, в которой в качестве физических устройств хранения информации используются отдельные компьютеры (рабочие станции), на которых размещаются определенные файлы распределенной файловой системы.

Независимо от того, какой метод резервного копирования используется, в результате всегда получается единственный файл, который и является резервной копией. Файл резервной копии представляет собой обычный файл операционной системы, никак не зависящий от СУБД. При последующем восстановлении базы данных необходимо будет сослаться на соответствующий файл. Резервное копирование часто называют архивированием базы данных. Процесс архивирования предполагает сжатие исходных данных по специальным алгоритмам с целью уменьшения объема, который требуется для хранения данных. То есть файлы резервных копий имеют меньший размер, чем соответствующие файлы базы данных. Кроме того, файлы резервных копий можно дополнительно уплотнить обычными программами-архиваторами (такими, как ARJ, RAR или ZIP), при этом файл может уменьшиться еще в несколько раз.

ПРАКТИЧЕСКАЯ ЧАСТЬ

Описание оболочки эмулятора архиватора базы данных

В начале работы необходимо запустить файл "SQLServer2000Emu.exe". При этом на экране появится заставка симулятора Microsoft SQL Server 2000. При нажатии кнопки "Начать" высветится главное диалоговое окно. В верхней части окна расположено главное меню. Оно включает следующие пункты.

-         "Файл" - содержит пункты по работе с файлами (создание базы данных, изменение ее структуры посредством реализации транзакций, просмотр базы данных и устройств резервного копирования, ввод транзакций вручную при осуществлении восстановления до точки сбоя);

-         "Работа" - содержит пункты для создания устройства резервного копирования, выполнения резервного копирования и восстановления базы данных;

-         "Справка" - сведения о программе.