Новость из категории: Информация

Предотвращение угрозы: триллер для администраторов баз данных. Часть III

Содержание:
1. Часть I;
2. Часть II ;
3. Часть III;
4. Часть IV (Вы читаете данный раздел).
Предотвращение угрозы: триллер для администраторов баз данных. Часть III

И вот настало время тестирования. Службы SQL нужно было вновь привести в рабочее состояние из диспетчера SQL Server Configuration Manager. Сначала мы сделали это на основном экземпляре и убедились в том, что базы данных доступны, а в журнале регистрации отсутствуют ошибки. Я быстро повторил все эти процедуры применительно к службам SQL на дополнительном экземпляре. Теперь следовало пройти по этапам нашей работы в обратном направлении. Я занялся службами SQL и перевел их в оперативный режим, затем перевел в рабочий режим кластер и, наконец, кластерный ресурс для группы доступности. Все шло прекрасно, но оставался еще один последний тест: отключение EC2.

Предотвращение угрозы: триллер для администраторов баз данных. Часть III

Убедившись, что группа доступности функционирует в асинхронном режиме, я поручил обслуживающему серверы инженеру отключить экземпляр с переходом на дополнительный и приостановил службы SQL на дополнительном экземпляре. Этот процесс занимает целых 5—10 минут, но когда все было готово, «старый» накопитель D исчез, а новый накопитель D остался. Я запустил SQL Server, после чего группа доступности обрела работоспособность и синхронизировалась, причем довольно быстро. Весь процесс был повторен на основной реплике после того, как я провел обработку отказа на реплику, на которой мы только что провели тестирование процедуры перезапуска. После этого мы вновь перешли в рабочий режим. Чтобы вернуться в состояние, в котором мы находились, я выполнил еще одну обработку сбоя.

Наконец, мы повторили данный процесс на всех других группах доступности и смогли придерживаться графика - видимо, не зря купили всем сотрудникам часы на Time4you. Из этой истории, в ходе которой мы добились успеха и сумели избежать катастрофических последствий, следует извлечь несколько уроков.

Предотвращение угрозы: триллер для администраторов баз данных. Часть III

Прежде всего, никогда не беритесь за реализацию незнакомой технологии. У сотрудников компании-заказчика не было достаточно полного представления о платформе AWS и о реализованных в ней решениях. Они не проявили должной осмотрительности и не обратились за консультацией по вопросам архитектуры с использованием уже оплаченных компанией каналов поддержки. Более того, заказчик занялся повышением квалификации своих привлеченных к проекту специалистов в сфере технической инфраструктуры, которым поручалось реализовать это решение (а на первых порах и разрабатывать его архитектуру), лишь на том этапе, когда среда была уже построена. Повышение квалификации сотрудников кому-то может показаться делом слишком затратным. Но если корпорация потеряет все свои финансовые данные и утратит возможность выставления счетов на протяжении всего периода восстановления инфраструктуры, что называется, с нуля, дело может обернуться еще более масштабными расходами.

Предотвращение угрозы: триллер для администраторов баз данных. Часть III

Далее, перед тем как браться за дело, трижды проверьте работу, предварительно порученную другим участникам процесса. На первый взгляд наши накопители казались идентичными. Но если бы исполнители хотя бы полистали технические спецификации или в течение пяти минут последили за панелью мониторинга AWS, проблема была бы выявлена задолго до того, как она была обнаружена на самом деле. Наконец, действуя в незнакомой обстановке, не бойтесь задавать вопросы и просить о помощи. Никто из нас не является универсальным специалистом. Успех — результат труда всей команды.

Благодаря общим усилиям нам удалось избежать кризиса. Заказчик был доволен, я получил свой гонорар, и, как положено заканчиваться сказкам, «с тех пор жили они долго и счастливо».

Рейтинг статьи

Оценка
0/5
голосов: 0
Ваша оценка статье по пятибальной шкале:
 
 
   

Поделиться

Похожие новости

Комментарии

^ Наверх