Выйти из системы

Сменить пользователя

ИТ-отдел и бизнес: как достичь взаимопонимания? Примеры

Производство ценностей с каждым днем усложняется, а риски возрастают. Бизнес непрерывно адаптируется к новым потребностям рынка и условиям среды, внедряя новые технологии. На первое место встаёт необходимость защиты основного бизнес-процесса компании и обеспечения его непрерывности.

Такая задача должна одинаково трактоваться как ИТ-отделом, так и руководством. Иначе происходит разрыв коммуникации и возникают избыточные/недостаточные требования к обеспечению непрерывности бизнеса. Так, например, для бизнеса важно обеспечить непрерывность работы бизнес-приложений, доступ пользователей к сервисам и услугам. Для ИТ-отдела зачастую главным показателем непрерывности является обеспечение доступности и отказоустойчивости ИТ-инфраструктуры.

Рассмотрим, в чем разница.

𝐁𝐮𝐬𝐢𝐧𝐞𝐬𝐬 𝐜𝐨𝐧𝐭𝐢𝐧𝐮𝐢𝐭𝐲 (Непрерывность бизнеса ) — стратегическая и тактическая способность организации планировать свою работу в случае инцидента и нарушения ее деятельности, направленная на обеспечение непрерывности деловых операций на установленном приемлемом уровне. (ГОСТ Р ИСО 𝟐𝟐𝟑𝟎𝟏-𝟐𝟎𝟏𝟒).

Эта способность относится к бизнес-процессам, бизнес-функциям и деятельности предприятия в целом. Тут задействованы и элементы ИТ-инфраструктуры.

𝐀𝐯𝐚𝐢𝐥𝐚𝐛𝐢𝐥𝐢𝐭𝐲 (Доступность) — свойство быть доступным и готовым к использованию по запросу авторизованного субъекта. (ГОСТ Р ИСО/МЭК 𝟐𝟕𝟎𝟎𝟎 — 𝟐𝟎𝟏𝟐).

Это относится к серверным платформам, сетевой инфраструктуре, программным средствам и другим составным частям ИТ в компании. То есть, обеспечивает непрерывность бизнес-процессов. Рассмотрим это на конкретных примерах.

Пример №𝟏
Требования к непрерывности избыточны.
Сервер вышел из строя и стал причиной аварии сайта-лендинга для регистрации пользователей по промо-акции. Маркетинговый бюджет потрачен с меньшей эффективностью, но текущие клиенты и бизнес не пострадали, так как сервисы компании на других площадках продолжали работать.
Устранение нарушения в течение 𝟐𝟒 часов будет иметь несущественное влияние.

Пример №𝟐
Требования к непрерывности работы ИТ систем занижены.
— Принятые меры не соответствуют требованиям непрерывности бизнеса.
— Процессинговая компания
— Работает 𝟐𝟒 на 𝟕
— 𝟐 распределенных ЦОД
— Из-за ошибки администратора, в ходе работ на системе хранения данных (СХД) происходит авария.
— Останавливается работа 𝟏𝟓 баз данных, включая критичные для бизнеса.

В момент аварии выясняется:
— Бизнес готов к простою максимум 𝟏𝟓 минут
— Быстро восстановиться на резервном ЦОДе невозможно, так как текущее резервирование баз данных не обеспечивает нужного времени восстановления.

Есть 𝐁𝐚𝐜𝐤𝐔𝐩, но время восстановления тома — 𝟖 часов
Критичные виртуальные машины подняли быстро, но часть зависимостей не задокументирована, на что уходит ещё 𝟐 часа.
Под зависимости не хватает ресурсов на резервном ЦОДе и для этого перевозится дополнительное оборудование
Часть инфраструктуры размещается в публичном облаке, но из-за отпуска специалиста по сетям, процесс занимает ещё 𝟑 часа.

Спустя 𝟏𝟑 часов после аварии система восстановлена, но работает неполноценно, включая слетевшие лицензии, на актуализацию которых уходит ещё 𝟐 часа.

Итоговое время полного восстановления работы 𝐈𝐓 систем составило 𝟏𝟓 часов.

Последствия:
— Полная потеря данных от последней резервной копии до момента устранения аварии;
— Остановка работы ключевых подразделений;
— Штрафы за простой от клиентов;
— Репутационные потери.

Что послужило причиной продолжительного восстановления:
𝟏) Способы резервирования систем не соответствовали требованиям бизнеса
𝟐) Отсутствие плана действий в момент аварии
𝟑) Отсутствие актуальной информации о достаточности ресурсов на резервной площадке
𝟒) В процессе эксплуатации не проводились учения по выходу из аварийной ситуации

К каким выводам пришла компания:
— Избыточная инфраструктура, а это 𝟐 и более ЦОДа — не единственная мера в достижении непрерывности работы приложения;
— Ожидания бизнеса — больше, чем включенная инфраструктура.
На практике требуется полное восстановление бизнес-процессов.

Часто, при построении инфраструктуры, ИТ-отделы компаний не выполняют требования бизнеса и не договариваются о действиях в момент аварии. Это влечет за собой колоссальные затраты на инфраструктуру, которая не соответствует требованиям бизнеса, не говоря о потерях во время самой аварии.