COVID-19 и сохранение непрерывности и безопасности функционирования ЦОДа

14.04.2020
COVID-19 и сохранение непрерывности и безопасности функционирования ЦОДа
DataSpace

Черный лебедь, принесший COVID-19, меняет правила игры — рвутся наработанные цепочки поставок, сокращаются, закрываются или замораживаются бизнесы. Сложившаяся ситуация стала серьезной проверкой организационной зрелости компаний и предприятий.

Прежде всего вызов был брошен принятым стратегиям и системе обеспечения непрерывности бизнеса и восстановления деятельности — инструментам, решающим ключевые задачи руководства компанией в условиях кризиса. Эпидемия COVID-19 стала проверкой готовности персонала и ресурсов для обеспечения заявленного уровня операционной деятельности в условиях чрезвычайных ситуаций.

В частности, в настоящий момент могут реализоваться следующие риски:

  • выбытие персонала вследствие болезни;
  • сбои или прерывание цепочек поставок товаров и оказания услуг;
  • прерывание операционной и производственной деятельности;
  • риски, связанные с ИТ-инфраструктурой и нарушением информационной безопасности.

Каждому руководителю сегодня приходится отвечать на вопрос, насколько его компания оказалась готова к этим и другим рискам. Если говорить о нашей компании, то реализованный план обеспечения непрерывности и восстановления деятельности (ОНиВД) и риск-ориентированный подход в управлении показали свою эффективность. Система управления выстроена и реализуется на методологической базе, содержащей элементы теории надежности, риск-ориентированного подхода в управлении компанией, указаний и стандартов Uptime Institute, ГОСТ 22301, ISO 9001, OHSAS 18001 и др., а также собственных и лучших мировых практик.

Для коммерческого ЦОДа в условиях пандемии важно сохранить устойчивость, непрерывность и безопасность функционирования, обеспечивающего гарантированный уровень услуг. В связи с тем, что производственные процессы ЦОДа, а также бизнес-процессы его клиентов не могут быть остановлены, необходимо оперативно и детально отслеживать и анализировать развитие ситуации, принимать меры, обеспечивающие непрерывность производственных процессов и оказания услуг клиентам, а также защиту здоровья и безопасности сотрудников, клиентов, партнеров и посетителей.

В частности, в рамках выполнения задач, связанных с эксплуатацией критических систем ЦОДа, по факту поступления новой информации как из официальных, так и из второстепенных источников, о развитии общемировой ситуации с противодействием распространению вируса, внедрении ограничений на различных уровнях деятельности компаний и логистики, а также в связи с введением режима самоизоляции, командой DataSpace проводится анализ новых возникающих рисков, которые, в свою очередь, способны воздействовать на операционную устойчивость ЦОДа.

Собственной аналитической группой DataSpace был разработан и активирован план обеспечения полной работоспособности ЦОДа на текущий момент и при дальнейшем негативном развитии ситуации, который включает в том числе:

  • перечень работ, влияющих на критическую инфраструктуру ЦОДа;
  • сменность состава;
  • взаимодействия с поставщиками услуг;
  • количество ЗИП на складах;
  • ведение проектов в ЦОДе;
  • безопасное перемещение до и с места работы сотрудников ЦОДа и посетителей.

Расскажем о некоторых мерах, которые уже реализованы в компании:

  • Персонал, не отвечающий за операционную деятельность ЦОДа, переведен на удаленный режим работы.
  • Для повышения отказоустойчивости ЦОДа в части людских ресурсов сформирована команда специалистов ЦОДа, переведенная на удаленную работу. В настоящее время эта группа выполняет административные задачи и при необходимости готова восполнить частично или полностью выбывший состав основной группы эксплуатации ЦОДа, поддерживать 100%-ное функционирование ЦОДа до окончания режима самоизоляции.
  • Организованы резервные смены клиентской поддержки полного цикла, которые могут оперативно заменить весь текущий персонал ЦОДа без какого-либо влияния на процессы обеспечения работоспособности ЦОДа.
  • Разрабатываются мероприятия по доставке всех сотрудников дежурных смен по маршруту дом — работа — дом без использования общественного транспорта.
  • Плановое обслуживание инфраструктуры ЦОДа, там, где это допустимо, перенесено на более поздние сроки.
  • Реализованы мероприятия по контролю над состоянием здоровья как посетителей дата-центра, так и сотрудников компании, — обязательное измерение температуры, ежедневные опросы о состоянии здоровья.
  • Перенаправление всего потока посетителей в единственный открытый вход в ЦОД, что позволяет оценивать состояние здоровья по внешним признакам у 100% посетителей.
  • Все помещения общего доступа в здании обеспечены дополнительными дезинфицирующими средствами, проводится периодическая санитарная обработка рабочих мест сотрудников.
  • Клиентам направляются рекомендации воздержаться от посещения дата-центра, если их задачи могут быть выполнены в рамках услуги Remote Hands сотрудниками службы клиентской поддержки DataSpace.

Основываясь на результатах анализа эффективности вышеописанных мер плана ОНиВД, можно сделать следующие выводы:

  • Критически важно поддерживать в актуальном состоянии планы обеспечения непрерывности бизнеса, планы ликвидации аварий и восстановления бизнес-процессов и критичных ресурсов.
  • Нельзя исключать из рассмотрения маловероятные события.
  • Анализ и планирование реализации сценариев и проведение полномасштабных практических тестов повышают готовность и эффективность действий компании в нестандартных ситуациях.
  • Должная проверка и обучение сотрудников компании, клиентов и контрагентов обеспечивает эффективность функционирования в нестандартных ситуациях.

Николай Шеметов, технический директор, DataSpace

Пресс-центр