Управление инфраструктурой центров обработки данных

Управление инфраструктурой Центров Обработки Данных (ЦОД) (DCIM – Data Center Infrastructure Management) - направление в развитии ИТ индустрии, развитие которого связано со значительным ростом количества корпоративных ЦОД и процессом консолидации в индустрии коммерческих ЦОД.  В контексте DCIM под ресурсами ЦОД понимаются как ИТ активы: сервера, системы хранения, сетевое оборудование, так и ресурсы ЦОД, обеспечивающие работу ИТ активов: строительные (серверные помещения), инженерные системы, системы энергообеспечения и сама электроэнергия, системы поддержания необходимых параметров среды помещений ЦОД.

В решениях DCIM обычно выделяют следующие большие функциональные области:

  • Инвентаризация, визуализация и управление активами. Что имеется в ЦОД (монтажные шкафы, серверы, сетевое оборудование), как расположено оборудование, его параметры и характеристики. Чем больше ЦОД, чем больше количество ЦОД в организации, тем сложнее и дороже получить актуальную информацию.
  • Планирование изменений в ЦОД. Любое изменение в высоконагруженном ЦОД (установка нового шкафа, сервера, перемещение оборудования из шкафа в шкаф и т.д.) вызывает целый ряд проблем, связанных с определением возможности и осуществлением такого изменения. Очень много параметров влияют на решение – и наличие места в шкафу и наличие резерва электропитания, охлаждения и т.д.
  • Контроль и управление энергопотреблением ЦОД. Чем ближе измеритель потребляемой мощности к нагрузке, обеспечивающей работу ИТ сервиса и чем больше таких измерителей, тем точнее карта энергопотребления ЦОД. Точные данные по энергопотреблению позволяют рассчитывать коэффициенты энергоэффективности (например, PUE), планировать размещение ИТ активов, отслеживать тенденции.
  • Мониторинг рабочей среды серверных помещений и организация системы оповещения и противодействия в случаях аварийных ситуаций.
  • Обеспечение удаленного доступа к ИТ-оборудованию для оперативного управления и устранения проблем;
  • Мониторинг и управления критичной физической инфраструктурой в ЦОД, к которой можно отнести системы обеспечения бесперебойного питания (генераторы, ИБП), системы охлаждения и вентиляции.
  • Формализация регламентов по внесению изменений в ЦОД – позволяет точно описать логическую и временную схему заданий каждому сотруднику ЦОД для реализации какого-либо изменения в ЦОД (инсталляция, перенос, вывод из эксплуатации, и т.д.).

Хорошо функционирующая система DCIM позволяет поднять эффективность - минимизировать стоимость ИТ сервиса в пересчете на одного пользователя в единицу времени и в долгосрочной перспективе, и обеспечить надежность функционирования ЦОД - гарантировать требуемый уровень обслуживания (SLA) пользователей, существенно снизить капитальные и операционные расходы на строительство, модернизацию и эксплуатацию ЦОД. 

Платформа управления инфраструктурой ЦОД Vertiv Trellis

В настоящее время с развитием технологий виртуализации и облачных вычислений стандартный подход к управлению проектированием, строительством и эксплуатацией центров обработки данных на трех независимых уровнях: ИТ сервисы, ИТ оборудование, инженерное оборудование, представляется статичным и уже не соответствующим процессам, происходящим в ИТ отрасли.

Компания Vertiv (ранее - Avocent, Emerson Network Power) предлагает реализацию комплексного подхода к ЦОД как к ИТ экосистеме, требующей управления.

 

Рисунок 1. ЦОД – ИТ экосистема.

Платформа Vertiv Trellis представляет собой инновационный программно-аппаратный комплекс управления инфраструктурой ЦОД. Это платформа, обеспечивающая совместную работу различных функциональных модулей комплекса, специализированных устройств сбора информации из разных источников и устройств обеспечения доступа к портам управления ИТ и инженерного оборудования ЦОД производства компании Vertiv.

Рисунок 2. Архитектура Trellis.

Универсальное устройство управления Vertiv UMG/TIE

Аппаратным компонентом платформы Trellis является универсальное устройство управления UMG (Universal Management Gateway). (Рисунок 3). Universal Management Gateway занимает роль основного связующего звена между программными модулями управления и мониторинга с одной стороны и физической инфраструктурой с другой, обеспечивая непрерывный сбор данных и управление с обратной связью для инженерного оборудования, вычислительных и сетевых средств. Устройство UMG взаимодействует с системами электропитания, охлаждения, датчиками параметров среды и оборудованием ИТ, собирая, унифицируя и передавая необходимую информацию в соответствующие функциональные модули платформы Trellis. Это позволяет контролировать состояние ЦОД, а также обеспечивает доступ и управление ИТ и инженерными системами в реальном времени.

В случае, если требуется только функция мониторинга, то можно обойтись программным обеспечением TIE (Trellis Intelligence Engine), установленным на физическую машину, которая будет собирать, обрабатывать и передавать данные мониторинга на сервер Trellis.

Рисунок 3. UMG-универсальный шлюз управления.

Основными задачами UMG являются:

  • Мониторинг и сбор данных: 
    – С датчиков параметров среды серверных помещений ЦОД; 
    – С портов сервисных процессоров ИТ активов; 
    – С оборудования инженерной инфраструктуры;
  • Удалённое управление активами ЦОД (Доступ/Управление) через: 
    – Цифровой KVM; 
    – Доступ Serial over IP; 
    – Управление через Service Processor.

Внешний вид устройства UMG представлен на рисунке 4.

Рисунок 4. Устройство UMG 6000.

Основные характеристики UMG

Выпускаются три модели устройств UMG со следующими характеристиками:

Поддержка сервисных процессоров:

  • IPMI 1.5 (+ non-standard SoL), IPMI 2.0;
  • HP iLO - iLO3, IPMI, HP Blade System;
  • Dell DRAC4, 5, Dell BladeCenter, DRAC MC, DELL 10G, M1000e Blade Chassis Controller, Blade Chassis Management Controller/iDRAC for blades/iDRAC6 for blades;
  • Cisco UCS-C Rack Mount servers;
  • FSC iRMC, iRMC S2;
  • IBM RSA (RSA II), IBM BladeCenter;
  • Sun ALOM, Sun ILOM, Sun eLOM;

Управление серверами:

  • Консольный доступ Serial&KVM over IP;
  • Логирование консольных сессий (local, NFS, Syslog);
  • Поддержка управления питанием через управляемые PDU;
  • Graceful shutdown (для IPMI);
  • System event logs (SEL);
  • Hardware environmental sensors;
  • Alert management;
  • Platform event traps (PET);

Поддержка протоколов инженерного оборудования:

  • BACNET;
  • Modbus;
  • SNMP;
  • Velocity;

Интерфейсы и соединения:

  • 40xRJ45 портов с автоматической настройкой (искл. UMG2000, 32xSP + 8x авто);
  • Цифровые входы для совместимых сенсоров (температура, влажность, сухие контакты, движение, задымление);
  • Цифровые выходы для удаленного управления;
  • Совместимые сенсоры: серия Liebert SN;

Пользовательский интерфейс:

  • Встроенный графический и веб- интерфейсы;
  • Управление через DSView и Trellis;
  • Командный интерфейс SSH;
  • Локальная KVM консоль. 

Функциональные программные модули Trellis 

Программная часть платформы Vertiv Trellis в настоящее время включает следующие основные функциональные модули:

  • Trellis Platform Services – программная платформа, обеспечивающая совместную работу функциональных модулей Trellis.
  • Trellis Inventory Manager – дает возможность администраторам создавать точные и полные модели своих ЦОД, в том числе местоположение устройств и оборудования, взаимодействие этих компонентов, и ресурсов, используемых оборудованием ЦОД.
  • Trellis Site Manager – информирует персонал о состоянии инфраструктуры, включая климатические условия, распознает и решает проблемы, влияющие на производительность системы. 
  • Trellis Change Planner – позволяет отслеживать и планировать изменения в ЦОД. 
  • Trellis Energy Insight – позволяет легко получать отчёты по уровням потребления энергии любым объектом.

В планах компании расширение функционала Trellis следующими модулями:

  • Trellis Power System Manager - просмотр ресурсов и утилизации систем энергоснабжения, повышение уровня знания об активных цепях электропитания, состояния каждого устройства энергетической системы ЦОД, понимание зависимостей в энергетической системе ЦОД, визуализация агрегированного состояния и ресурсов устройств питания, работающих параллельно.
  • Trellis Mobile suite – расширение платформы Trellis, набор приложений для управления ЦОД с мобильных устройств.
  • Trellis Process Manager - создание и оптимизация процессов и процедур по управлению ЦОД.
  • Trellis Cooling Systems Manager - контроль ресурсов и запасов по охлаждению.
  • Virtual Insight Manager – управление виртуальной инфраструктурой ЦОД.

Trellis Inventory Manager

Функционал:

  • Ведение базы активов ЦОД;
  • Визуальная конфигурация актива;
  • Библиотека образов для всех типов устройств;
  • Поиск расположения актива внутри ЦОД;
  • Визуальные планы размещения в ЦОД и в отдельной стойке.

Преимущества:

  • Позволяет быстрее находить любую единицу оборудования;
  • Позволяет администратору ЦОД быстро принимать решения по размещению нового оборудования;
  • Даёт менеджеру ЦОД моментальный обзор по установленному оборудованию, используемым ресурсам и доступным ресурсам, основываясь на информации о реальном энергопотреблении оборудования.


Trellis Site Manager

Функционал:

  • Сбор оповещений и тревожных сообщений;
  • Сбор и анализ данных в реальном времени;
  • Отображение статуса устройств;
  • Настройка и сбор отчётов по энергетике по зонам или отдельным шкафам;
  • Обнаружение и импорт новых устройств.

Преимущества:

  • Обеспечит наиболее эффективное использование персонала, расставляя фокусы на основные проблемы;
  • Уменьшает время на обнаружение и устранение проблем, связанных с критичными инфраструктурными устройствами.

 

Trellis Change Planner

Функционал

  • Моделирование изменений в ЦОД;
  • Планирование основных событий;
  • Отслеживание и управление взаимосвязями;
  • Анализ истории изменений.

Преимущества

  • Даёт техническому персоналу чёткие инструкции и последовательность действий для реализации действий по изменению в ЦОД;
  • Позволяет инженеру в ЦОД полностью контролировать процесс изменений;
  • Значительно сокращает время на внесение изменений.


Trellis Energy Insight

Функционал

  • Метрики эффективности ЦОД, включая PUE;
  • Потребление электроэнергии (kВт/час) и ее стоимость;
  • Потери в подсистемах.

Преимущества

  • Выявление неэффективных зон в эксплуатации ЦОД и получение рекомендаций по улучшению производительности;
  • Текущие и исторические показатели метрик эффективности (PUE and DCiE);
  • Отчёты по стоимости потребляемой электроэнергии в подсистемах.

Trellis Power System Manager

Функционал

  • Взаимосвязи в электро-оборудовании;
  • Энергосистема – утилизация ресурсов и мощности;
  • Статус подключённых компонентов электро-цепей.

Преимущества

  • Обзор доступных ресурсов энергосистемы, степени утилизации и доступных мощностей;
  • Обзор активных электро-цепей и статус каждого компонента энергосистемы;
  • Понимание взаимосвязей в энергосистеме;
  • Визуализация функционирования параллельных энергосистем (общий статус и доступные ресурсы).



Trellis Process Manager

Функционал

  • Планирование процессов для реализации проектов;
  • Минимизация инцидентов при внесении изменений, связанных человеческим фактором;
  • Предотвращает ошибки и обеспечивает совместимость со стандартами;
  • Возможность интеграции с внешними системами.

Преимущества

  • Повышает операционную эффективность;
  • Управление сложными процессами в ЦОД;
  • Отслеживание истории изменений для анализа связанных с этим инцидентов и обеспечения совместимости со стандартами индустрии.

Trellis Cooling Systems Manager

Функционал

  • Комплексная картина функционирования систем охлаждения и их утилизации;
  • Понимание режима работы и статуса каждого компонента системы охлаждения;
  • Отчёт о наличии ресурсов системы, используемых и неиспользуемых мощностях.

Преимущества

  • Быстрый доступ к информации о наличии, установленных мощностях и утилизации имеющихся ресурсов системы охлаждения;
  • Оперативная картина по статусам каждого компонента системы охлаждения;
  • Чёткое понимание по взаимосвязям внутри системы охлаждения.


Virtual Insight Manager

Функционал

  • Инвентаризация виртуальных машин поверх физических хостов;
  • Определение потребляемых виртуальной машиной ресурсов – электроэнергии, систем охлаждения, ресурсов хоста;
  • Проактивный мониторинг и предупреждение ситуаций, связанных с нехваткой ресурсов;
  • Визуализация состояния и зависимостей.

Преимущества

  • Быстрое определение локации виртуальной машины в ЦОД (хост, расположение хоста в ЦОД);
  • Понимание наличия доступных ресурсов (мощность, охлаждение, вес, место в шкафу) на физическом хосту и предупреждение потенциальных проблем, связанных с перегрузкой.


Trellis Mobile suite

Функционал

  • Инновационные технологии сканирования и распознавания штрих-кодов оборудования ЦОД;
  • Обновление информации на мобильном устройстве в реальном времени;
  • Быстрый поиск шкафа и устройства в ЦОД;
  • Просмотр отчетов Trellis в реальном времени;
  • Быстрый доступ к данным о ресурсах и портах устройства;
  • Просмотр и обновление силовых соединений;
  • Доступ к портам управления ИТ оборудования.

Преимущества

  • Эффективное использование персонала ЦОД;
  • Сокращение сроков восстановления после сбоев;
  • Оперативность получения информации.

Остались вопросы?

Система Orphus