Инфраструктурные решения

Управление инфраструктурой центров обработки данных

Управление инфраструктурой Центров Обработки Данных (ЦОД) (DCIM – Data Center Infrastructure Management) - направление в развитии ИТ индустрии, развитие которого связано со значительным ростом количества корпоративных ЦОД и процессом консолидации в индустрии коммерческих ЦОД.  В контексте DCIM под ресурсами ЦОД понимаются как ИТ активы: сервера, системы хранения, сетевое оборудование, так и ресурсы ЦОД, обеспечивающие работу ИТ активов: строительные (серверные помещения), инженерные системы, системы энергообеспечения и сама электроэнергия, системы поддержания необходимых параметров среды помещений ЦОД.

В решениях DCIM обычно выделяют следующие большие функциональные области:

  • Инвентаризация, визуализация и управление активами. Что имеется в ЦОД (монтажные шкафы, серверы, сетевое оборудование), как расположено оборудование, его параметры и характеристики. Чем больше ЦОД, чем больше количество ЦОД в организации, тем сложнее и дороже получить актуальную информацию.
  • Планирование изменений в ЦОД. Любое изменение в высоконагруженном ЦОД (установка нового шкафа, сервера, перемещение оборудования из шкафа в шкаф и т.д.) вызывает целый ряд проблем, связанных с определением возможности и осуществлением такого изменения. Очень много параметров влияют на решение – и наличие места в шкафу и наличие резерва электропитания, охлаждения и т.д.
  • Контроль и управление энергопотреблением ЦОД. Чем ближе измеритель потребляемой мощности к нагрузке, обеспечивающей работу ИТ сервиса и чем больше таких измерителей, тем точнее карта энергопотребления ЦОД. Точные данные по энергопотреблению позволяют рассчитывать коэффициенты энергоэффективности (например, PUE), планировать размещение ИТ активов, отслеживать тенденции.
  • Мониторинг рабочей среды серверных помещений и организация системы оповещения и противодействия в случаях аварийных ситуаций.
  • Обеспечение удаленного доступа к ИТ-оборудованию для оперативного управления и устранения проблем;
  • Мониторинг и управления критичной физической инфраструктурой в ЦОД, к которой можно отнести системы обеспечения бесперебойного питания (генераторы, ИБП), системы охлаждения и вентиляции.
  • Формализация регламентов по внесению изменений в ЦОД – позволяет точно описать логическую и временную схему заданий каждому сотруднику ЦОД для реализации какого-либо изменения в ЦОД (инсталляция, перенос, вывод из эксплуатации, и т.д.).

Хорошо функционирующая система DCIM позволяет поднять эффективность - минимизировать стоимость ИТ сервиса в пересчете на одного пользователя в единицу времени и в долгосрочной перспективе, и обеспечить надежность функционирования ЦОД - гарантировать требуемый уровень обслуживания (SLA) пользователей, существенно снизить капитальные и операционные расходы на строительство, модернизацию и эксплуатацию ЦОД. 

Платформа управления инфраструктурой ЦОД Vertiv Trellis

В настоящее время с развитием технологий виртуализации и облачных вычислений стандартный подход к управлению проектированием, строительством и эксплуатацией центров обработки данных на трех независимых уровнях: ИТ сервисы, ИТ оборудование, инженерное оборудование, представляется статичным и уже не соответствующим процессам, происходящим в ИТ отрасли.

Компания Vertiv (ранее - Avocent, Emerson Network Power) предлагает реализацию комплексного подхода к ЦОД как к ИТ экосистеме, требующей управления.

 

Рисунок 1. ЦОД – ИТ экосистема.

Платформа Vertiv Trellis представляет собой инновационный программно-аппаратный комплекс управления инфраструктурой ЦОД. Это платформа, обеспечивающая совместную работу различных функциональных модулей комплекса, специализированных устройств сбора информации из разных источников и устройств обеспечения доступа к портам управления ИТ и инженерного оборудования ЦОД производства компании Vertiv.

Рисунок 2. Архитектура Trellis.

Универсальное устройство управления Vertiv UMG

Аппаратным компонентом платформы Trellis является универсальное устройство управления UMG (Universal Management Gateway). (Рисунок 3). Universal Management Gateway занимает роль основного связующего звена между программными модулями управления и мониторинга с одной стороны и физической инфраструктурой с другой, обеспечивая непрерывный сбор данных и управление с обратной связью для инженерного оборудования, вычислительных и сетевых средств. Устройство UMG взаимодействует с системами электропитания, охлаждения, датчиками параметров среды и оборудованием ИТ, собирая, унифицируя и передавая необходимую информацию в соответствующие функциональные модули платформы Trellis. Это позволяет контролировать состояние ЦОД, а также обеспечивает доступ и управление ИТ и инженерными системами в реальном времени.

Рисунок 3. UMG-универсальный шлюз управления.

Основными задачами UMG являются:

  • Мониторинг и сбор данных: 
    – С датчиков параметров среды серверных помещений ЦОД; 
    – С портов сервисных процессоров ИТ активов; 
    – С оборудования инженерной инфраструктуры;
  • Удалённое управление активами ЦОД (Доступ/Управление) через: 
    – Цифровой KVM; 
    – Доступ Serial over IP; 
    – Управление через Service Processor.

Внешний вид устройства UMG представлен на рисунке 4.

Рисунок 4. Устройство UMG 6000.

Основные характеристики UMG

Выпускаются три модели устройств UMG со следующими характеристиками:

Поддержка сервисных процессоров:

  • IPMI 1.5 (+ non-standard SoL), IPMI 2.0;
  • HP iLO - iLO3, IPMI, HP Blade System;
  • Dell DRAC4, 5, Dell BladeCenter, DRAC MC, DELL 10G, M1000e Blade Chassis Controller, Blade Chassis Management Controller/iDRAC for blades/iDRAC6 for blades;
  • Cisco UCS-C Rack Mount servers;
  • FSC iRMC, iRMC S2;
  • IBM RSA (RSA II), IBM BladeCenter;
  • Sun ALOM, Sun ILOM, Sun eLOM;

Управление серверами:

  • Консольный доступ Serial&KVM over IP;
  • Логирование консольных сессий (local, NFS, Syslog);
  • Поддержка управления питанием через управляемые PDU;
  • Graceful shutdown (для IPMI);
  • System event logs (SEL);
  • Hardware environmental sensors;
  • Alert management;
  • Platform event traps (PET);

Поддержка протоколов инженерного оборудования:

  • BACNET;
  • Modbus;
  • SNMP;
  • Velocity;

Интерфейсы и соединения:

  • 40xRJ45 портов с автоматической настройкой (искл. UMG2000, 32xSP + 8x авто);
  • Цифровые входы для совместимых сенсоров (температура, влажность, сухие контакты, движение, задымление);
  • Цифровые выходы для удаленного управления;
  • Совместимые сенсоры: серия Liebert SN;

Пользовательский интерфейс:

  • Встроенный графический и веб- интерфейсы;
  • Управление через DSView и Trellis;
  • Командный интерфейс SSH;
  • Локальная KVM консоль. 

Функциональные программные модули Trellis 

Программная часть платформы Vertiv Trellis в настоящее время включает следующие основные функциональные модули:

  • Trellis Platform Services – программная платформа, обеспечивающая совместную работу функциональных модулей Trellis.
  • Trellis Inventory Manager – дает возможность администраторам создавать точные и полные модели своих ЦОД, в том числе местоположение устройств и оборудования, взаимодействие этих компонентов, и ресурсов, используемых оборудованием ЦОД.
  • Trellis Site Manager – информирует персонал о состоянии инфраструктуры, включая климатические условия, распознает и решает проблемы, влияющие на производительность системы. 
  • Trellis Change Planner – позволяет отслеживать и планировать изменения в ЦОД. 
  • Trellis Energy Insight – позволяет легко получать отчёты по уровням потребления энергии любым объектом.

В планах компании расширение функционала Trellis следующими модулями:

  • Trellis Power System Manager - просмотр ресурсов и утилизации систем энергоснабжения, повышение уровня знания об активных цепях электропитания, состояния каждого устройства энергетической системы ЦОД, понимание зависимостей в энергетической системе ЦОД, визуализация агрегированного состояния и ресурсов устройств питания, работающих параллельно.
  • Trellis Mobile suite – расширение платформы Trellis, набор приложений для управления ЦОД с мобильных устройств.
  • Trellis Process Manager - создание и оптимизация процессов и процедур по управлению ЦОД.
  • Trellis Cooling Systems Manager - контроль ресурсов и запасов по охлаждению.
  • Virtual Insight Manager – управление виртуальной инфраструктурой ЦОД.

Trellis Inventory Manager

Функционал:

  • Ведение базы активов ЦОД;
  • Визуальная конфигурация актива;
  • Библиотека образов для всех типов устройств;
  • Поиск расположения актива внутри ЦОД;
  • Визуальные планы размещения в ЦОД и в отдельной стойке.

Преимущества:

  • Позволяет быстрее находить любую единицу оборудования;
  • Позволяет администратору ЦОД быстро принимать решения по размещению нового оборудования;
  • Даёт менеджеру ЦОД моментальный обзор по установленному оборудованию, используемым ресурсам и доступным ресурсам, основываясь на информации о реальном энергопотреблении оборудования.


Trellis Site Manager

Функционал:

  • Сбор оповещений и тревожных сообщений;
  • Сбор и анализ данных в реальном времени;
  • Отображение статуса устройств;
  • Настройка и сбор отчётов по энергетике по зонам или отдельным шкафам;
  • Обнаружение и импорт новых устройств.

Преимущества:

  • Обеспечит наиболее эффективное использование персонала, расставляя фокусы на основные проблемы;
  • Уменьшает время на обнаружение и устранение проблем, связанных с критичными инфраструктурными устройствами.

 

Trellis Change Planner

Функционал

  • Моделирование изменений в ЦОД;
  • Планирование основных событий;
  • Отслеживание и управление взаимосвязями;
  • Анализ истории изменений.

Преимущества

  • Даёт техническому персоналу чёткие инструкции и последовательность действий для реализации действий по изменению в ЦОД;
  • Позволяет инженеру в ЦОД полностью контролировать процесс изменений;
  • Значительно сокращает время на внесение изменений.


Trellis Energy Insight

Функционал

  • Метрики эффективности ЦОД, включая PUE;
  • Потребление электроэнергии (kВт/час) и ее стоимость;
  • Потери в подсистемах.

Преимущества

  • Выявление неэффективных зон в эксплуатации ЦОД и получение рекомендаций по улучшению производительности;
  • Текущие и исторические показатели метрик эффективности (PUE and DCiE);
  • Отчёты по стоимости потребляемой электроэнергии в подсистемах.

Trellis Power System Manager

Функционал

  • Взаимосвязи в электро-оборудовании;
  • Энергосистема – утилизация ресурсов и мощности;
  • Статус подключённых компонентов электро-цепей.

Преимущества

  • Обзор доступных ресурсов энергосистемы, степени утилизации и доступных мощностей;
  • Обзор активных электро-цепей и статус каждого компонента энергосистемы;
  • Понимание взаимосвязей в энергосистеме;
  • Визуализация функционирования параллельных энергосистем (общий статус и доступные ресурсы).



Trellis Process Manager

Функционал

  • Планирование процессов для реализации проектов;
  • Минимизация инцидентов при внесении изменений, связанных человеческим фактором;
  • Предотвращает ошибки и обеспечивает совместимость со стандартами;
  • Возможность интеграции с внешними системами.

Преимущества

  • Повышает операционную эффективность;
  • Управление сложными процессами в ЦОД;
  • Отслеживание истории изменений для анализа связанных с этим инцидентов и обеспечения совместимости со стандартами индустрии.

Trellis Cooling Systems Manager

Функционал

  • Комплексная картина функционирования систем охлаждения и их утилизации;
  • Понимание режима работы и статуса каждого компонента системы охлаждения;
  • Отчёт о наличии ресурсов системы, используемых и неиспользуемых мощностях.

Преимущества

  • Быстрый доступ к информации о наличии, установленных мощностях и утилизации имеющихся ресурсов системы охлаждения;
  • Оперативная картина по статусам каждого компонента системы охлаждения;
  • Чёткое понимание по взаимосвязям внутри системы охлаждения.


Virtual Insight Manager

Функционал

  • Инвентаризация виртуальных машин поверх физических хостов;
  • Определение потребляемых виртуальной машиной ресурсов – электроэнергии, систем охлаждения, ресурсов хоста;
  • Проактивный мониторинг и предупреждение ситуаций, связанных с нехваткой ресурсов;
  • Визуализация состояния и зависимостей.

Преимущества

  • Быстрое определение локации виртуальной машины в ЦОД (хост, расположение хоста в ЦОД);
  • Понимание наличия доступных ресурсов (мощность, охлаждение, вес, место в шкафу) на физическом хосту и предупреждение потенциальных проблем, связанных с перегрузкой.


Trellis Mobile suite

Функционал

  • Инновационные технологии сканирования и распознавания штрих-кодов оборудования ЦОД;
  • Обновление информации на мобильном устройстве в реальном времени;
  • Быстрый поиск шкафа и устройства в ЦОД;
  • Просмотр отчетов Trellis в реальном времени;
  • Быстрый доступ к данным о ресурсах и портах устройства;
  • Просмотр и обновление силовых соединений;
  • Доступ к портам управления ИТ оборудования.

Преимущества

  • Эффективное использование персонала ЦОД;
  • Сокращение сроков восстановления после сбоев;
  • Оперативность получения информации.

Остались вопросы?

Система Orphus