Решения на Открытом ПО
Системы мониторинга для динамической ИТ инфраструктуры

Системы мониторинга для динамической ИТ инфраструктуры

Михаил Кулемин,
консультант по инфраструктурным решениям (VDEL)

Сегодня никто не станет спорить с утверждением, что современные информационные технологии развиваются стремительными темпами. Внедрение виртуализации и развитие концепции облачных вычислений меняет облик типичного центра обработки данных. Стоимость оборудования сокращается, и число серверов в дата центрах постоянно возрастает. Вместе с тем статическая IT инфраструктура заменяется динамическими решениями на базе виртуальных систем. Это позволяет не только оперативно реагировать на возрастающие запросы бизнеса, но и уменьшает стоимость обслуживания информационных систем. Всё большую популярность завоёвывает концепция облачных вычислений, согласно которой инфраструктура, платформа, программное обеспечение — легко предоставляемые услуги. Данный подход позволяет пользователям не задумываться о вопросах обеспечения работоспособности физического оборудования и установки ПО, а использовать IT технологии исключительно как инструмент для решения собственных задач. Не удивительно, что при этом предъявляются самые высокие требования к отказоустойчивости систем. В такой ситуации большое значение имеет эффективность использования систем мониторинга. Далее рассматриваются основные функциональные возможности современных решений для комплексного мониторинга информационных систем.

Базовые возможности

Мониторинг производительности и доступности.

Одной из базовых функциональных возможностей любой системы мониторинга является контроль доступности и производительности оборудования и сервисов. Подобный мониторинг может помочь вовремя обнаружить нештатную ситуацию и оперативно принять меры по ликвидации последствий, но в современной инфраструктуре последствия неполадок в работе системы могут стоить чрезвычайно дорого. Поэтому многие системы мониторинга предоставляют различные технологии для предсказания отказов на основе статистических алгоритмов. Подобные решения отслеживают показатели работы оборудования и сервисов и предупреждают администратора, при аномальном поведении основных характеристик. Это позволяет вовремя принять необходимые меры по профилактике отказов.

Комплексный мониторинг сервисов.

Существует ряд критичных для бизнеса сервисов (таких как веб-портал, СУБД, почтовая система), показатели работы которых отследить довольно трудно. Даже при низкой загрузке сервера и нормальной работе локальной сети, гарантировать корректную работу этих сервисов невозможно. Для того, чтобы обеспечить адекватный контроль работы подобного рода приложений, множество систем мониторинга использует комплексные транзакции. Суть метода заключается в том, что к сервисам посылаются тестовые запросы, схожие с реальными запросами пользователей или приложений — это позволяет оценить время отклика сервиса и получить информацию о неполадках до того, как о них сообщат недовольные пользователи. Комплексные транзакции активно используются для мониторинга баз данных, веб приложений, систем доставки почты.

Управление событиями.

Подсистема управления событиями — одна из основных компонент мониторинга IT инфраструктуры. В конечном счете именно от грамотной систематизации событий зависит скорость реакции администраторов на возникающие неполадки. Одним из ключевых характеристик системы мониторинга является возможность локализации события, определения точного места возникновения отказа. При этом необходимо учитывать и взаимосвязи между компонентами архитектуры. Так, например, неисправный маршрутизатор может привести к недоступности целого сегмента сети. Если в этом случае генерируется множество сообщений об отказах устройств, то это скорее усложнит работу технической поддержки. Поэтому при классификации событий системы мониторинга используют информацию о топологии сети и связях между различными объектами.

Крупные дата центры обслуживаются множеством специалистов, каждые из которых может отвечать только за свою часть инфраструктуры. Это приводит к необходимости использования различных механизмов разграничения доступа. Зачастую системы мониторинга могут интегрироваться с базами Active Directory и LDAP. Разумеется, система управления событиями должна предусматривать возможность гибкой настройки уведомлений о событиях для различных пользвателей.

Комплексный подход к мониторингу инфраструктуры.

Становиться очевидно, что использование множества утилит для мониторинга отдельных компонентов информационной системы уже не достаточно для надежного контроля состояния сервисов и оборудования. Конечно, описанный выше функционал можо обеспечить при помощи нескольких различных систем, но обеспечить эффективную взаимосвязь компонентов и корректную обработку событий при таком подходе практически невозможно. Современные решения для мониторинга обеспечивают единый интерфейс для контроля за всеми компонентами инфраструктуры. В последнее время отдельным преимуществом является возможность работы в гетерогенных сетях и обеспечение полноценного контроля за Linux и Windows системами.

Для осуществления комплексного мониторинга инфраструктуры многие системы использут различные методы сбора информации. Зачастую для осуществения контроля за устройствами и сервисами необходима установка дополнительного клиетнского ПО. Данный подход может затруднить развертывание системы мониторинга, ведь на установку и настройку клиентов требуется дополнительное время. Иной подход предусматривает сбор информации при помощи стандартных сетевых средств, такие как SMNP, SSH, IPMI протоколы для Unix подобных систем и WMI, SNMP для Windows систем. Дянное решение значительно упрощает развертывание мониторинга, кроме того не возникает никаких проблем при работе в гетерогенных сетях. Использование стандартных протоколов, существенно расширяет спектр контролируемых устройств.

Мониторинг виртуальной среды.

Виртуальная инфраструктура становится неотъемлемой частью современных информационных систем. Поэтому возможность единого интерфейса для контроля как за физической так и за виртуальной составляющей инфраструктуры является одной из обязательных функций современной системы мониторинга. Многие системы используют родной API для сбора информации о виртуальных системах и позволяют контролировать использование ресурсов памяти и CPU, состояние хранилищ, производительность виртуальных машин и процессы миграции машин между физическими хостами. При этом могут поддерживаются различные системы виртуализации: KVM, VMware, XEN. Единый мониторинг физической и виртуальной среды становиться особенно актуальным в связи с увеличением популярности концепции облачных вычислений. Гибкая система контроля за состоянием вычислительного облака является необходимым условием для обеспечения высокого уровня отказоустойчивости.

Развертывание и масштабирование

Зачастую мониторинг разворачивается в уже работающей инфраструктуре, и поэтому большое значение имеют возможности автоматического определения сетевой топологии, систем и работающих сервисов. Подобные технологии позволяют существенно сократить время на развертывание и настройку системы мониторинга и в дальнейшем упрощают добавление новых устройств и даже целых сегментов сети. Большое значение имеют также и встроенные возможности системы по классификации устройств. После того, как обнаруженные устройства распределены по группам (Linux машины, Windows машины, маршрутизаторы, сервисы и.т.д.) становиться возможным унифицировать сценарии мониторинга схожих устройств благодаря многочисленным шаблонам, которые в том или ином виде присутствуют во всех современных системах мониторинга.

При расширении IT-инфраструктуры один сервер может не справиться со сбором и анализом всей поступающей информации, поэтому существуют различные сценарии масштабирования системы мониторинга. Одним из типичных решений является создание множества серверов сбора данных, расположенных в различных сегментах инфраструктуры. При этом задача анализа данных и отображения отчетов возлагается на один центральный сервер. В случае сложной территориально распределенной инфраструктуры возможно создание иерархической схемы мониторинга. Такой подход позволяет объединить несколько систем мониторинга в единую структуру с возможностью централизованного контроля и получения отчетов о состоянии инфраструктуры на любом уровне.

Заключение

Современные системы мониторинга представляют из себя сложный комплекс, обеспечивающий не только сбор информации о физических серверах, сервисах, виртуальных системах, но и обеспечивающий анализ полученных данных и распределение событий по критичности и зонам ответственности различных IT подразделений. Для эффективного функционирования подобной системы необходимо не только учитывать взаимосвязь различных устройств и сервисов, но и принимать во внимание особенности конкретной инфраструктуры. Поэтому в любой более-менее крупной информационной системе, внедрение мониторинга требует серьезного планирования конфигурации. Полностью универсального рецепта для построения эффективного мониторинга не существует, поэтому различные системы предусматривают широкий спектр настроек и возможность расширения дополнительными модулями. Во многом благодаря этому адекватное сравнение промышленных решений мониторинга является весьма трудной задачей. Основной функционал большинства систем схож, а оценки реальной эффективности можно проводить только отталкиваясь от конкретной инфраструктуры и её особенностей.

На этом фоне привлекательно выглядят решения с открытым исходным кодом. Открытая модель разработки позволяет быстро реагировать на запросы пользователей, что уменьшает время на добавление нового функционала и исправление ошибок. Одним из широко используемых open source решений для мониторинга является Zenoss.

Zenoss Core Zenoss Enterprise

Данный продукт поддерживается не только производителем, но и сообществом, которое разрабатывает собственные модули для расширения функционала продукта (мониторинг новых устройств, добавление новых видов отчетов и прочее). Производитель предоставляет целый ряд готовых модулей которые обеспечивают множество дополнительных возможностей по мониторингу, управлению событиями, автоматической классификации устройств. Множество встроенных функций, гибкая система настроек, модульная структура системы и открытый API позволяют создать эффективный инструмент мониторинга для конкретной инфраструктуры.

###

Эта и другие статьи консультантов VDEL по практике использования open source решений на базе продуктов и технологий из портфеля VDEL читайте на сайте OSSPractice.org

Материалы по теме:

Примечание: кросс-постинг из Развитие Бизнеса / Ру – Блог (devbusiness.ru/mkozloff).