Нюансы выбора и организации системы мониторинга Windows серверов и приложений 1С

Нюансы выбора и организации системы мониторинга Windows серверов и приложений 1С

Отслеживание состояния IT-инфраструктуры необходимо для обеспечения надежности и отказоустойчивости сервисов. Информация о статусе и производительности аппаратного или программного комплекса не только помогает реагировать на возникающие проблемы, но и дает возможность отслеживать изменения в работе системы, собирая данные после внесения изменений, что позволяет удостовериться в корректности применяемых изменений. Один из лучших способов получить эти данные - это надежная система мониторинга, которая собирает метрики, визуализирует данные и предупреждает операторов, когда что-то работает не так как должно. Если вы пользуетесь услугой «Аренда удаленного сервера» или «Аренда сервера 1С», то вы можете быть уверены, что ситуация и состояние вашего сервера находятся под надежным контролем.

В данной статье мы постараемся рассказать о общих компонентах, используемых в различных платформах для мониторинга. Мы расскажем о том, как они взаимодействуют между собой, для чего они нужны, какие возможности они предоставляют и типы метрик, статус которых может быть важен. Мы максимально просто и доступно разъяснить ключевые моменты в определении мониторинга и его роли.

Что такое метрики, мониторинг и оповещения?

Метрики, мониторинг и оповещения — это все взаимосвязанные компоненты, которые вместе составляют систему мониторинга. Они предоставляют возможность визуализировать состояние, помочь вам понять тенденции в использовании ресурсов или поведении системы, и понять, какие изменения и как влияют на вашу систему. Если собранные показатели выходят за рамки обозначенной нормы, система мониторинга сможет отправить оповещение, чтобы специалист мог ознакомиться с собранной информацией, а также выявить причину срабатывания оповещения.

Сейчас мы рассмотрим компоненты, входящие в средства мониторинга и то, как они взаимодействуют и дополняют друг друга.

Остановимся подробнее на метриках

Метрики представляют из себя измерения использования ресурсов или отклонения, которые можно собирать в аппаратной или программной среде. Это могут быть низкоуровневые данные использования ресурсов, предоставляемые операционной системой, или высокоуровневые, привязанные к конкретным функциям или работе компонентов и служб, или же это могут быть и вовсе, самостоятельно настроенные датчики для считывания каких-то индивидуальных показателей, например, давление в трубе или температуру процессора. В качестве примера метрик, можно привести количество свободной оперативной памяти на сервере или количество обращений к диску в секунду, представленных и визуализированных посредством заданных настроек в системе мониторинга. Некоторые метрики представлены в качестве общего объема, а другие как скорость операций, которая указывает на «занятость» сегмента системы.

Самые простые для сбора метрики – данные доступные в вашей операционной системе без выполнения дополнительных настроек. Например, нагрузка на оперативную память, процессор, использование дисков или файла подкачки. Так как эти данные уже доступны, как правило, они могут быть переданы системе мониторинга без дополнительных настроек, используя встроенные функции и протоколы передачи. Многие веб-серверы, серверы баз данных и другое программное или аппаратное обеспечение также предоставляют свои собственные встроенные данные для метрик, которые также могут быть переданы системе мониторинга, не требуя дополнительных тонких настроек.

Для других компонентов, например, ваших собственных приложений или аппаратных решений, может потребоваться более сложная настройка для формирования метрик и сбора нужных для них данных из определенных источников.

Метрики играют важную роль в системах мониторинга, так как дают представление о поведении и работоспособности системы, приложений и комплексных систем. Они представляют собой фундамент, используемый системой мониторинга, для построения полноценного представления о комплексной работе системы, автоматизации реакции на изменения и предупреждения операторов системы мониторинга в случае нештатной ситуации.

Визуально, метрики могут быть представлены в виде графиков, таблиц или диаграмм.

В то время, как метрики являются визуальным представлением состояния вашей системы, мониторинг - это процесс сбора и анализа этих данных. Полученные данные передаются системе мониторинга, которая отвечает за хранение и визуализацию этих данных в качестве метрик, а также заставляет срабатывать оповещения, когда значения соответствуют или не соответствуют определенным в ходе настройке требованиям.

Системы мониторинга выполняют множество взаимосвязанных функций. В их число входит: получение и хранения входящих данных, управление хранимыми данными, визуализация данных, организация и корреляция данных с разных входов, чтобы определить совпадает ли какое-либо событие с пиковой нагрузкой на один из ресурсов.

И, наконец, системы мониторинга обычно используются в качестве средства для определения и активации оповещений. Оповещения – это еще один компонент системы мониторинга, который реагирует на изменения значений метрик в зависимости от полученных данных. Функция оповещений состоит из действий, которые будут произведены при тех или иных условиях. Одно из преимуществ наличия настроенной системы мониторинга – автономная работа правильно настроенной системы, которая будет определять необходимость тех или иных действия во время нештатных ситуаций, а также информировать ответственных лиц о необходимости выполнения каких-либо действий.

Автоматизация таких процессов является важнейшим параметром, требующим тонкой настройки, чтобы оповещения срабатывали только в случаях, требующих рассмотрения от того или иного специалиста. Само же оповещения должно содержать в себе информацию о том, что конкретно пошло не так, и что нужно делать чтобы данную проблему устранить.

Так какая же информация важна для отслеживания?

Вес определенных параметров и пороговые показатели для метрик будут менять со временем, по мере развития инфраструктуры. Так как большинство систем работают иерархически, на этапе проектирования системы мониторинга, имеет смысл задуматься о настройке метрик не только на уровне серверов, но и на более низких, или же уровне сетей и сетевого оборудования. Ведь со временем инфраструктура будет увеличиваться, а значит будет расти и количество метрик, поэтому о возможном масштабировании лучше задуматься заранее. Ниже, мы опишем уровни мониторинга, которые применимы в том числе и к предлагаемым нами услугам «Аренда сервера 1С» и «Аренда виртуального удаленного сервера».

Метрики сервера

Данный тип метрик можно отнести к высокому уровню, так как их можно получить изнутри и без тонких настроек для большинства операционных систем. Они используются для отслеживания состояния и производительности выбранного объекта, которым как правило может являться физический или виртуальный выделенный сервер (vds), например, предоставляемый нами в рамках услуги «Аренда виртуального сервера» или «Аренда сервера 1С».

Карта сети в системе мониторинга Zabbix

 

 

Как правило они отображают следующие параметры:
• Процессор
- Нагрузка на процессор. Рекомендуемый показатель не должен превышать 70-80% (Рис. 1.1)
- Процессорная очередь. Рекомендуемый показатель не должен превышать 5 единиц (Рис. 1.2)
- Процессорное время

Рис 1.1 (Zabbix. Нагрузка на процессор)

 

Рис. 1.2 (Zabbix. Процессорная очередь)

 

Объем памяти
- Объем свободной оперативной памяти. Показатель определяется индивидуально из  общего количества, обычно не менее 500-700 ГБ (Рис. 2.1)
- Объем свободной виртуальной памяти. Показатель определяется индивидуально исходя выделенного в настройках системы размера и скорости работы дисков (Рис. 2.2)

Рис. 2.1 (Zabbix. Нагрузка на оперативную память)

 

Рис. 2.2 (Zabbix. Нагрузка на виртуальную память)

 

Дисковое пространство
- Общий объем дискового пространства. Является индивидуальным показателем, пределы можно определить исходя из статистики по скорости заполнения пространства (Рис. 3.1)
- Скорость выполнения операций чтения/записи на диск. Частный показатель, зависит от используемых дисков и заявленных параметров (Рис. 3.2)
- Очередь обращения к диску. Индивидуальный показатель, который может зависеть от множества условий, например, продолжительности очереди на диск (Рис. 3.3)

Рис. 3.1 (Zabbix. Заполненность локального тома)

 

Рис. 3.2 (Zabbix. Скорость чтения/записи на диск при наличии активности)

 

Рис. 3.3 (Zabbix. Очередь обращения к диску)

 

Процессы
- Работа служб и функционирование приложений (Рис. 4)

Рис. 4 (PRTG. Доступность службы RDP)

 

Как правило, эти метрики показывают оказываемое влияние на работоспособность и производительность сервера.

Метрики приложения

Еще одна категория метрик, которую вы можете использовать - метрики приложения. Эти метрики зависят от ресурсов хоста, а так же от служб или приложений. Метрики этого уровня показывают работоспособность, производительность или нагрузку приложения. К ним относятся:

  • Частота ошибок
  • Ошибки и перезапуск приложения
  • Производительность и задержка ответов приложения
  • Использование ресурсов

Иногда метрики удобно объединять в одну группу, как это показано на рис. 5 и 6

Рис. 5 (PRTG. Комплексная панель мониторинга)

 

Рис. 6 (Zabbix. Комплексная панель мониторинга)

 

Эти показатели помогают определить, насколько правильно и эффективно работает приложение при работе на сервере Windows.

Метрики сети и подключений

Для большинства типов инфраструктуры показатели сети и подключений будут представлять собой еще один набор параметров, которые необходимы отслеживать. Как и другие метрики, о которых мы говорили ранее, мониторинг сети и сетевых подключений является важной частью работы системы, которые постоянно должны проверяться на корректное функционирование и обеспечение необходимой производительности. К сетевым метрикам можно отнести следующие показатели:

  • Возможность установки связи
  • Ошибки сети и потеря пакетов
  • Задержка
  • Использование полосы пропускания

Их вы можете увидеть на рис. 7 и 8

 

Рис. 7 (PRTG. Комплексная панель метрик доступности и работы сети)

 

Рис. 8 (Zabbix. Метрика работы сетевого адаптера)

 

Мониторинг сети поможет улучшить доступность и оперативность служб, и сервисов.

Метрики внешних факторов

Так же можно отслеживать внешние события и их влияние на систему. К таким событиям можно отнести различные внешние сервисы, предоставляемые сервис-провайдерами и API внешних ресурсов. Показатели этого типа данных помогут своевременно выявить проблемы в работе системы на которую влияют внешние факторы. Данные показатели могут быть особенно интересны, если вы используете удаленный рабочий стол в Европе. К этим показателям относятся:

  • Состояние и доступность внешних сервисов (Рис. 9)
  • Количество успешно выполненных операций и ошибок
  • Исчерпание ресурсов (Рис. 10)

Рис. 9 (PRTG. Доступность веб-сайта по HTTP)

 

Рис. 10 (PRTG. Контроль истечения сертификата)

 

Факторы, влияющие на выбор системы мониторинга

Есть и много других типов метрик, которые могут быть полезны и в идеальной ситуации нужно отслеживать их все. Однако, это далеко не всегда является возможным или необходимым в той или иной ситуации.

Ниже мы постараемся описать несколько параметров, которыми можно руководствоваться для определения приоритетных метрик:

• Ресурсы.
При выборе системы мониторинга и ее функционала вам следует опираться на имеющиеся человеческие ресурсы, которым можно отнести, как компетентность сотрудников, так и их количество. Так же важными факторами является бюджет, который вы можете выделить для настройки системы мониторинга и размер инфраструктуры, для которой она будет настраиваться.

Концепт работы приложения или сервера.
Схема работы вашего приложения, сервера или системы так же прямо пропорционально влияет на выбор и настройку системы мониторинга. Одни и те же показатели для отдельно взятых элементов системы могут быть в одном случае критически важны, а в другом не иметь никакого значения. Правильная настройка такой системы мониторинга и взаимосвязи метрик для многих может показаться непосильной задачей, из-за чего некоторые и вовсе отказываются от внедрения систем мониторинга.  Здесь главное поддержать баланс и оставить только те метрики, которые действительно необходимы. Данный фактор часто поможет оценить необходимость переходу на другую архитектуру приложения, например, при аренде 1С на отдельном сервере.

Польза метрик.
Одним из наиболее важных факторов, влияющих на то, будут ли использоваться та или иная метрика – реальная полезность. Каждая дополнительная метрика увеличивает сложность системы мониторинга и потребляет ресурсы, в связи с этим, необходимо осознанно выбирать отслеживаемые параметры и то, как отслеживание этих параметров может помочь в будущем. Полезность мониторинга этих параметров также может меняться со временем, требуя повторной оценки приносимой пользы конкретной метрикой.

Важные качества системы мониторинга, метрик и оповещений

Несомненно, одним из важнейших качеств любой системы, в том числе и системы мониторинга, является независимое от других сервисов функционирование. Иногда использовать объединение тех или иных служб и сервисов достаточно удобно, но основные функции и принципы систем мониторинга стараются исключать необходимость реализации таких возможностей. Хотя каждая система мониторинга будет иметь свои сильные и слабые стороны, лучшие варианты часто имеют определенные качества. Стоит обратить на них внимание, степень важности которых является индивидуальной в каждом случае:

Отказоустойчивость.

Стабильность и время беспрерывной работы не является определяющим фактором при выборе системы мониторинга. Оценка данного фактора должна производиться, опираясь на тип и потребности проекта, для которого настраивается система мониторинга. В зависимости от этого и стоит производить распределение доступных ресурсов.

Простые в использовании, краткие и подробные отчеты

Возможность отображать сводную информацию, получать более детализированные инфографики по требованию - важная функция, показывающая потребность в удобных и понятных интерфейсах. Создание и настройка панелей мониторинга, которые представляют из себя общую сводку по имеющимся проблемам и вместе с этим являются областью с наиболее просматриваемыми данными, поможет специалисту понять состояние системы с первого взгляда. Динамическая настройка масштаба графиков, отключение ненужных показателей и наложение информации из нескольких систем – все это представляет собой интерактивный инструмент для работы специалиста, и от того, как настроен этот инструмент, будет зависеть эффективность работы специалиста.

Ведение истории

Система мониторинга наиболее полезна, когда имеет историю показателей. Системы мониторинга, обладающие гибкостью в работе с данными как при полной детализации, так и в выборочном формате, обеспечивают более широкий спектр возможностей для обработки постоянно растущего объема информации. Связанная с этим функция - это возможность управлять хранимыми данными. Если обязательным критерием является долгосрочное хранение истории метрик, а уменьшение глубины активно доступных данных не позволительно, более выгодным вариантом может стать выгрузка старых данных в архивное хранилище. В этом случае можно не поддерживать интерактивные исторические данные в системе мониторинга, что позволит уменьшить количество потребляемых ресурсов.

Взаимодействие с другими ресурсами

Система мониторинга отвечает за целостное представление информации о всей инфраструктуры для которой была настроена, поэтому она должна иметь возможность отображать связанную между собой информацию, даже если источником являются различные между собой системы или характеристики. Специалисты должны иметь возможность объединять данные, полученные из разных систем по своему усмотрению, чтобы иметь представление о состоянии инфраструктуры в целом.

•  Простота управления метриками

Чтобы система мониторинга точно отображала состоянии инфраструктуры, она должна быть максимально актуально, а это значит и легко масштабируема. На это влияет интерфейсные особенности системы мониторинга, ведь чем меньше итераций требуется для управления количеством метрик, тем проще это сделать, а значит и легче поддерживать систему мониторинга и ее работу в актуальном состоянии. Так же имеет значение и уровень сложности создания новых, до этого не использовавшихся метрик, и их распространение на уже наблюдаемые объекты.

Гибкая система оповещений

Одним из важнейших аспектов системы мониторинга для оценки, является ее система оповещений. Помимо требований к надежности, система оповещений должна быть достаточно гибкой, чтобы уведомлять специалистов через различные источники, и достаточно производительной, чтобы иметь возможность обрабатывать продуманные и эффективные триггеры уведомлений. Многие системы мониторинга используют сторонние сервисы для отправки оповещений, предлагая интеграцию с существующими мобильными и почтовыми службами.

Заключение

Сбор показателей, настройка системы мониторинга и оповещений – сложная часть создания и управления инфраструктурой, но, несомненно, эта часть так же является и неотъемлемой для обеспечение наибольшей отказоустойчивости систем и своевременного предупреждения, и решения возникающих проблем.

Возможность увидеть в любой момент времени, что происходит в системе или каждом конкретном объекте этой системы, а также предотвратить простои в работе этой системы благодаря своевременному реагированию, сложно переоценить. Но с другой стороны, внедрение и разработка системы мониторинга довольно трудоемкий и затратный процесс, о котором лучше задумать заблаговременно, ведь, чем позднее будет принято решение о внедрении и чем большим масштабом будет обладать система, тем сложнее и дороже будет реализация такого проекта.

Наша компания столкнулась с влиянием вышеописанных факторов на стадии внедрения системы мониторинга, мы протестировали различные системы и реализовали наиболее подходящий для нас и наших клиентов вариант. В настоящий момент наша система мониторинга наблюдает за функционированием сотен серверов клиентов, находящихся на нашем администрировании. Вы можете избежать всех трудностей внедрения такого сложного проекта воспользовавшись нашим администрированием в рамках услуги «Аренда сервера 1С» или VDS на Windows, и мы возьмем на себя все заботы о своевременном предотвращении всех возможных трудностей с производительностью и работой системы.

Потратив много времени на тонкую настройку системы мониторинга, и вложив весь наш опыт и ручной анализ показателей, мы теперь можем заранее предупреждать наших клиентов о возможных критических нагрузках еще до того, как это случилось, для принятия оперативных мер по увеличению ресурсов или уменьшению нагрузки если это возможно.