Основы мониторинга: базовые термины и метрики

Мониторинг предоставляет администраторам информацию о состоянии инфраструктуры с помощью подробных графиков и настраиваемых предупреждений.

Данное руководство знакомит вас с основными показателями и некоторыми терминами мониторинга.

Основные метрики

Состояние системы можно отследить с помощью большого количества различных метрик. В этом разделе вы узнаете об основных метриках инфраструктуры, а также о методах их отслеживания и использования.

  • Коэффициент использования ЦП отображает долю занятости процессора в процентах на текущий момент.
  • Использование памяти – это доля занятости общего объема памяти сервера. Эта метрика выражается в процентах от общей доступной физической памяти. Эта доля рассчитывается путем вычитания объёма свободной памяти и памяти, используемой для кэширования, из общего объема памяти сервера.
  • Дисковый ввод-вывод – это метрика, которая отображает количество операций чтения и записи на сервере (выражается в мегабайтах в секунду).
  • Использование диска – метрика, которая отображает текущую  занятость дискового пространства (выражается в процентах от общего дискового пространства, доступного на сервере). Эта метрика учитывает корневое хранилище сервера и любые дополнительные блочные устройства хранения. Значения каждого отдельного устройства хранения объединяются в одно значение, которое представляет общее пространство памяти сервера.
  • Пропускная способность – это метрика, которая отображает количество входящего и исходящего трафика, который проходит по сетевым интерфейсам сервера (выражается в мегабайтах в секунду). Вы можете отдельно отслеживать пропускную способность публичного интерфейса (который подключается к Интернету) и показатель трафика частного интерфейса (он позволяет осуществлять обмен данными в ЦОД и отслеживается только тогда, когда включена частная сеть).
  • Основные процессы – это метрика, которая отображает процессы, потребляющие наибольшее количество ЦП или памяти (процессы, потребляющие выбранный  ресурс, указываются по убыванию). Также указывается процент использования тем или иным процессом всех доступных ресурсов.

Терминология

Для лучшего понимания технологии мониторинга следует ознакомиться с её базовыми терминами и понятиями.

  • Ресурс в информационных технологиях – базовый компонент с ограниченной доступностью. К ресурсам относятся ЦП, память, дисковое пространство и полоса пропускания.
  • Метрика – это стандарт для измерения ресурса компьютера. Метрики могут ссылаться либо на ресурс и единицы измерения, либо на данные, собранные об этом ресурсе.
  • Единица измерения – стандартный способ измерения того или иного значения.
  • Процентные соотношения определяют значение в зависимости от общего доступного объёма ресурса (указывают долю от 100%). Такие значения хорошо подходят для описания состояния ресурса, объём которого известен (например, для дискового пространства).
  • Точка данных (или значение) – это величина, которая представляет состояние того или иного объекта/процесса/ресурса.
  • Набор данных – это коллекция связанных точек данных.
  • Данные временного ряда – это данные, регулярно собираемые через определённый промежуток времени и упорядоченные в хронологическом порядке (это позволяет анализировать изменения данных с течением времени).
  • Тренд – это общая тенденция развития данных во времени. Тренд отображает изменения данных и позволяет прогнозировать их.
  • Мониторинг – это процесс сбора и визуализации данных о состоянии системы/инфраструктуры, который предоставляет администраторам важную информацию о ресурсах и позволяет быстро отреагировать на изменение поведения системы
  • Мониторинг использования системы – это тип мониторинга, который отслеживает системные ресурсы.
  • Система оповещений позволяет настраивать отправку предупреждений в случае, если определенные показатели выходят за пределы ожидаемых диапазонов.
  • Пороговое значение – это значение, определяющее границу между нормальным и ненормальным использованием того или иного ресурса.
  • Интервал предупреждений – это период времени, в течение которого пороговое значение должно быть превышено (после чего система отправит извещение).

Заключение

Мониторинг позволяет получить больше информации о потреблении ресурсов инфраструктуры. Визуализируя собранные данные об использовании ресурсов, вы можете получить представление о производительности системы, закономерностях и трендах потребления ресурсов. Система оповещений своевременно известит вас, если использование ресурсов выйдет за допустимые пределы.

Читайте также:

Tags: , , , , , ,

Добавить комментарий