Справочник метрик

Все метрики группируются путём указания объекта иерархии, к которому они относятся. Например, метрики сервера, собираемые различными способами (локально с ОС или через протокол IPMI) должны быть отнесены к объекту типа node.

Метрики типа PROMQL

Метрики, получаемые из экспортеров, собираемые с инструментированных эндпоинтов или вычисляемые с использованием правил перезаписи Prometheus

Базовые метрики

Метрики, применяемые во всех ПАК

Состояние компонента мониторинга vmagent

Автоматически собираются после установки агента метрик.

vmagent_availability_status

Состояние доступности компонента мониторинга vmagent:

  • 0 — недоступен;

  • 1 — доступен.

Plagent

Автоматически собираются после установки Plagent.

plagent_build_info

Информация о версии, ревизии, ветке, goversion, на основе которого был собран plagent, а также значения переменных окружения GOOS и GOARCH.

Метки:

  • branch — название ветки;

  • goarch — значение переменной окружения GOARCH;

  • goos — значение переменной окружения GOOS;

  • goversion — версия Golang;

  • revision — ревизия plagent;

  • tags — список тегов;

  • version — версия компонента.

plagent_plugin_info

Информация о названии и версии плагина.

Метки:

  • name — название плагина;

  • version — версия компонента.

plagent_sudo_available

Статус доступности sudo во время запуска plagent.

plagent_plugin_error_count

Количество ошибок вызова плагинов plagent.

Метка name — название плагина.

Avanpost/Состояние FAM

Название метрики Описание

http_requests_error_in_flight

Количество запросов к Avanpost FAM, завершившихся с ошибкой

http_requests_in_flight

Количество запросов в систему Avanpost FAM, которые ещё не завершены

http_response_duration_bucket

Распределение продолжительности входящих запросов Avanpost FAM

http_response_duration_count

Общее количество входящих запросов Avanpost FAM

http_response_duration_sum

Суммарная продолжительность входящих запросов Avanpost FAM

idp_account_disable_counter

Количество отключенных учётных записей Avanpost FAM

idp_active_session_gauge

Количество активных сессий Avanpost FAM

idp_application_authentication_counter

Количество аутентификаций в каждом приложении Avanpost FAM

idp_authentication_factor_counter

Количество проверенных факторов аутентификации Avanpost FAM

idp_global_session_counter

Общее количество созданных сессий Avanpost FAM

idp_user_lock_counter

Общее количество блокировок пользователей Avanpost FAM

Таблица меток

Описание меток:

  • code - Код HTTP-ответа

  • method - HTTP-метод

  • factor - Фактор, по которому собрана статистика

  • application - Приложение, по которому собрана статистика

  • le - Квантиль

Метки:

Метрика Метка

idp_application_authentication_counter

application

idp_authentication_factor_counter

factor

http_response_duration_sum

code, method

http_response_duration_count

code, method

http_response_duration_bucket

code, method, le

Метрики типа LOGSQL

Метрики, получаемые на основе логов

МХД.О

Имя метрики Описание Формула Период сбора

s3gw_proxy_http_response

Коды ответов сервера за последнюю минуту

filename:"/var/log/skala-s3gw-proxy/proxy.log"|time:1m | extract "<> <_> <_> <_> <_> <_> <_> <code> "| stats by (code, _pak_id,hostname) count(*) as count

1m

s3gw_control_http_response

Коды ответов сервера за последнюю минуту

filename:"/var/log/skala-s3gw-control/control.log"|time:1m | extract "<> <_> <_> <_> <_> <_> <_> <code> "| stats by (code, _pak_id,hostname) count(*) as count

1m

Метки для всех метрик:

  • code - Код состояния HTTP