Справочник метрик

Все метрики группируются путём указания объекта иерархии, к которому они относятся. Например, метрики сервера, собираемые различными способами (локально с ОС или через протокол IPMI) должны быть отнесены к объекту типа node.

Метрики типа PROMQL

Метрики, получаемые из экспортеров, собираемые с инструментированных эндпоинтов или вычисляемые с использованием правил перезаписи Prometheus

Базовые метрики

Метрики, применяемые во всех ПАК

Состояние компонента мониторинга vmagent

Автоматически собираются после установки агента метрик.

Название Описание Генерируемые метки

vmagent_availability_status

Состояние доступности компонента мониторинга vmagent. Возвращает значение 0, если компонент недоступен. Возвращает значение 1, если компонент доступен.

Plagent

Автоматически собираются после установки Plagent.

Название Описание Генерируемые метки

plagent_build_info

Информация о версии, ревизии, ветке, goversion, на основе которого был собран plagent, а также goos и goarch

branch, revision, goarch, goversion, goos, tags, version

plagent_plugin_info

Информация об имени плагина и его версии

name, version

plagent_sudo_available

Статус доступности sudo во время запуска plagent

plagent_plugin_error_count

Количество ошибок вызова плагинов plagent

name

Описание меток:

  • branch - ветка,

  • revision - ревизия Plagent,

  • goarch - GOARCH,

  • goversion - версия Go,

  • goos - GOOS,

  • tags - теги,

  • version - версия компонента,

  • name - имя плагина.

Коммутатор

Собираются snmp_exporter’ом

Название Описание Генерируемые метки

ifAdminStatus

Желаемое состояние интерфейса — 1.3.6.1.2.1.2.2.1.7.

IfAlias, ifDescr, ifIndex, ifName

ifConnectorPresent

Этот объект имеет значение 1, если подуровень интерфейса имеет физический разъем, и значение 2 в противном случае. - 1.3.6.1.2.1.31.1.1.1.17

IfAlias, ifDescr, ifIndex, ifName

ifCounterDiscontinuityTime

Значение sysUpTime в последний раз, когда в одном или нескольких счетчиках этого интерфейса произошел сбой — 1.3.6.1.2.1.31.1.1.1.19.

IfAlias, ifDescr, ifIndex, ifName

ifHCInBroadcastPkts

Количество пакетов, доставленных этим подуровнем на более высокий (под)уровень, которые были адресованы по широковещательному адресу на этом подуровне - 1.3.6.1.2.1.31.1.1.1.9

IfAlias, ifDescr, ifIndex, ifName

ifHCInMulticastPkts

Количество пакетов, доставленных этим подуровнем на более высокий (под)уровень, которые были адресованы по многоадресному адресу на этом подуровне - 1.3.6.1.2.1.31.1.1.1.8

IfAlias, ifDescr, ifIndex, ifName

ifHCInOctets

Общее количество октетов, полученных по интерфейсу, включая символы кадрирования — 1.3.6.1.2.1.31.1.1.1.6

IfAlias, ifDescr, ifIndex, ifName

ifHCInUcastPkts

Количество пакетов, доставленных этим подуровнем на более высокий (под)уровень, которые не были адресованы по групповому или широковещательному адресу на этом подуровне - 1.3.6.1.2.1.31.1.1.1.7

IfAlias, ifDescr, ifIndex, ifName

ifHCOutBroadcastPkts

Общее количество пакетов, которые запросили передать протоколы более высокого уровня и которые были адресованы широковещательному адресу на этом подуровне, включая те, которые были отброшены или не отправлены - 1.3.6.1.2.1.31.1.1.1.13

IfAlias, ifDescr, ifIndex, ifName

ifHCOutMulticastPkts

Общее количество пакетов, которые запросили передать протоколы более высокого уровня и которые были адресованы многоадресному адресу на этом подуровне, включая те, которые были отброшены или не отправлены - 1.3.6.1.2.1.31.1.1.1.12

IfAlias, ifDescr, ifIndex, ifName

ifHCOutOctets

Общее количество октетов, передаваемых из интерфейса, включая символы кадрирования - 1.3.6.1.2.1.31.1.1.1.10.

IfAlias, ifDescr, ifIndex, ifName

ifHCOutUcastPkts

Общее количество пакетов, которые запросили передать протоколы более высокого уровня, и которые не были адресованы по групповому или широковещательному адресу на этом подуровне, включая те, которые были отброшены или не отправлены - 1.3.6.1.2.1.31.1.1.1.11

IfAlias, ifDescr, ifIndex, ifName

ifHighSpeed

Оценка текущей пропускной способности интерфейса в единицах 1 000 000 бит в секунду - 1.3.6.1.2.1.31.1.1.1.15

IfAlias, ifDescr, ifIndex, ifName

ifInBroadcastPkts

Количество пакетов, доставленных этим подуровнем на более высокий (под)уровень, которые были адресованы по широковещательному адресу на этом подуровне - 1.3.6.1.2.1.31.1.1.1.3

IfAlias, ifDescr, ifIndex, ifName

ifInDiscards

Количество входящих пакетов, которые были выбраны для отбрасывания, хотя ошибок не было обнаружено, чтобы предотвратить их доставку в протокол более высокого уровня - 1.3.6.1.2.1.2.2.1.13

IfAlias, ifDescr, ifIndex, ifName

ifInErrors

Для пакетно-ориентированных интерфейсов количество входящих пакетов, содержащих ошибки, препятствующие их доставке протоколу более высокого уровня - 1.3.6.1.2.1.2.2.1.14.

IfAlias, ifDescr, ifIndex, ifName

ifInMulticastPkts

Количество пакетов, доставленных этим подуровнем на более высокий (под)уровень, которые были адресованы по групповому адресу на этом подуровне - 1.3.6.1.2.1.31.1.1.1.2

IfAlias, ifDescr, ifIndex, ifName

ifInNUcastPkts

Количество пакетов, доставленных этим подуровнем на более высокий (под)уровень, которые были адресованы по групповому или широковещательному адресу на этом подуровне - 1.3.6.1.2.1.2.2.1.12

IfAlias, ifDescr, ifIndex, ifName

ifInOctets counter ifInOctets

Общее количество октетов, полученных по интерфейсу, включая символы кадрирования — 1.3.6.1.2.1.2.2.1.10.

IfAlias, ifDescr, ifIndex, ifName

ifInUcastPkts

Количество пакетов, доставленных этим подуровнем на более высокий (под)уровень, которые не были адресованы по групповому или широковещательному адресу на этом подуровне - 1.3.6.1.2.1.2.2.1.11

IfAlias, ifDescr, ifIndex, ifName

ifInUnknownProtos

Для пакетно-ориентированных интерфейсов количество полученных через интерфейс пакетов, которые были отброшены из-за неизвестного или неподдерживаемого протокола — 1.3.6.1.2.1.2.2.1.15.

IfAlias, ifDescr, ifIndex, ifName

ifIndex

Уникальное значение, большее нуля, для каждого интерфейса — 1.3.6.1.2.1.2.2.1.1.

IfAlias, ifDescr, ifIndex, ifName

ifLastChange

Значение sysUpTime на момент перехода интерфейса в текущее рабочее состояние — 1.3.6.1.2.1.2.2.1.9.

IfAlias, ifDescr, ifIndex, ifName

ifLinkUpDownTrapEnable

Указывает, следует ли генерировать ловушки linkUp/linkDown для этого интерфейса — 1.3.6.1.2.1.31.1.1.1.14.

IfAlias, ifDescr, ifIndex, ifName

ifMtu

Размер самого большого пакета, который можно отправить/получить на интерфейсе, указанный в октетах - 1.3.6.1.2.1.2.2.1.4.

IfAlias, ifDescr, ifIndex, ifName

ifNumber

Количество сетевых интерфейсов (независимо от их текущего состояния), присутствующих в этой системе. - 1.3.6.1.2.1.2.1

ifOutBroadcastPkts

Общее количество пакетов, которые запросили передать протоколы более высокого уровня и которые были адресованы на широковещательный адрес на этом подуровне, включая те, которые были отброшены или не отправлены - 1.3.6.1.2.1.31.1.1.1.5

IfAlias, ifDescr, ifIndex, ifName

ifOutDiscards

Количество исходящих пакетов, которые были выбраны для отбрасывания, даже если не было обнаружено ошибок, предотвращающих их передачу - 1.3.6.1.2.1.2.2.1.19

IfAlias, ifDescr, ifIndex, ifName

ifOutErrors

Для пакетно-ориентированных интерфейсов количество исходящих пакетов, которые не удалось передать из-за ошибок - 1.3.6.1.2.1.2.2.1.20.

IfAlias, ifDescr, ifIndex, ifName

ifOutMulticastPkts

Общее количество пакетов, которые запросили передать протоколы более высокого уровня и которые были адресованы многоадресному адресу на этом подуровне, включая те, которые были отброшены или не отправлены - 1.3.6.1.2.1.31.1.1.1.4

IfAlias, ifDescr, ifIndex, ifName

ifOutNUcastPkts

Общее количество пакетов, которые запросили передать протоколы более высокого уровня и которые были адресованы на многоадресный или широковещательный адрес на этом подуровне, включая те, которые были отброшены или не отправлены - 1.3.6.1.2.1.2.2.1.18

IfAlias, ifDescr, ifIndex, ifName

ifOutOctets

Общее количество октетов, передаваемых из интерфейса, включая символы кадрирования — 1.3.6.1.2.1.2.2.1.16.

IfAlias, ifDescr, ifIndex, ifName

ifOutQLen

Длина очереди выходных пакетов (в пакетах). - 1.3.6.1.2.1.2.2.1.21.

IfAlias, ifDescr, ifIndex, ifName

ifOutUcastPkts

Общее количество пакетов, которые запросили передать протоколы более высокого уровня и которые не были адресованы на групповой или широковещательный адрес на этом подуровне, включая те, которые были отброшены или не отправлены - 1.3.6.1.2.1.2.2.1.17

IfAlias, ifDescr, ifIndex, ifName

ifPhysAddress

Адрес интерфейса на подуровне протокола — 1.3.6.1.2.1.2.2.1.6.

IfAlias, ifDescr, ifIndex, ifName, ifPhysAddress

ifPromiscuousMode

Этот объект имеет значение false(2), если этот интерфейс принимает только пакеты/кадры, адресованные этой станции - 1.3.6.1.2.1.31.1.1.1.16

IfAlias, ifDescr, ifIndex, ifName

ifSpecific

Ссылка на определения MIB, специфичные для конкретного носителя, используемого для реализации интерфейса - 1.3.6.1.2.1.2.2.1.22

IfAlias, ifDescr, ifIndex, ifName

ifSpeed

Оценка текущей пропускной способности интерфейса в битах в секунду — 1.3.6.1.2.1.2.2.1.5

IfAlias, ifDescr, ifIndex, ifName

ifType_info

Тип интерфейса - 1.3.6.1.2.1.2.2.1.3 (EnumAsInfo)

IfAlias, ifDescr, ifIndex, ifName, ifType

sysUpTime

Время (в сотых долях секунды) с момента последней повторной инициализации части управления сетью системы. - 1.3.6.1.2.1.1.3

Метки:

  • ifAlias — описание или псевдоним интерфейса;

  • ifDescr — текстовое описание интерфейса;

  • ifIndex — уникальный индекс интерфейса в системе;

  • ifName — логическое имя интерфейса;

  • ifPhysAddress — физический (MAC) адрес интерфейса;

  • ifType — тип интерфейса (например, ethernetCsmacd).

Сервисы ОС

Собираются плагином systemd_exporter.

Название Описание Генерируемые метки

systemd_unit_info

Мета-дата про все unit

name, type, mount_type, service_type, state

systemd_unit_state

Состояние systemd unit

name, type

systemd_socket_refused_connections_total

Суммарное число отклонённых сокет-соединений

name

systemd_timer_last_trigger_seconds

Время, прошедшее с последнего триггера

name

systemd_watchdog_enabled

Сторожевой таймер запущен

systemd_watchdog_last_ping_monotonic_seconds

Время, прошедшее с момента последнего успешного сигнала watchdog от службы, измеренное в монотонных секундах

systemd_watchdog_last_ping_time_seconds

Время последнего успешного пинга от systemd watchdog

systemd_watchdog_runtime_seconds

Время работы службы с момента последнего успешного сигнала watchdog

systemd_unit_active_enter_time_seconds

Последний раз, когда unit перешёл в активное состояние

name

systemd_unit_active_exit_time_seconds

Последний раз, когда unit вышел из активного состояния

name

systemd_unit_inactive_enter_time_seconds

Последний раз, когда unit перешёл в неактивное состояние

name, type

systemd_unit_inactive_exit_time_seconds

Последний раз, когда unit вышел из неактивного состояния

name, type

systemd_unit_tasks_current

Текущее число задач на каждый systemd unit

name

systemd_unit_tasks_max

Максимальное число задач на каждый systemd unit

name, type

systemd_unit_start_time_seconds

Время запуска unit с 01.01.70

name, type

systemd_service_restart_total

Количество перезапусков службы

systemd_service_ip_egress_bytes

Общее количество исходящей информации в байтах

systemd_service_ip_ingress_bytes

Общее количество входящей информации в байтах

systemd_service_ip_ingress_packets_total

Общее количество входящих сетевых пакетов, отправленных службой

systemd_service_ip_egress_packets_total

Общее количество исходящих сетевых пакетов, отправленных службой

systemd_socket_accepted_connections_total

Суммарное количество принятых сокет-соединений

name

systemd_socket_current_connections

Текущее число сокет-соединений

name

Метки:

  • name — название юнита;

  • type — категория юнита (service, timer, target, mount, socket и т. д.).

  • mount_type — тип файловой системы для type="mount" (binfmt_misc, configfs, debugfs, ext4, - fusectl, hugetlbfs, mqueue, tracefs, vfat).

  • service_type — тип сервиса (simple, exec, forking, oneshot, dbus, notify, notify-reload, idle).

  • state — состояние юнита:

    • activating;

    • active;

    • deactivating;

    • failed;

    • inactive.

Метки:

Метрика Метки

systemd_unit_info

name, type, mount_type, service_type, state

systemd_unit_state

name, type

systemd_unit_tasks_current

name

systemd_unit_tasks_max

name

systemd_unit_start_time_seconds

name, type

systemd_socket_accepted_connections_total

name

systemd_socket_current_connections

name

systemd_socket_refused_connections_total

name

systemd_timer_last_trigger_seconds

name

systemd_unit_active_enter_time_seconds

name, type

systemd_unit_active_exit_time_seconds

name, type

systemd_unit_inactive_enter_time_seconds

name, type

systemd_unit_inactive_exit_time_seconds

name, type

МХД.О/ШлюзS3МодульКомпрессии

Собираются путем опроса Prometheus-эндпоинта компонента S3 шлюза — сервиса компрессии S3 (s3gateway-compression-server). Собирается s3gateway_compression_server_scraper

Название Описание Генерируемые метки

s3_compressor_after_compression_bytes

Размер данных после сжатия

s3_compressor_after_decompression_bytes

Размер данных после распаковки

s3_compressor_before_compression_bytes

Размер данных для сжатия

s3_compressor_before_decompression_bytes

Размер данных для распаковки

s3_compressor_build_info

Информация о сборке шлюза (в метках)

branch, goversion, revision, version

s3_compressor_compress_operations

Количество операций сжатия

s3_compressor_decompress_operations

Количество операций распаковки

Описание меток:

  • branch - Ветка сборки шлюза.

  • goversion - Версия go сборки.

  • revision - Ревизия сьорки

  • version - Версия сборки шлюза.

МХД.О/КластерS3

Собираются путем опроса Prometheus-эндпоинта компонента S3 шлюза - сервиса ostor (s3gateway-ostor-server) В данные момент метрики на согласовании, представлена текущая реализация. Собираются s3gateway_ostor_server_scraper

Название Описание Генерируемые метки

ostor_volume_service_state

Состояние конфигурации сервиса кластера S3

svc_id, svc_type, vol_id

ostor_volume_ready

Состояние конфигурации тенанта кластера S3

vol_id

ostor_host_info

Информация об узле хранения кластера S3

host_id, hostname, role, uri

ostor_host_services_count

Количество сервисов кластера S3 на узле

host_id, svc_status, svc_type

Описание меток:

  • svc_id — Идентификатор сервиса.

  • svc_type — Тип сервиса.

  • vol_id — Идентификатор тома.

  • host_id — Идентификатор узла.

  • hostname — Имя хоста.

  • role — Роль узла в кластере.

  • uri — URI для доступа к хранилищу.

  • svc_status — Статус сервиса.

МХД.О/Кластер Хранения

Собираются путем опроса Prometheus-эндпоинта компонента S3 шлюза - сервиса ostor (s3gateway-ostor-server) В данные момент метрики на согласовании, представлена текущая реализация. Собираются s3gateway_ostor_server_scraper

Название Описание Генерируемые метки

vstorage_cluster_space

Параметры объёма дискового пространства кластера хранения

cluster_name, type

vstorage_cluster_status

Информация о кластере хранения

cluster_id, cluster_name, status

vstorage_cs_chunks

Количество чанков CS по статусам кластера хранения

cluster_name, cs_id, status

vstorage_cs_replicas

Количество реплик CS кластера хранения

cluster_name, cs_id

vstorage_cs_space

Параметры объёма дискового пространства CS кластера хранения (в байтах)

cluster_name, cs_id, type

vstorage_cs_status

Статус CS кластера хранения

cluster_name, cs_host, cs_id, status

vstorage_mds_mem_usage

Использование памяти MDS кластера хранения

cluster_name, mds_id

vstorage_mds_status

Статус MDS кластера хранения

cluster_name, mds_host, mds_id, status

vstorage_mds_uptime

Время работы MDS кластера хранения

cluster_name, mds_id

Описание меток:

  • cluster_name — Имя кластера хранения.

  • type — Тип объёма дискового пространства.

  • cluster_id — Идентификатор кластера.

  • status — Статус компонента (например, "healthy", "blocked", "active").

  • cs_id — Идентификатор чанка CS.

  • cs_host — Хост, на котором находится CS.

  • mds_id — Идентификатор MDS.

  • mds_host — Хост, на котором находится MDS.

МВ.ВРМ

Собираются путем опроса Prometheus-эндпоинта компонента ВРМ.

Название Описание Генерируемые метки

supv_vrm_broker_active_connections

Активные соединения

vrm

supv_vrm_broker_active_sessions

Активные сессии

vrm

supv_vrm_health_all_ok

Общее состояние ВРМ

vrm

supv_vrm_health_broker_manager

Состояние брокер менеджера

vrm

supv_vrm_health_conf

Состояние конфигураций

vrm

supv_vrm_health_db_read

Состояние БД на чтение

vrm

supv_vrm_health_db_write

Состояние БД на запись

vrm

supv_vrm_health_redis_read

Доступ к КЭШ БД (Redis) на чтение

vrm

supv_vrm_health_redis_write

Доступ к КЭШ БД (Redis) на запись

vrm

Описание меток:

  • vrm - имя ВРМ.

МБД.П/Spectrum_agent

Собираются путем опроса Prometheus-эндпоинта компонента Spectrum_agent. Собираются spectrum_agent_scraper

Название Описание Генерируемые метки

spectrum_autovacuum_duration

Длительность процессов autovacuum секунд

spectrum_autovacuum_proc_count

Количество процессов autovacuum

spectrum_autovacuum_tx_until_wraparound

Транзакций до wraparound

spectrum_database_size_bytes

Размер базы данных байт

spectrum_lag_storage_flush_diff_bytes

Количество байт, записанных, но еще не сброшенных на диск на данной реплике

spectrum_lag_storage_pending_diff_bytes

Количество байт, ожидающих передачи на реплику

spectrum_lag_storage_replay_diff_bytes

Количество байт, сброшенных на диск, но еще не воспроизведённых на реплике

spectrum_lag_storage_total_lag_diff_bytes

Суммарное отставание реплики в байтах

spectrum_lag_storage_write_diff_bytes

Количество байт, переданных на реплику, но еще не записанных на диск

spectrum_postgresql_sessions_count

Количество сессий

spectrum_postgresql_sessions_count_total

Количество сессий общее

spectrum_postgresql_sessions_locks

Количество сессий в ожидании Lock

spectrum_table_dead_tuples_count

Таблицы по количеству dead tuples

spectrum_table_heap_blks_hit_count

Таблицы попаданию в буферный кеш

spectrum_table_heap_blks_read_count

Таблицы по чтению с диска

spectrum_table_size_bytes

Таблицы по объёму байт

spectrum_table_toast_size_bytes

Таблицы по объёму байт таблиц TOAST

spectrum_top10_table_dead_tuples_count_topk

Топ 10 таблиц по количеству dead tuples

spectrum_top10_table_heap_blks_hit_count_topk

Топ 10 таблиц по попаданию в буферный кеш

spectrum_top10_table_heap_blks_read_count_topk

Топ 10 таблиц по чтению с диска

spectrum_top10_table_size_bytes_topk

Топ 10 таблиц по объёму байт

spectrum_top10_table_toast_size_bytes_topk

Топ 10 таблиц по объёму байт таблиц TOAST

spectrum_wal_archiver_failed_count

Количество ошибок архивации WAL

spectrum_wal_count

Количество WAL

spectrum_wal_size_bytes

Объём WAL байт

spectrum_wal_temp_count

Количество WAL temp-файлов

spectrum_wal_temp_size_bytes

Объём WAL temp-файлов байт

spectrum_wal_time_from_last_checkpoint_sec

Время с последней записи контрольной точки (CHECKPOINT) секунд

МДИ.О/Patroni и PostgreSQL

Таблица метрик

Название метрики Описание

patroni_cluster_unlocked

Состояние блокировки кластера Patroni: 1 — разблокирован, 0 — заблокирован

patroni_dcs_last_seen

Время последней связи Patroni с DCS в формате Unix timestamp

patroni_failsafe_mode_is_active

Состояние аварийного режима (failsafe) Patroni: 1 — активен, 0 — нет

patroni_is_paused

Состояние паузы автоматического failover-переключения Primary/Replica (Patroni): 1 — пауза, 0 — нет

patroni_pending_restart

Состояние необходимости перезагрузки (Patroni): 1 — требуется, 0 — нет

patroni_postgres_in_archive_recovery

Режим восстановления из архива PostgreSQL (Patroni): 1 — активно, 0 — нет

patroni_postgres_running

Состояние PostgreSQL (Patroni): 1 — запущен, 0 — остановлен

patroni_postgres_server_version

Версия PostgreSQL (Patroni) в числовом формате

patroni_postgres_state

Числовое представление состояния PostgreSQL

patroni_postgres_streaming

Состояние потоковой репликации PostgreSQL (Patroni): 1 — streaming, 0 — нет

patroni_postgres_timeline

Состояние timeline PostgreSQL для узла Patroni: > 0 — текущая, 0 — не работает

patroni_postmaster_start_time

Время запуска Postmaster (Patroni) в формате Unix timestamp

patroni_primary

Роль узла Patroni: 1 — primary/лидер, 0 — replica

patroni_quorum_standby

Узел в роли кворумной реплики Patroni: 1 — кворумная, 0 — нет

patroni_replica

Узел в роли реплики Patroni: 1 — реплика, 0 — нет

patroni_standby_leader

Узел в роли standby-лидера Patroni: 1 — standby лидер, 0 — нет

patroni_sync_standby

Узел в роли синхронной реплики Patroni: 1 — синхронная, 0 — нет

patroni_version

Версия Patroni, целочисленное

patroni_xlog_location

Текущее местоположение записи WAL PostgreSQL для узла Patroni (для лидера)

patroni_xlog_paused

Состояние паузы журнала транзакций PostgreSQL для узла Patroni: 1 — пауза, 0 — нет

patroni_xlog_received_location

Текущее местоположение принятого WAL PostgreSQL для узла Patroni (для реплики)

patroni_xlog_replayed_location

Текущее местоположение воспроизведённого WAL PostgreSQL для узла Patroni (для реплики)

patroni_xlog_replayed_timestamp

Временная метка примененного WAL PostgreSQL для узла Patroni в формате Unix timestamp

Таблица меток

Описание меток:

  • scope — имя кластера Patroni/PostgreSQL.

  • name — имя узла Patroni в кластере.

Метки:

Метрика Метки

patroni_cluster_unlocked

scope, name

patroni_dcs_last_seen

scope, name

patroni_failsafe_mode_is_active

scope, name

patroni_is_paused

scope, name

patroni_pending_restart

scope, name

patroni_postgres_in_archive_recovery

scope, name

patroni_postgres_running

scope, name

patroni_postgres_server_version

scope, name

patroni_postgres_state

scope, name

patroni_postgres_streaming

scope, name

patroni_postgres_timeline

scope, name

patroni_postmaster_start_time

scope, name

patroni_primary

scope, name

patroni_quorum_standby

scope, name

patroni_replica

scope, name

patroni_standby_leader

scope, name

patroni_sync_standby

scope, name

patroni_version

scope, name

patroni_xlog_location

scope, name

patroni_xlog_paused

scope, name

patroni_xlog_received_location

scope, name

patroni_xlog_replayed_location

scope, name

patroni_xlog_replayed_timestamp

scope, name

VControl/Состояние кластера

Таблица метрик

Название метрики Описание

vcontrol_clickhouse_enabled

Статус включения ClickHouse

vcontrol_clickhouse_up

Статус работоспособности ClickHouse

vcontrol_db_read_state

Статус доступности ClickHouse для чтения

vcontrol_db_write_state

Статус доступности ClickHouse для записи

vcontrol_memdb_read_state

Статус доступности Redis для чтения

vcontrol_memdb_write_state

Статус доступности Redis для записи

vcontrol_redis_server_master

Является ли сервер Redis мастером

vcontrol_redis_server_subjective_status

Доступен ли сервер Redis с текущего хоста

vcontrol_redis_server_objective_status

Доступен ли сервер Redis с кластера

vcontrol_redis_server_master_connection

Подключен ли slave-сервер Redis к master

vcontrol_sentinel_status

Статус сервера Redis Sentinel

vcontrol_vip_status

Статус виртуального IP

vcontrol_backend_status

Статус сервера бэкенда

vcontrol_manager_status

Статус управляющих узлов

vcontrol_agent_status

Статус клиентских узлов

vcontrol_cluster_status

Статус кластера МВ.С

vcontrol_node_online_count

Статус узлов МВ.С

vcontrol_cluster_balancing_percent

Информация о балансировке кластера vControl

vcontrol_storage_info

Информация о типе хранилища vControl

vcontrol_storage_status

Статус работоспособности хранилища vControl

vcontrol_storage_memory_mbytes_total

Общий объём хранилища vControl в мегабайтах

vcontrol_storage_memory_mbytes_used

Использованный объём хранилища vControl в мегабайтах

Таблица меток

Метрика Название метки Описание метки

vcontrol_clickhouse_enabled

protocol

Протокол подключения

vcontrol_clickhouse_enabled

ip_address

Адрес БД ClickHouse

vcontrol_clickhouse_enabled

port

Порт БД ClickHouse

vcontrol_clickhouse_up

protocol

Протокол подключения

vcontrol_clickhouse_up

ip_address

Адрес БД ClickHouse

vcontrol_clickhouse_up

port

Порт БД ClickHouse

vcontrol_db_read_state

ip_address

Адрес основной БД

vcontrol_db_write_state

ip_address

Адрес основной БД

vcontrol_redis_server_master

ip_address

Адрес сервера Redis

vcontrol_redis_server_master

port

Порт

vcontrol_redis_server_subjective_status

ip_address

Адрес сервера Redis

vcontrol_redis_server_subjective_status

port

Порт сервера Redis

vcontrol_redis_server_objective_status

ip_address

Адрес сервера Redis

vcontrol_redis_server_objective_status

port

Порт сервера Redis

vcontrol_redis_server_master_connection

ip_address

Адрес сервера Redis

vcontrol_redis_server_master_connection

port

Порт

vcontrol_redis_server_master_connection

master_ip_address

Адрес мастера

vcontrol_redis_server_master_connection

master_port

Порт мастера

vcontrol_sentinel_status

ip_address

Адрес Sentinel

vcontrol_sentinel_status

port

Порт

vcontrol_vip_status

ip_address

Адрес

vcontrol_backend_status

ip_address

Адрес сервера бэкенда

vcontrol_backend_status

port

Порт

vcontrol_manager_status

ip_address

Адрес управляющего узла

vcontrol_manager_status

port

Порт

vcontrol_agent_status

ip_address

Адрес клиентского узла

vcontrol_agent_status

port

Порт

vcontrol_cluster_balancing_percent

cluster_id

ID кластера

vcontrol_storage_info

storage_name

Имя хранилища vControl

vcontrol_storage_info

storage_type

Тип хранилища vControl

vcontrol_storage_info

external_storage_id

ID хранилища vControl

vcontrol_storage_info

cluster_id

ID кластера, к которому относится хранилище

vcontrol_storage_status

external_storage_id

ID хранилища vControl

vcontrol_storage_status

cluster_id

ID кластера, к которому относится хранилище

vcontrol_storage_memory_mbytes_total

external_storage_id

ID хранилища vControl

vcontrol_storage_memory_mbytes_total

cluster_id

ID кластера, к которому относится хранилище

vcontrol_storage_memory_mbytes_used

external_storage_id

ID хранилища vControl

vcontrol_storage_memory_mbytes_used

cluster_id

ID кластера, к которому относится хранилище

Avanpost/Состояние FAM

Название метрики Описание

http_requests_error_in_flight

Количество запросов к Avanpost FAM, завершившихся с ошибкой

http_requests_in_flight

Количество запросов в систему Avanpost FAM, которые ещё не завершены

http_response_duration_bucket

Распределение продолжительности входящих запросов Avanpost FAM

http_response_duration_count

Общее количество входящих запросов Avanpost FAM

http_response_duration_sum

Суммарная продолжительность входящих запросов Avanpost FAM

idp_account_disable_counter

Количество отключенных учётных записей Avanpost FAM

idp_active_session_gauge

Количество активных сессий Avanpost FAM

idp_application_authentication_counter

Количество аутентификаций в каждом приложении Avanpost FAM

idp_authentication_factor_counter

Количество проверенных факторов аутентификации Avanpost FAM

idp_global_session_counter

Общее количество созданных сессий Avanpost FAM

idp_user_lock_counter

Общее количество блокировок пользователей Avanpost FAM

Таблица меток

Описание меток:

  • code - Код HTTP-ответа

  • method - HTTP-метод

  • factor - Фактор, по которому собрана статистика

  • application - Приложение, по которому собрана статистика

  • le - Квантиль

Метки:

Метрика Метка

idp_application_authentication_counter

application

idp_authentication_factor_counter

factor

http_response_duration_sum

code, method

http_response_duration_count

code, method

http_response_duration_bucket

code, method, le

Метрики типа LOGSQL

Метрики, получаемые на основе логов

МХД.О

Имя метрики Описание Формула Период сбора

s3gw_proxy_http_response

Коды ответов сервера за последнюю минуту

filename:"/var/log/skala-s3gw-proxy/proxy.log"|time:1m | extract "<> <_> <_> <_> <_> <_> <_> <code> "| stats by (code, _pak_id,hostname) count(*) as count

1m

s3gw_control_http_response

Коды ответов сервера за последнюю минуту

filename:"/var/log/skala-s3gw-control/control.log"|time:1m | extract "<> <_> <_> <_> <_> <_> <_> <code> "| stats by (code, _pak_id,hostname) count(*) as count

1m

Метки для всех метрик:

  • code - Код состояния HTTP