МБД.П - Сводная информация о кластере
Дашборд отображает информацию о состоянии Patroni, VIP-manager и etcd.
Информация о VIP-manager
Таблица VIP-manager отображает данные о текущем размещении VIP:
-
Общее состояние — работоспособность VIP-manager.
-
Узел — название узла, на который сейчас указывает VIP.
-
Признак VIP на узле — наличие VIP на узле.
-
Состояние VIP-сервиса — состояние службы systemd VIP-manager на узле
-
VIP-роль — роль узла в кластере VIP-manager.
Информация о Patroni
Общая информация
Панель выводит сводную информацию о кластере:
-
Версия Patroni — версия Patroni на узлах кластера.
-
Состояние PostgreSQL — если PostgreSQL работает, в этой колонке выводится значение On.
-
Узел — название узла.
-
Время запуска Postmaster — дата и время последнего запуска Postmaster.
Детально
Панель выводит более подробную информацию об узлах кластера:
-
Узел — название узла.
-
Роль узла — действующая роль узла в кластере.
-
Лаг репликации в байтах — отставание реплики от мастера, выраженное в байтах.
-
Лаг репликации в секундах — отставание реплики от мастера, выраженное в секундах.
-
Время последней связи с DCS — дата и время последнего подключения Patroni к распределённому хранилищу конфигурации (Distributed Configuration Store, DCS).
Мониторинг ETCD
Статус здоровья и текущий лидер ETCD
Статус etcd:
-
Узел — название узла.
-
Кол-во успешных health checks — количество успешных проверок состояния etcd.
-
Кол-во неуспешных health checks — количество проверок состояния etcd, завершившихся ошибкой.
-
Является лидером — является ли узел лидером:
-
0 — нет;
-
1 — да.
-
-
Кол-во смен лидера — количество раз, когда узел становился лидером.
-
Является learner — в этой колонке выводится значение
1, если узел является учеником, то есть присоединился к кластеру, но ещё не получил логи лидера и потому не имеет права голоса при выборе нового лидера.
Метрики производительности операций диска и снапшотов
Таблица содержит следующие колонки:
-
Узел — название узла.
-
Кол-во неудачных proposals — количество неудачных предложений. Обычно это связано с двумя проблемами:
-
временный сбой, вызванный выборами нового лидера;
-
длительные простои из-за потери кворума в кластере.
-
-
Кол-во вызовов fsync() для WAL — системный вызов
fsync()используется для немедленной записи данных из оперативной памяти в хранилище. В данном случае в хранилище записываются части WAL, находящиеся в оперативной памяти. -
Число подтверждённых записей — количество раз, когда реплика подтвердила запись WAL в хранилище.
-
Аномально высокая продолжительность снимка — количество раз, когда запись WAL в хранилище длилась больше 5 минут.