МБД.П - Сводная информация о кластере

Дашборд МБД.П  МБД.П - Сводная информация о кластере отображает информацию о состоянии Patroni, VIP-manager и etcd.

Информация о VIP-manager

Таблица VIP-manager отображает данные о текущем размещении VIP:

  • Общее состояние — работоспособность VIP-manager.

  • Узел — название узла, на который сейчас указывает VIP.

  • Признак VIP на узле — наличие VIP на узле.

  • Состояние VIP-сервиса — состояние службы systemd VIP-manager на узле

  • VIP-роль — роль узла в кластере VIP-manager.

Информация о Patroni

Общая информация

Панель выводит сводную информацию о кластере:

  • Версия Patroni — версия Patroni на узлах кластера.

  • Состояние PostgreSQL — если PostgreSQL работает, в этой колонке выводится значение On.

  • Узел — название узла.

  • Время запуска Postmaster — дата и время последнего запуска Postmaster.

Детально

Панель выводит более подробную информацию об узлах кластера:

  • Узел — название узла.

  • Роль узла — действующая роль узла в кластере.

  • Лаг репликации в байтах — отставание реплики от мастера, выраженное в байтах.

  • Лаг репликации в секундах — отставание реплики от мастера, выраженное в секундах.

  • Время последней связи с DCS — дата и время последнего подключения Patroni к распределённому хранилищу конфигурации (Distributed Configuration Store, DCS).

Смены ролей

Роли узлов по времени

График смены ролей узлов.

Легенда:

  • Primary — лидер (мастер PostgreSQL).

  • Sync standby — резервный лидер.

  • Replica — реплика.

Мониторинг ETCD

Статус здоровья и текущий лидер ETCD

Статус etcd:

  • Узел — название узла.

  • Кол-во успешных health checks — количество успешных проверок состояния etcd.

  • Кол-во неуспешных health checks — количество проверок состояния etcd, завершившихся ошибкой.

  • Является лидером — является ли узел лидером:

    • 0 — нет;

    • 1 — да.

  • Кол-во смен лидера — количество раз, когда узел становился лидером.

  • Является learner — в этой колонке выводится значение 1, если узел является учеником, то есть присоединился к кластеру, но ещё не получил логи лидера и потому не имеет права голоса при выборе нового лидера.

Метрики производительности операций диска и снапшотов

Таблица содержит следующие колонки:

  • Узел — название узла.

  • Кол-во неудачных proposals — количество неудачных предложений. Обычно это связано с двумя проблемами:

    • временный сбой, вызванный выборами нового лидера;

    • длительные простои из-за потери кворума в кластере.

  • Кол-во вызовов fsync() для WAL — системный вызов fsync() используется для немедленной записи данных из оперативной памяти в хранилище. В данном случае в хранилище записываются части WAL, находящиеся в оперативной памяти.

  • Число подтверждённых записей — количество раз, когда реплика подтвердила запись WAL в хранилище.

  • Аномально высокая продолжительность снимка — количество раз, когда запись WAL в хранилище длилась больше 5 минут.