8 Управление кластерами вычислительных узлов

Все описанные в данном разделе операции относятся только к кластерам Pacemaker/Corosync.

8.1 Остановка кластера

Операция остановки возможна для кластеров, имеющих статус "ДОСТУПЕН" или "ДЕГРАДИРОВАН".

  1. Выбрать раздел ОБЪЕКТЫ УПРАВЛЕНИЯ  Кластеры.

  2. Нажать кнопку вызова меню действий с кластером и выбрать пункт "Остановить кластер":

    image219
  3. В окне подтверждения действия нажать кнопку Остановить:

    image220

    В правом верхнем углу страницы появится всплывающее сообщение о запуске операции:

    image221

    В процессе выполнения операции для останавливаемого кластера и для всех его объектов вместо элементов управления вызова меню действий отображаются вращающиеся спиннеры.

    По нажатию кнопки Перейти во всплывающем сообщении будет осуществлен переход на страницу "Операции". В верхней строке таблицы операций появится операция остановки кластера и статус её выполнения.

    Если выполнение операции прошло успешно:

    • Статусы всех задач операции – "ВЫПОЛНЕНА":

      image222

      При нажатии кнопки image125 справа от статуса задачи открывается окно просмотра логов выбранной задачи. Если задача завершена с ошибкой, то в окне просмотра появляется вкладка "Ошибки" с информацией об ошибке.

    • При переходе на страницу "Кластеры" отображается статус остановленного кластера "ОТКЛЮЧЁН".

    • При переходе на страницу "Узлы" для всех узлов остановленного кластера отображается статус "ОСТАНОВЛЕН".

    • При переходе на страницу "Сервисы СУБД" для соответствующих остановленному кластеру сервисов отображается статус "НЕДОСТУПЕН".

    • При нажатии на имя сервиса список экземпляров сервиса отображается со статусом "ОСТАНОВЛЕН".

    • Для всех узлов, сервисов и экземпляров сервисов остановленного кластера в меню действий все пункты будут недоступны.

8.2 Запуск кластера

Операция запуска возможна для кластеров в статусе "ОТКЛЮЧЁН".

  1. Выбрать раздел ОБЪЕКТЫ УПРАВЛЕНИЯ  Кластеры.

  2. Нажать кнопку вызова меню действий с кластером и выбрать пункт "Запустить кластер":

    image223
  3. В окне подтверждения действия нажать кнопку Запустить:

    image224

    В правом верхнем углу страницы появится всплывающее сообщение о старте операции:

    image225

    В процессе выполнения операции для останавливаемого кластера и для всех его объектов вместо элементов управления вызова меню действий отображаются вращающиеся спиннеры.

    По нажатию кнопки Перейти во всплывающем сообщении будет осуществлен переход на страницу "Операции". В верхней строке таблицы операций отображается операция запуска кластера и статус её выполнения.

    Если выполнение операции запуска кластера прошло успешно:

    • статусы всех задач операции – "ВЫПОЛНЕНА":

      image226

      При нажатии кнопки image125 справа от статуса задачи открывается окно просмотра логов выбранной задачи. Если задача завершена с ошибкой, то в окне просмотра появляется вкладка "Ошибки" с информацией об ошибке.

    • При переходе на страницу "Кластеры" отображается статус запущенного кластера "ДОСТУПЕН".

    • При переходе на страницу "Узлы" для всех узлов запущенного кластера отображается статус "ДОСТУПЕН".

    • При переходе на страницу "Сервисы СУБД" для соответствующих запущенному кластеру сервисов также отображается статус "ДОСТУПЕН".

Статус сервисов кластера может отличаться от "ДОСТУПЕН", если на момент остановки кластера сервис был деградирован или остановлен.

  • При нажатии на имя сервиса отображается список экземпляров сервиса со статусами "ЗАПУЩЕН".

Статус экземпляров сервисов кластера может отличаться от "ЗАПУЩЕН", если на момент остановки кластера экземпляры сервиса имели иной статус.

8.3 Изменение дополнительных параметров кластера

  1. Выбрать раздел ОБЪЕКТЫ УПРАВЛЕНИЯ  Кластеры.

  2. Выбрать кластер, для которого нужно изменить дополнительные параметры, нажать соответствующую кнопку вызова меню действий и выбрать пункт "Изменить дополнительные параметры кластера":

    image227

    Откроется первая страница "Кластер" окна "Изменение дополнительных параметров кластера":

    image228
  3. При необходимости:

    • Указать описание кластера.

      Описание появляется при наведении курсора на элемент вызова информации image229 справа от имени кластера:

      image230
    • Указать тэги.

    • Установить флаг "Автоматический возврат узла в кластер после перезагрузки".

      По окончании ввода данных нажать кнопку Следующий шаг.

      Откроется вторая страница "Узлы СХД":

      image231
  4. Выбрать пользователя для доступа к узлам СХД, ввести виртуальный IP-адрес СХД и IP-адреса узлов СХД. Для добавления адресов дополнительных узлов СХД нужно нажимать на кнопку + Добавить:

    image232

    Для изменения очередности IP-адресов узлов нужно нажимать соответствующие кнопки image233, image234 или image235.

    Если узлы СХД ранее были настроены, их параметры будут отображены и доступны для изменения:

    image236

    Для удаления ненужного IP-адреса нажать соответствующую кнопку image237.

    Если хотя бы для одного из сервисов кластера имеется расписание на любом из узлов СХД, редактирование списка узлов СХД и изменение пользователя будут недоступны. При наведении курсора на элемент вызова информации image238 появляется всплывающая подсказка с соответствующим пояснением. При этом для блока "Узлы СХД" исчезает кнопка + Добавить, у строк IP-адресов узлов исчезает кнопка удаления:

    image239

    По окончании ввода данных нажать кнопку Изменить.

    В правом верхнем углу страницы отобразится всплывающее сообщение о запуске операции:

    image240

    По нажатию кнопки Перейти во всплывающем сообщении будет осуществлен переход к разделу "Операции". Новая операция со статусом "НОВАЯ" и, далее, со статусом "ЗАВЕРШЕНА" отобразится в верхней строке.

    Если выполнение операции изменения дополнительных параметров кластера прошло успешно:

    • статусы всех задач операции - "ВЫПОЛНЕНА":

      image241
    • данные в окне "Изменение дополнительных параметров кластера" отображаются в соответствии с изменениями, внесёнными на шаге 4.

  • Если флаг "Автоматический возврат узла в кластер после перезагрузки" установлен, то в случае автоматического перезапуска узла в разделе ИСТОРИЯ  События в списке событий будут присутствовать записи.

  • Если кластерное ПО было успешно перезапущено, будет отображена запись "Failover: Узел <имя_узла> перезапущен успешно", важность события - "ИНФОРМАТИВНОЕ", например:

image242
  • Если кластерное ПО не было перезапущено вследствие того, что узел был штатно остановлен, будет отображена запись "Failover: Перезапуск узла <имя_узла> не выполнен - узел был штатно остановлен", важность события - "ИНФОРМАТИВНОЕ", например:

image243
  • Если кластерное ПО не было перезапущено из-за отсутствия в кластере кворума (был остановлен другой узел), будет отображена запись "Failover: Перезапуск узла <имя_узла> не выполнен - нет кворума", важность события - "ПРЕДУПРЕЖДАЮЩЕЕ", например:

image244

8.4 Создание отчетов Cluster Report

  1. Выбрать раздел ОБЪЕКТЫ УПРАВЛЕНИЯ  Кластеры.

  2. Выбрать кластер, для которого нужно создать отчёт Cluster Report, нажать соответствующую кнопку и выбрать пункт "Создать отчет Cluster Report":

    image245

    или нажать кнопку Создать на вкладке Диагностика  Отчеты Cluster Report соответствующего кластера:

    image246

    Откроется окно "Создание отчета Cluster Report для кластера <…​>":

    image247
  3. В окне нужно выбрать временной период (указать даты начала и окончания) и отметить узлы, для которых необходимо создать отчет.

  4. Нажать кнопку Создать.

    В правом верхнем углу страницы отобразится всплывающее сообщение о запуске операции:

    image248

    В процессе выполнения операции для кластера, над которым запущена операция создания отчёта, и для всех его объектов вместо элементов управления вызова меню действий отображаются вращающиеся спиннеры.

    По нажатию кнопки Перейти во всплывающем сообщении будет осуществлен переход на страницу "Операции". В верхней строке таблицы операций отображается операция создания отчёта и статус её выполнения.

    Если выполнение операции прошло успешно:

    • статусы всех задач операции – "ВЫПОЛНЕНА":

      image249
    • на странице Диагностика  Отчеты Cluster Report соответствующего кластера отображается созданный отчёт:

      image250

      Если для создания отчёта были выбраны более 1 узла, то формируется по отчёту на каждый выбранный узел.

      Для скачивания отчёта нажать на его имя, при этом будет вызван стандартный интерфейс браузера для сохранения файлов. Файл отчёта имеет формат tar.bz2.

8.5 Удаление кластера из "Спектра"

Для удаления (снятия с регистрации) кластера нужно выполнить следующие действия.

  1. Выбрать раздел ОБЪЕКТЫ УПРАВЛЕНИЯ  Кластеры.

  2. Выбрать кластер, который нужно удалить, нажать соответствующую кнопку и выбрать пункт "Удалить из Спектра":

    image251
  3. В окне подтверждения действия нажать кнопку Удалить:

    image252

    В правом верхнем углу страницы появится всплывающее сообщение о запуске операции удаления кластера из "Спектра":

    image253

    По нажатию кнопки Перейти во всплывающем сообщении будет осуществлен переход на страницу "Операции". Операция удаления кластера из "Спектра" со статусом "НОВАЯ" и, далее, со статусом "ЗАВЕРШЕНА" появится в верхней строке.

    image254

    При нажатии кнопки image125 справа от статуса задачи открывается окно просмотра логов выбранной задачи. Если задача завершена с ошибкой, то в окне просмотра появляется вкладка "Ошибки" с информацией об ошибке.

  4. Перейти в раздел ОБЪЕКТЫ УПРАВЛЕНИЯ  Кластеры и убедиться, что удалённый кластер не отображается.

8.6 Добавление сервиса

Если при установке "Спектра" не был введен корректный IP-адрес, по которому доступно ПО "Скала^р "Геном"-Управление", пункт меню "Добавление сервиса" для всех кластеров будет недоступен.

Операция добавления сервиса возможна для кластеров, имеющих статус "ДОСТУПЕН".

  1. Выбрать раздел ОБЪЕКТЫ УПРАВЛЕНИЯ  Кластеры.

  2. Выбрать кластер, в который нужно добавить сервис, нажать соответствующую кнопку вызова меню действий и выбрать пункт "Добавить сервис":

    image255
  3. Откроется первая страница "Общие данные" окна ввода данных сервиса:

    image256

    На странице заполнить (выбрать) следующие параметры сервиса:

    • Имя сервиса (поле обязательно для заполнения).

    • Порт (поле обязательно для заполнения).

    • Размер WAL-сегмента (выбирается из ряда 16-32-64-128-256 Мб).

    • Флаг "Применять контрольные суммы на страницах данных (data-checksums)" (установлен по умолчанию). Определяет, будут ли применяться контрольные суммы на страницах данных для выявления сбоев при вводе / выводе.

    • Флаг "Стартовать сервис" (установлен по умолчанию). Определяет, будет ли запущен сервис PostgreSQL после создания. Если флаг не установлен, сервис PostgreSQL не будет запущен ни на одном из узлов кластера и не будет доступен для пользователя. Для запуска сервиса необходимо будет выполнить операцию "Запустить сервис" из "Спектра" после его создания.

      По окончании ввода данных нажать кнопку Следующий шаг.

      Откроется вторая страница "IP-адреса" окна ввода данных создаваемого сервиса:

      image257
  4. В поля страницы ввести необходимые IP-адреса.

    При вводе в поля одинаковых IP-адресов появляется соответствующее сообщение об ошибке:

    image258

    По окончании ввода данных нажать кнопку Следующий шаг.

    Откроется третья страница "Параметры" окна ввода данных создаваемого сервиса:

    image259
  5. В трёх выпадающих списках выбрать необходимые настройки локализации и нажать кнопку Следующий шаг.

    Откроется четвертая страница "Проверка" окна добавления сервиса:

    image260
  6. В случае необходимости возможно перейти к редактированию блоков параметров по соответствующим ссылкам image261.

  7. После визуальной проверки корректности всех введённых данных нажать кнопку Проверить. Появится окно проверки:

    image262

    После завершения автоматической проверки, при отсутствии ошибок, отображается сообщение о возможности запуска операции добавления сервиса:

    image263

    При успешном прохождении проверки кнопка Проверить меняется на кнопку Добавить.

    При наличии ошибок появится сообщение об ошибке и необходимости исправления параметров. Для параметров появится указание, какие из них некорректны и почему:

    image264

    Кнопка Проверить становится недоступной до корректировки введенных данных.

    Для изменения неверных данных нажать на элемент управления image265 для блока параметров с ошибками и на соответствующей странице ввести корректные значения.

    С помощью кнопок Следующий шаг вернуться на страницу проверки и снова запустить автоматическую проверку параметров.

  8. После успешного завершения проверки нажать кнопку Добавить.

    Появится всплывающее сообщение о старте операции добавления сервиса:

    image266

    В процессе выполнения операции для кластера, в который входит добавляемый сервис, и для всех его объектов вместо элементов управления вызова меню действий отображаются вращающиеся спиннеры.

    По нажатию кнопки Перейти во всплывающем сообщении будет осуществлен переход на страницу "Операции". В верхней строке таблицы операций отображается операция добавления сервиса и статус её выполнения.

    Если выполнение операции добавления сервиса прошло успешно:

    • Статусы всех задач операции – "ВЫПОЛНЕНА":

      image267

      При нажатии кнопки image125 справа от статуса задачи открывается окно просмотра логов выбранной задачи. Если задача завершена с ошибкой, то в окне просмотра появляется вкладка "Ошибки" с информацией об ошибке.

    • При переходе в раздел "Сервисы СУБД" отображается созданный сервис:

      image268

      В случае, если при создании сервиса флаг "Стартовать сервис" был установлен, новый сервис будет иметь статус "ДОСТУПЕН", если флаг был снят – статус сервиса будет "ОСТАНОВЛЕН".

    • При нажатии на имя сервиса отображается вкладка "Обзор", на которой указаны введённые на шаге 4 IP-адреса и роли:

      image269
    • на странице "Кластеры" для кластера, в который добавлен сервис, количество отображаемых сервисов увеличилось на 1:

      image270
    • при нажатии на имя кластера, в который добавлен сервис, на вкладке "Сервисы" отображается таблица-схема сервисов кластера, в которой присутствует добавленный сервис:

      image271

Известные проблемы:

Название Описание Способ решения

Не добавляется сервис для импортированного вручную кластера.

Если кластер был развёрнут без использования "Геном.БР", то не срабатывает проверка параметров при добавлении нового сервиса, добавление сервиса невозможно.

Будет исправлено в будущих версиях, добавление сервиса будет реализовано средствами "Спектра" без использования "Геном.БР".

8.7 Перемещение ролей сервисов между узлами

Операция перемещения ролей сервисов возможна для сервисов со статусом "ДОСТУПЕН" на кластерах, также имеющих статус "ДОСТУПЕН".

  1. Выбрать раздел ОБЪЕКТЫ УПРАВЛЕНИЯ  Кластеры.

  2. Нажать на имя кластера, в котором необходимо произвести перемещение ролей сервисов. Откроется страница со вкладками дополнительной информации о кластере.

  3. Перейти на вкладку "Сервисы":

    image272

    Для локальных компонентов геокластера вкладка "Сервисы" отображается в следующем виде:

    image273

    Роли LEAF и CASCADE недоступны для перемещения.

  4. Для сервисов (строки таблицы) выбрать целевое расположение ролей на нужных узлах (столбцы таблицы):

    image274
    • у экземпляра сервиса, который ранее имел роль, выбранную на изменяемом узле, роль изменится на ту, которая была у изменяемого экземпляра сервиса;

    • изменённые роли обоих экземпляров сервиса будут выделены красной рамкой;

    • кнопка Применить станет доступна;

    • рядом с кнопкой Применить появится новая доступная кнопка Отменить изменения;

    • слева над таблицей ролей сообщение "Нет изменений" сменяется сообщением "N сервисов будут изменены", где N - количество изменённых сервисов.

  5. Нажать кнопку Применить.

  6. В окне подтверждения операции "Изменение ролей на сервисах" нажать кнопку Изменить роли:

    image275

    Появится всплывающее сообщение о старте операции:

    image276

    При этом отображаемые роли изменяемых экземпляров временно возвратятся в исходное состояние, так как в процессе выполнения операции показывается текущее распределение ролей.

    По нажатию кнопки Перейти во всплывающем сообщении будет осуществлен переход на страницу "Операции". В верхней строке таблицы операций отображается операция перемещения ролей экземпляров сервиса между узлами и статус её выполнения.

    Если выполнение операции перемещения ролей экземпляров сервиса между узлами прошло успешно:

    • Статусы всех задач операции – "ВЫПОЛНЕНА":

      image277

      При нажатии кнопки image125 справа от статуса задачи открывается окно просмотра логов выбранной задачи. Если задача завершена с ошибкой, то в окне просмотра появляется вкладка "Ошибки" с информацией об ошибке.

    • Распределение ролей экземпляров сервисов соответствует заданному на шаге 4.

    • На вкладке "Обзор" в блоке "История изменений" отображается соответствующее изменение ролей:

      image278
  7. Если в процессе выполнения одной из задач операции возникла ошибка, выполнение операции останавливается:

    image279a

    Для просмотра логов задачи с ошибкой нужно нажать кнопку image125 справа от статуса задачи с ошибкой. Откроется окно просмотра, в котором на вкладке "Ошибки" появится информация об ошибке:

    image280

    Для сохранения информации об ошибке в файл нужно нажать кнопку Скачать.

    Для перезапуска операции необходимо устранить причину ошибки, нажать на соответствующую перезапускаемой операции кнопку и далее выбрать пункт "Перезапустить операцию":

    image281

    В окне подтверждения нажать кнопку Перезапустить:

    image282

    Появится всплывающее сообщение об успешном перезапуске операции:

    image283

    Если перезапущенная операция завершится успешно:

    • Статусы всех задач операции будут "ВЫПОЛНЕНА".

      Если с момента первоначального запуска операции до ее перезапуска положение ролей сервисов изменилось, например, в результате ручных манипуляций над кластером, и не соответствует ожидаемому в операции, то операция снова завершится с ошибкой.

    • Распределение ролей экземпляров сервисов будет соответствовать заданному в процессе выполнения шага 4.