Node
Дашборд отображает метрики выбранного узла.
Для перехода к дашборду:
-
Авторизуйтесь в Grafana.
-
На панели навигации выберите Dashboards.
-
В дереве дашбордов найдите узел .
| Подробное описание метрик см. в документации ядра Linux. |
Quick CPU / Mem Disk
Basic CPU / Mem / Net / Disk
CPU Basic
График потребления ресурсов CPU.
Легенда:
-
Busy System — выполнение задач на уровне ядра.
-
Busy User — выполнение задач на уровне пользователя.
-
Busy Iowait — ожидание завершения задач ввода/вывода.
-
Steal — выполнение задач других ОС, запущенных в режиме виртуализации.
-
Idle — режим ожидания.
-
Busy Other — прочие задачи.
Memory Basic
График потребления RAM и раздела подкачки.
Легенда:
-
RAM Total — общее количество установленной RAM.
-
RAM Used — используемое количество RAM.
-
RAM Cache + Buffer — количество RAM, занятой под кеш и буферы.
-
RAM Free — количество свободной RAM.
-
SWAP Used — используемое пространство раздела подкачки.
CPU / Memory / Net / Disk
CPU
График потребления ресурсов CPU.
Легенда:
-
System — выполнение задач на уровне ядра.
-
User — выполнение задач на уровне пользователя.
-
Nice — выполнение задач на уровне пользователя, но с изменённым приоритетом.
-
Idle — режим ожидания.
-
Iowait — ожидание завершения задач ввода/вывода.
-
Irq — обслуживание системных прерываний.
-
Softirq — обслуживание «мягких» системных прерываний.
-
Steal — выполнение задач других ОС, запущенных в режиме виртуализации.
Memory Stack
График потребления RAM и раздела подкачки.
Легенда:
-
Apps — количество RAM, использованной приложениями, запущенными в пользовательском режиме.
-
PageTables — количество страниц физической памяти, отображаемой в виртуальное адресное пространство.
-
SwapCache — количество памяти, которая занята данными из раздела подкачки, но пока не была изменена.
-
Slab — количество памяти, занятой кешем данных внутренних структур ядра.
-
Cache — файловый кеш (данные, ассоциированные с файлами).
-
Buffers — дисковый кеш (данные, ассоциированные с дисковыми устройствами).
-
Unused — свободная память.
-
Swap — используемое пространство раздела подкачки.
-
Hardware Corrupted — память, отмеченная ядром как повреждённая.
Network Traffic
Подробный график нагрузки на сетевые интерфейсы.
В колонке Name выводится название сетевого интерфейса и тип операции:
-
Receive — приём пакетов.
-
Transmit — скорость передачи пакетов.
Disk Space Used
Подробный график использования хранилища.
В колонке Name выводится название раздела.
Disk IOps
График количества операций ввода/вывода в хранилище.
В колонке Name выводится название дискового устройства и тип операции:
-
Reads completed — завершённые операции чтения.
-
Writes completed — завершённые операции записи.
Memory Meminfo
Memory Active / Inactive
График использования оперативной памяти.
В колонке Name выводится тип операции и краткое описание:
-
Inactive — объём редко используемой оперативной памяти.
-
Active — объём часто используемой оперативной памяти.
Memory Commited
График использования виртуального адресного пространства.
Легенда:
-
Commited_AS — объём доступной памяти в виртуальном адресном пространстве.
-
CommitLimit — ограничение на размер виртуального адресного пространства.
Memory Active / Inactive Detail
Подробный график использования оперативной памяти.
В колонке Name выводится название метрики и её краткое описание:
-
Inactive_file — количество памяти, освобождённой при очистке файлового кеша.
-
Inactive_anon — количество памяти, освобождённой от анонимного кеша и кеша раздела подкачки, в том числе содержимого разделов
tmpfs. -
Active_file — количество памяти, занятой файловым кешем.
-
Active_anon — количество памяти, занятой анонимным кешем и кешем раздела подкачки, в том числе содержимым разделов
tmpfs.
Memory Writeback and Dirty
График записи изменённых страниц памяти на диск («сброс» страниц памяти).
В колонке Name выводится тип операции и краткое описание:
-
Writeback — количество памяти, которая активно записывается на диск.
-
WritebackTmp — количество памяти, занятой временными дисковыми буферами FUSE.
-
Dirty — количество памяти, которая ожидает записи на диск.
Memory Shared and Mapped
График использования разделяемой (shared) и сопоставленной (mapped) памяти.
В колонке Name выводится тип разделения или отображения:
-
Mapped — количество памяти, используемой сопоставленными страницами, например, библиотеками.
-
Shmem — общая память, используемая пользовательскими процессами и разделами
tmpfs. -
ShmemHugePages — разделяемая память и память
tmpfs, занятая в огромных страницах. -
ShmemPmdMapped — объём разделяемой памяти, возвращённой в огромные страницы.
Memory Slab
Использование кеша структурами ядра (Slab, in-kernel data structures cache):
-
SUnreclaim — часть Slab, которая не может быть восстановлена при сжатии памяти.
-
SReclaimable — часть Slab, которая может быть восстановлена при сжатии памяти, например, кеш.
Memory VMalloc
График использования виртуального адресного пространства памяти.
В колонке Name выводится информация о виртуальном адресном пространстве:
-
VmallocChunk — размер наибольшего свободного непрерывного блока в виртуальном адресном пространстве.
-
VmallocTotal — общий размер виртуального адресного пространства.
-
VmallocUsed — объём использованного виртуального адресного пространства.
Memory Anonymous
График использования анонимных страниц памяти.
В колонке Name выводится название типа страниц:
-
AnonHugePages — огромные анонимные страницы памяти.
-
AnonPages — пользовательские страницы памяти, не связанные с файлами.
Memory Kernel / CPU
График использования оперативной памяти структурами ядра.
В колонке Name выводится название типа памяти ядра:
-
KernelStack — память основных структур ядра.
-
PerCPU — память, используемая динамически загружаемыми модулями ядра.
Memory HugePages Counter
График изменения количества огромных страниц:
-
HugePages_Free — количество не выделенных страниц.
-
HugePages_Rsvd — количество страниц, которые были запрошены на выделение, но выделить их не удалось.
-
HugePages_Surp — количество огромных страниц в пуле, превышающее значение в
/proc/sys/vm/nr_hugepages.
Подробное описание параметров см. в документации ядра Linux.
Memory HugePages Size
График изменения размера огромных страниц:
-
HugePages — общий размер пула огромных страниц.
-
Hugepagesize — размер огромной страницы.
Memory DirectMap
Количество оперативной памяти, напрямую сопоставленной (mapped) со страницами различных размеров:
-
DirectMap1G — страницы размером 1 ГБ.
-
DirectMap2M — страницы размером 2 МБ.
-
DirectMap4K — страницы размером 4 КБ.
Memory Unevictable and MLocked
График изменения количества оперативной памяти, защищённой от выгрузки.
-
Unevictable — количество оперативной памяти, страницы которой не могут быть выгружены.
-
MLocked — количество оперативной памяти, страницы которой заблокированы от выгрузки на диск системным вызовом
mlock()илиmlockall().
Memory Vmstat
Memory Pages In / Out
Количество страниц оперативной памяти, загруженных с диска или выгруженных на него:
-
Pagesin — количество страниц, загруженных с диска;
-
Pagesout — количество страниц, выгруженных на диск.
Memory Pages Swap In / Out
График обмена страниц памяти с разделом подкачки.
В колонке Name выводится тип операции:
-
Pswpin — перенос страниц из оперативной памяти на раздел подкачки.
-
Pswpout — перенос страниц с раздела подкачки в оперативную память.
Memory Page Faults
График отказов при выполнении операций со страницами памяти.
В колонке Name выводится название группы операций:
-
Pgfault — сумма значений Pgmajfault и Pgminfault.
-
Pgmajfault — отказы при выполнении основных операций со страницами памяти.
-
Pgminfault — отказы при выполнении дополнительных операций со страницами памяти.
System Timesync
График отклонения системного времени от эталонных часов:
-
Estimated error in seconds — оценочный размер отклонения в секундах.
-
Time offset between local system and reference clock — смещение между локальными и эталонными часами.
-
Maximum error in seconds — оценочный размер максимального отклонения между локальными и эталонными часами.
Time PLL Adjust
PLL, Phase-Locked Loop — состояние цепи обратной связи, используемой для синхронизации частоты локального генератора с эталонным, чтобы минимизировать разницу во времени.
System Processes
Processes Status
График изменения статуса процессов в разрезе ввода/вывода.
-
Processes blocked waiting for I/O to complete — количество процессов, ожидающих завершения операций ввода/вывода.
-
Processes in runnable state — количество выполняемых процессов.
Processes State
Количество процессов, находящихся в одном из состояний:
-
D — непрерывный режим ожидания (ждёт освобождения ресурсов или сигнала);
-
I — незанятый поток ядра;
-
R — запущен или доступен для выполнения;
-
S — прерываемый режим ожидания (ожидает завершения события).
-
T — остановлен сигналом управления задачами.
-
Z — процесс-«зомби»: завершён, но ещё не обработан родительским процессом.
| Отображаются только состояния, в которых находится хотя бы один процесс. |
Processes Memory
График использования оперативной памяти процессами.
-
Processes virtual memory size in bytes — размер виртуального адресного пространства, занятого процессами, в байтах.
-
Maximum amount of virtual memory available in bytes — максимальный размер виртуального адресного пространства в байтах.
System Misc
Storage Disk
Сведения о хранилище узла.
Time Spent Doing I/Os
График изменения количества процессорного времени, затраченного на выполнение задач ввода/вывода.
Storage Filesystem
Network Traffic
Network Traffic by Packets
График изменения скорости приёма и отправки пакетов сетевыми интерфейсами узла, пакетов в секунду.
Network Traffic Errors
График изменения количества ошибок приёма и отправки пакетов сетевыми интерфейсами узла, пакетов в секунду.
Network Traffic Carrier
График изменения количества физических или логических каналов, по которым выполняется передача данных.
NF Conntrack
График изменения количества данных, отслеживаемых через подсистему nfnetlink.
-
NF conntrack entries — объём данных, обработанных с помощью
nfnetlink. -
NF conntrack limit — ограничение на объём данных, которые могут быть обработаны с помощью
nfnetlink.
Подробности см. в документации ядра Linux.
Network Sockstat
Информация об использовании сокетов.
Sockstat TCP
График изменения количества TCP-сокетов:
-
TCP_alloc — количество доступных TCP-сокетов.
-
TCP_inuse — количество используемых TCP-сокетов.
-
TCP_orphan — количество используемых TCP-сокетов, которые никому не принадлежат.
-
TCP_tw — количество TCP-сокетов, ожидающих закрытия.
Sockstat UDP
График изменения количества UDP-сокетов:
-
UDPLITE_inuse — количество используемых сокетов Udplite.
-
UDP_inuse — количестве используемых UDP-сокетов.
-
UDP_mem — количество оперативной памяти, занятой UDP-сокетами.
Network Netstat
UDP Errors
График изменения количества ошибок обработки UDP-пакетов:
-
InErrors — дейтаграммы UDP, которые не могут быть доставлены приложению.
-
NoPorts — дейтаграммы, отправленные на порт, который никто не слушает.
-
InErrors Lite — дейтаграммы UDPLite, которые не могут быть доставлены приложению.
TCP In / Out
График изменения количества сегментов TCP:
-
InSegs — количество принятых сегментов, в том числе принятых с ошибкой.
-
OutSegs — количество отправленных сегментов, включая активные подключения, но за вычетом пересланных октетов.
TCP Errors
График изменения количества ошибок TCP:
-
ListenOverflows — переполнение очереди ожидания сокета.
-
ListenDrops — игнорирование SYN-пакетов.
-
TCPSynRetrans — количество повторных попыток отправить TCP SYN-пакет для начала трёхстороннего рукопожатия.
-
RetransSegs — количество пересланных сегментов, содержащих переданные ранее октеты.
-
InErrs — ошибки получения сегментов, например, несовпадение контрольной суммы пакета TCP.
TCP Connections
График изменения количества подключений, находящихся в активном статусе или ожидающих закрытия.
TCP SynCookie
График изменения количества SYN cookie:
-
SyncookiesFailed — ошибки получения SYN cookie.
-
SyncookiesRecv — полученные SYN cookie.
-
SyncookiesSent — отправленные SYN cookie.
Node Exporter
Графики состояния node_exporter.