比如,對(duì)于使用來(lái)prometheus的alertmanager來(lái)做node報(bào)警,rules配置可以參考如下點(diǎn)進(jìn)行配置即可。
說(shuō)明
不同的node-exporter版本,對(duì)應(yīng)的metrics也不一樣,需要自己對(duì)照更改一下。
CPU監(jiān)控
(1 – avg(irate(node_cpu{mode=\”idle\”}[10m])) by (instance)) * 100 < 90
內(nèi)存監(jiān)控
((node_memory_MemTotal – node_memory_MemFree) / node_memory_MemTotal) * 100 < 90
磁盤IO監(jiān)控
(max(avg(irate(node_disk_io_time_ms[10m])) by (instance, device)) by (instance))/10
文件系統(tǒng)可用空間監(jiān)控
max(((node_filesystem_size{fstype=~\”ext4|vfat\”} – node_filesystem_free{fstype=~\”ext4|vfat\”}) / node_filesystem_size{fstype=~\”ext4|vfat\”}) * 100) by (instance) > 90
關(guān)于k8s node alertmanager監(jiān)控報(bào)警配置方法是什么就分享到這里了,希望以上內(nèi)容可以對(duì)大家有一定的幫助,可以學(xué)到更多知識(shí)。如果覺得文章不錯(cuò),可以把它分享出去讓更多的人看到。
更多關(guān)于云服務(wù)器,域名注冊(cè),虛擬主機(jī)的問題,請(qǐng)?jiān)L問西部數(shù)碼官網(wǎng):m.ps-sw.cn