Prometheus使用案例
2024年12月15日我某天想了解下网络监控工具,搜了一圈,发现Prometheus挺热门,就决定用它了。
实际用起来才发现,这玩意挺复杂,不是那种下载安装就能run的。我费了大半天劲,才把它跑起来。
主要复杂的地方在于Prometheus是插件式的,要管理它的众多插件。
Prometheus本身并不进行监控,它是一个时序数据库,带web管理系统,支持按多种条件,对监控事件进行时序查询。
具体监控任务,交给插件进行,Prometheus体系里把监控插件叫做exporter。比如,监控本机的系统资源,cpu, mem, disk, bandwidth等等,由一个叫node_exporter的插件完成。
如果监控外部资源,比如网站的url,那就使用一个叫黑盒(blackbox_exporter)的插件。黑盒的意思是不需要在被监控服务器上部署这个插件,而是从外部暴露的接口进行监控。
同样,告警也是由一个叫做alertmanager的插件完成。这个插件管理具体的告警方式,比如邮件告警、短信告警的发送和接收渠道。但是,触发告警的rules,还是在Prometheus本身的配置文件里设置。
原文我写在一个pdf里,请阅读完整内容: