监控平台系列-Grafana

监控平台系列 监控服务端Promethues 监控采集器Exporter 告警服务端Altermanager 告警中间件PrometheusAlert 监控展示Grafana 写在前面 施工中

监控平台系列-Prometheus

监控平台系列 监控服务端Promethues 监控采集器Exporter 告警服务端Altermanager 告警中间件PrometheusAlert 监控展示Grafana 写在前面 在使用之前,有一些常用的概念需要掌握,才能更好的理解为什么需要如此配置prometheus。 Prometheus局限 Prometheus 作为一个基于指标(Metric)的监控系统,在设计上就放弃了一部分数据准确性: 比如在两次采样的间隔中,内存用量有一个瞬时小尖峰,那么这次小尖峰我们是观察不到的; 再比如 QPS、RT、P95、P99 这些值都只能估算,无法和日志系统一样做到 100% 准确,下面也会讲一个相关的坑。 放弃一点准确性得到的是更高的可靠性,这里的可靠性体现为架构简单、数据简单、运维简单。假如你维护过 ELK 或其它日志架构的话,就会发现相比于指标,日志系统想要稳定地跑下去需要付出几十倍的机器成本与人力成本。 既然是权衡,那就没有好或不好,只有适合不适合,我推荐在应用 Prometheus 之初就要先考虑清楚这个问题,并且将这个权衡明确地告诉使用方。 irate与rate区别 irate和rate都会用于计算某个指标在一定时间间隔内的变化速率。但是它们的计算方法有所不同:irate取的是在指定时间范围内的最近两个数据点来算速率,而rate会取指定时间范围内所有数据点,算出一组速率,然后取平均值作为结果。 所以官网文档说:irate适合快速变化的计数器,而rate适合缓慢变化的计数器 Prometheus安装

监控平台系列-PrometheusAlert

监控平台系列 监控服务端Promethues 监控采集器Exporter 告警服务端Altermanager 告警中间件PrometheusAlert 监控展示Grafana 写在前面 施工中

Keepalived踩坑日志

本文介绍keepalived高可用的部署方式 ...

Beats部署

本文介绍Beat7.4.0如何部署 ...

日志平台系列-Kibana

本文介绍Kibana7.4.0如何部署 ...