日志平台系列-Filebeat

本文介绍Filebeat7.4.0如何部署 ...

日志平台系列-Filebeat

本文介绍Filebeat7.4.0如何部署 ...

日志平台系列-Fluentd

本文介绍Fluentd如何部署 ...

Nginx运维笔记

本文介绍nignx相关内容 ...

监控平台系列-Altermanager

监控平台系列 监控服务端Promethues 监控采集器Exporter 告警服务端Altermanager 告警中间件PrometheusAlert 监控展示Grafana 写在前面 施工中 告警示例 变色方法 <font color=\"#0000FF\"> Test Content </font> 模板 #### <font color="#00DB00">以下为测试报警,别紧张,吃个仙贝镇定一下</font> {{ $var := .externalURL}}{{ range $k,$v:=.alerts }} {{if eq $v.status "resolved"}} --------------------------------------------------------- #### <font color="#00DB00">故障恢复!</font> ###### **告警类型**:{{$v.labels.alertname}} {{if eq $v.labels.severity "灾难"}} ###### **告警级别**:<font color="#FF0000">{{$v.labels.severity }}</font> {{else if eq $v.labels.severity "严重"}} ###### **告警级别**:<font color="#FF8C00">{{$v.labels.severity }}</font> {{else}} ###### **告警级别**:<font color="#FFD700">{{$v.labels.severity }}</font> {{end}} ###### **开始时间**:{{GetCSTtime $v.startsAt}} ###### **结束时间**:{{GetCSTtime $v.endsAt}} ###### **故障主机**:{{$v.labels.nodeip}} ###### **故障详情**:{{$v.annotations.description}} {{else}} --------------------------------------------------------- #### <font color="#FF0000">发生故障!</font> **告警类型**:{{$v.labels.alertname}} {{if eq $v.labels.severity "灾难"}} ###### **告警级别**:<font color="#FF0000">{{$v.labels.severity }}</font> {{else if eq $v.labels.severity "严重"}} ###### **告警级别**:<font color="#FF8C00">{{$v.labels.severity }}</font> {{else}} ###### **告警级别**:<font color="#FFD700">{{$v.labels.severity }}</font> {{end}} ###### **开始时间**:{{GetCSTtime $v.startsAt}} ###### **故障主机**:{{$v.labels.nodeip}} ###### **故障详情**:{{$v.annotations.description}} {{end}} {{ end }}

监控平台系列-Exporter

监控平台系列 监控服务端Promethues 监控采集器Exporter 告警服务端Altermanager 告警中间件PrometheusAlert 监控展示Grafana Exporter安装 官方exporter下载地址汇总 Windows-exporter安装 ✅ 程序下载 Windows-exporter的下载地址 选择 windows_exporter-{{版本号}}-amd64.msi 注意是amd64.msi结尾 ✅ 程序安装 将程序上传到服务器桌面,执行以下命令,注意修改程序版本号 不包含mssql监控 msiexec /i C:\Users\Administrator\Desktop\windows_exporter-{{版本号}}-amd64.msi ENABLED_COLLECTORS=cpu,net,os,memory,process,tcp,textfile,cs,logical_disk,service,system /quiet 包含mssql监控 msiexec /i C:\Users\Administrator\Desktop\windows_exporter-{{版本号}}-amd64.msi ENABLED_COLLECTORS=cpu,net,os,memory,process,tcp,mssql,textfile,cs,logical_disk,service,system /quiet ✅ 防火墙开启 如果系统开启了防火墙,那么需要配置防火墙规则放通9182端口 netsh advfirewall firewall add rule name="windows-exporter" dir=in action=allow protocol=TCP localport=9182 ✅ job配置 prometheus.yaml配置 - job_name: windows-exporter scrape_interval: 15s scrape_timeout: 10s metrics_path: /metrics scheme: http file_sd_configs: - refresh_interval: 10s files: - "/etc/config/jobs/windows.yaml" windows.yaml配置(通过文件挂载映射进容器) 多个主机使用不通签 - job_name: 'dev_app_01' static_configs: - targets: ['192.168.1.117:9182'] labels: os: WINDOWS env: dev - job_name: 'test_app_01' static_configs: - targets: ['192.168.2.217:9182'] labels: os: WINDOWS env: test 多个主机使用相同标签 - job_name: 'test_app_01' static_configs: - targets: - 192.168.2.217:9182 - 192.168.2.218:9182 - 192.168.2.219:9182 labels: os: WINDOWS env: test ✅ rule配置 groups: - name: windows主机信息 rules: - alert: CPU使用 expr: round(100 - (avg by (instance) (irate(windows_cpu_time_total{mode="idle"}[5m])) * 100),0.01) > 60 for: 10m labels: severity: 严重 annotations: summary: "{{$labels.instance}} CPU使用率过高!" description: "{{$labels.instance}} CPU使用大于60%(目前使用:{{$value}}%)" - alert: 内存使用 expr: round(100 - ((windows_os_physical_memory_free_bytes / windows_cs_physical_memory_bytes) * 100),0....