最新文章

开箱即用的 Prometheus 告警规则集

开箱即用的 Prometheus 告警规则集

在配置系统监控的时候,是不是即使绞尽脑汁监控的也还是不够全面,或者不知如何获取想要的指标。 Awesome Prometheus alerts 维护了一套开箱即用的 Prometheus 告警规则集合,有 300 多个告警规则。同时,还是说明如何获取对应的指标。这些规则,对每个 Prometheus 都是通用的。 涉及如主机、硬件、容器等基础资源,到数据库、消息代理、运行时、反向代理、负责均衡器,运行时、服务编排,甚至是网络层面和 Prometheus 自身和集群。 Prometheus 的安装和配置不做赘述,配置可以看这里。下面简单看下几个常用规则 主机和硬件资源 主机和硬件资源的告警依赖 node-exporter 输出的指标。例如: 内存不足 可用内存低于阈值 10% 就会触发告警。 - alert: HostOutOfMemory expr: node_memory_MemAvailable_bytes / node_memory_MemTotal_bytes * 100 < 10 for: 2m labels: severity: warning annotations: summary: Host out of memory (instance {{ $labels.

服务网格平稳落地:Istio 中精准控制 Sidecar 的注入

服务网格平稳落地:Istio 中精准控制 Sidecar 的注入

为什么 说起服务网格,这幅图大家肯定不会陌生。这就是服务网格的网络,也是网格架构的终极形态。 那在迁移到网格架构之前,我们的系统是什么样的? 我们的系统在演进的过程中,不可避免的会遇到各种 0 到 1 过程中的中间态。比如下面这种,可以比较 …

About Me

张晓辉

英文名 Addo。 资深程序员,LF APAC 开源布道师,CNCF Ambassador,云原生社区管委会成员,公众号“云原生指北”作者,微软 Azure MVP。 曾任职于汇丰软件、唯品会、数人云、小鹏汽车,有多年的微服务和基础架构实践经验,主要工作涉及微服务、容 …

进一步了解