Learn Promethus

一点历史

  • Google Borgmon
  • 原生云基金会(CNCF)
  • Prometheus Server
  • Client SDK
  • Exporters
  • Alert Manager
  • Push Gateway
  • PromQL
Prometheus Push Gateway Native
ElasticSearch Native collector
InfluxDB Native metricbeat

类似系统的推和拉

Metrics 格式

<metric name>{<label name>=<label value>, ...}

各个部分需符合相关的正则表达式

  • metric name: [a-zA-Z:][a-zA-Z0-9:]*
  • label name: [a-zA-Z0-9_]*
  • label value: .* (即不限制)

AlertManager

  • 报警分组 :将报警分组,当报警大量出现的时候,只会发一条消息告诉你数据库挂了的情况出现了 100 次,而不是用 100 条推送轰炸你;
  • 报警抑制 :显然,当数据库出问题的时候,其它的应用可肯定会出问题,这时候你可能不会需要其它的不相干的报警短信,这个功能将真正有用的信息及时通知你;
  • 报警静默 :一些不重要的报警,可以完全忽略,因此也就没有必要通知;

可视化

Grafana

PromQL

Learn Prometheus

By Richard Yu

Learn Prometheus

Notes about prometheus

  • 670