就Prometheus而言,pull
拉取采样点的端点服务称之为instance,通常对应一个过程(实例)。具有相同目的的instance,例如,为可伸缩性或可靠性而复制的流程称为job
。, 则构成了一个job
例如, 一个被称作api-server的job
有四个相同的instance
。
- job:
api-server
- instance 1:
1.2.3.4:5670
- instance 2:
1.2.3.4:5671
- instance 3:
5.6.7.8:5670
- instance 4:
5.6.7.8:5671
- instance 1:
当Prometheus拉取一个目标,会自动地把两个标签添加到度量名称的标签列表中,分别是:
- job: 目标所属的配置任务名称。
- instance: 被抓取的目标网址的一部分务:
host:port
如果以上两个标签二者之一存在于采样点中,这个取决于honor_labels
配置选项。详见文档
对于每个采样点所在服务instance,Prometheus都会存储以下的度量指标采样点:
up{job="[job-name]", instance="instance-id"}
:1
,表示采样点所在服务健康;0
,标识抓取失败scrape_duration_seconds{job="[job-name]", instance="[instance-id]"}
: 抓取的持续时间scrape_samples_post_metric_relabeling{job="<job-name>", instance="<instance-id>"}
: 应用度量标准重新标记后剩余的样本数。scrape_samples_scraped{job="<job-name>", instance="<instance-id>"}
: 目标暴露的样本数量。scrape_series_added{job="<job-name>", instance="<instance-id>"}
: 此scrape
中新系列的大概数量。 v2.10的新功能
up
度量指标对服务健康的监控是非常有用的。