Node Exporter

概述

参考:

Node Exporter 用于收集服务器的 metrics,比如 内存、cpu、磁盘、I/O、电源、etc. 。Node Exporter 将采集各种指标的代码逻辑抽象称为 Node 的 Collector(采集器)。每类指标都对应一个 Collector,比如 cpu 采集器、meminfo 采集器、etc. 这些名称通常都能直观得看到想要采集的指标是什么

node_exporter 默认监听在 9100 端口上。

Prometheus Server 抓取 metrics 的位置 http://IP:9100/metrics # 获取 node_exporter 所在主机的 metrics 信息

Node Exporter 部署

二进制文件安装 node_exporter

为监控服务器 CPU、内存、磁盘、I/O 等信息,首先需要安装 node_exporter。node_exporter 的作用是服务器数据收集。

export VERSION="1.6.0"
wget https://github.com/prometheus/node_exporter/releases/download/v${VERSION}/node_exporter-${VERSION}.linux-amd64.tar.gz
# 解压
mkdir -p /usr/local/prometheus/node_exporter
tar -zxvf node_exporter-${VERSION}.linux-amd64.tar.gz -C /usr/local/prometheus/node_exporter --strip-components=1
  • 创建 node_exporter 的 systemd 服务,在这里可以看到官方提供的 systemd 样例
tee /usr/lib/systemd/system/node-exporter.service > /dev/null << EOF
[Unit]
Description=node_exporter
After=network.target
[Service]
Type=simple
User=root
ExecStart=/usr/local/prometheus/node_exporter/node_exporter \
  --collector.filesystem.ignored-mount-points='^/(dev|proc|sys|var/lib/docker/.+|var/lib/kubelet/pods/.+)($|/)'
Restart=on-failure
[Install]
WantedBy=multi-user.target
EOF
  • 启动 node_exporter 服务,该服务会默认监听在 9100 端口上,等待 prometheus 主程序来抓取监控数据
systemctl enable node-exporter --now

注意事项:

  • 报错 acpi: no handler for region [powr],需要添加参数–no-collector.hwmon,原因应该是与 dell 的硬件信息采集程序冲突

容器安装 node_exporter

https://github.com/prometheus/node_exporter#using-docker

export VERSION="1.6.0"

docker run -d --name node-exporter --restart=always \
  --net="host" \
  --pid="host" \
  -v "/:/host:ro,rslave" \
  prom/node-exporter:v${VERSION} \
  --web.listen-address=":9100" \
  --path.rootfs=/host \
  --no-collector.hwmon \
  --no-collector.wifi \
  --collector.filesystem.ignored-mount-points='^/(dev|proc|sys|var/lib/docker/.+|var/lib/kubelet/pods/.+)($|/)'

node_exporter 可采集的数据种类

https://github.com/prometheus/node_exporter?tab=readme-ov-file#collectors

这里有 node_exporter 默认启用的采集器,name 就是采集器名称

这里有 node_exporter 默认禁用的采集器,name 就是采集器名称

如果想要让 node_exporter 采集或者不采集某些数据,可以在启动 node_exporter 程序时,向该程序传递参数。参数中的 NAME 为上面两个连接中,表格中的 name 列

  • --collector.<NAME> # 标志来启用采集目标。
  • --no-collector.<NAME> # 标志来禁用采集目标。

只让部分已启用的采集器采集指标

这部分 filters := r.URL.Query()["collect[]"] 代码是用来可以让服务端在向 node-exporter 发起的 HTTP 请求中,在 URL 的 QUERY 部分加入一些内容,以决定采集哪些 Metrics,而不必强制通过本身的 CLI 参数决定。参考 README 的 Filtering enabled collectors

[!Note] URL Query 中填写的内容是指采集的,只要使用了 URL Query,那么 node-exporter 则只采集 Query 中指定的指标,其余的全都不采集

若是用 curl 发起请求,就是这样的: curl 'localhost:9100/metrics?collect[]=cpu&collect[]=meminfo'。这个表示只让 cpu 和 meminfo 这两个采集器工作采集 cpu 和 内存 的指标。

Textfile Collector 文本文件采集器

参考:

文本采集器逻辑:

  1. 在启动 node_exporter 的时候,使用 –collector.textfile.directory=/PATH/TO/DIR 参数。
  2. 我们可以将自己收集的数据按照 prometheus 文本格式类型的 metrics 存储到到指定目下的 *.prom 文件中
    1. 文本格式的 metrics 详见 2.1.Prometehus 时间序列数据介绍.note 文章末尾
  3. 每当 prometheus server 到 node_exporter 拉取数据时,node_exporter 会自动解析所有指定目录下的 *.prom 文件并提供给 prometheus

Note:

  1. 采集到的数据没有时间戳
  2. 必须使用后缀为 .prom 作为文件的名称
  3. 文件中的格式必须符合 prometheus 文本格式的 metrics,否则无法识别会报错。文本格式样例详见:2.1.Prometehus 时间序列数据介绍.note
  4. 若用 docker 启动的 node_exporter,则还需要使用 -v 参数,将 textfile 文件所在目录挂载进容器中。

为 Node Exporter 添加认证

注意:该功能为实验性的,笔记时间:2021 年 8 月 4 日

image.png

与 Prometheus 添加认证的方式一样,详见:

Authentication(认证)

node-exporter 程序使用 --web.config 命令行标志来指定 web-config 文件,读取其中内容并开启 TLS 或 认证功能。

源码解析

node_exporter.go 中的 handler.innerHandler() 方法用于创建 Node 采集器,i.e. 决定要启用哪些 Collector

func (h *handler) innerHandler(filters ...string) (http.Handler, error) {
    // NewNodeCollector()` 方法决定启用哪些 Collector 的主要逻辑,该方法实例化了一个实现了 prometheus.Collector{} 接口的 NodeCollector{} 结构体
 nc, err := collector.NewNodeCollector(h.logger, filters...)

    // ......输出一些信息

 r := prometheus.NewRegistry()
 // 实例化后的 NodeCollector{} 使用 `prometheus.NewRegistry().Register()` 进行注册
 err := r.Register(nc)

   // ......最后就是标准的利用 promhttp.HandlerFor 或 promhttp.InstrumentMetricHandler 返回 http.Handler。具体用哪个以及其中的具体逻辑,与开启哪些 Node 的采集器没有强关联。
}

日志时区

详见 Prometheus MGMT


最后修改 December 18, 2024: promql, prom development (986a0fc6)