node-problem-detector:这是在 Kubernetes 节点上运行的各种问题检测器的地方

时间:2024-08-12 14:10:14
【文件属性】:

文件名称:node-problem-detector:这是在 Kubernetes 节点上运行的各种问题检测器的地方

文件大小:8.73MB

文件格式:ZIP

更新时间:2024-08-12 14:10:14

Go

节点问题检测器 node-problem-detector 旨在使集群管理堆栈中的上游层可以看到各种节点问题。 它是一个守护进程,运行在每个节点上,检测节点问题并报告给 apiserver。 node-problem-detector 既可以作为运行,也可以独立运行。 现在它在 GCE 集群中作为默认启用的运行。 背景 有大量节点问题可能会影响节点上运行的 Pod,例如: 基础设施守护进程问题:ntp 服务关闭; 硬件问题:CPU、内存或磁盘坏; 内核问题:内核死锁、文件系统损坏; 容器运行时问题:无响应的运行时守护进程; ... 目前,这些问题对集群管理栈的上游层来说是不可见的,因此Kubernetes会继续将pod调度到坏节点。 为了解决这个问题,我们引入了这个新的守护进程node-problem-detector来收集来自各种守护进程的节点问题,并使它们对上游层可见。


网友评论