配置指标告警策略
QKE 监控告警是通过云监控服务 CloudSat 为集群服务器的资源和服务提供监控告警管理。当绑定的监控项超过阈值时将触发告警,并通过短信、邮件等形式发送告警通知。
本小节介绍如何创建及绑定指标告警策略。配置告警通知策略请参见配置告警通知策略。
背景信息
- 支持的告警监控项:CPU利用率、内存使用率、磁盘使用量、节点服务状态、正在运行的容器数量。
- 支持的监控周期:1分钟、5分钟。
操作步骤
-
登录 QingCloud 管理控制台。
-
在控制台顶部的导航菜单中,选择产品与服务 > 容器服务 > 容器引擎 QKE,进入 QKE 集群列表页面。
-
点击目标集群 ID 号,进入集群详情页面。
-
点击告警页签,进入告警配置页面。
绑定指标告警策略
-
在告警页签,勾选需要配置的节点,点击绑定指标告警策略。
-
选择已创建的告警策略,点击提交。
若还未创建有告警策略或已有告警策略不合适,请参见创建指标告警策略进行新建。
说明
每个节点只能绑定一个指标告警和一个事件告警。
创建指标告警策略
-
在告警页签,勾选节点,点击绑定指标告警策略 > 创建指标告警策略。
-
在创建告警策略页面,配置告警基本参数。
名称 :输入告警策略名称。
对象范围 :默认为平台监控。
告警类型 :默认为指标告警,即对集群指标进行监控告警。
资源类型 :默认为集群节点。
监控周期 :可选择1分钟或5分钟。5分钟粒度为免费使用,1分钟粒度将收取费用。
-
点击下一步,配置告警规则。
点击添加规则,并可配置指标规则阈值和告警级别,一个策略可添加多条指标规则。
说明
有多条指标规则时,任何一条规则满足条件都会触发告警。
-
点击下一步,配置告警行为。
发送通知 :选择是否发送告警通知。
触发条件 :选择告警触发条件,可选择资源变为告警时和资源恢复正常时。
告警次数 :当资源持续处于告警状态时,连续发送告警通知的次数。最多为100次。
通知列表 :选择告警通知列表。可点击新列表创建新的通知列表。
-
确认配置无误后,点击提交,返回指标告警策略配置窗口,即可选择新创建的告警策略。
说明
若需要删除或修改告警策略,请点击管理告警策略进入云监控 CloudSat 的平台告警策略页面进行操作,具体说明请参见云监控 CloudSat 告警服务。