监控指标
MongoDB 提供集群服务和资源性能监控指标和告警信息。
- 服务监控指标统计了集群和服务的健康状态信息,可用于定位分析服务的性能。
- 资源监控指标统计了云服务器的资源信息,如 CPU 使用率、硬盘 IOPS 情况等,可用于查看系统性能是否到达瓶颈。
注意
MongoDB 集群 Agent 只用于监控集群的服务和资源指标,不会收除集除监控指标外的其它数据。
支持的服务监控指标
监控项 | 监控周期 | 单位 | 指标含义 |
---|---|---|---|
操作数 | 5分钟 | counts | 统计 OPCOUNTERS 命令操作次数。
OPCOUNTERS 中的指标永远是递增的,某一时刻的请求数量是与上一秒的请求数量求差而得。 |
复制操作数 | 5分钟 | counts | 统计副本集环境 OPCOUNTERSREPL 命令操作次数。
|
连接数 | 5分钟 | counts | 统计数据库连接数。当前连接数 表示当前连接数量。可用连接数 表示可用的连接数。 总共连接数变化值 表示创建的总连接数量。 |
METRICS-CURSOR | 5分钟 | counts | 统计数据库游标数量。
|
流量进出状态 | 5分钟 | MB | 统计数据库网卡接/发数据量。
|
WIREDTIGER TRANSACTIONS 状态 | 5分钟 | counts | 统计数据库并发事物数量。
当 read(write)-out 持续处于 128 或 read(write)-available 持续为 0 时,表明当前读(写)并发较大,可能是内存不够,导致处理速度变慢。 |
WIREDTIGER-CACHE 状态 | 5 分钟 | % | 统计数据库缓存使用比率。
|
主备延迟 REPL-LAG | 5分钟 | 分钟 | 统计备库与主库执行同一事务完成时间的差值。 |
连接数使用率 CONN-USAGE | 5分钟 | % | 统计当前数据库活跃连接数与总连接数的比值。 |
操作详情 METRICS-OPERATION | 5分钟 | counts | 统计数据库详细查询和写操作次数。
|
WIREDTIGER 内存状态 | 5分钟 | % | 统计 wiredTiger 缓存使用率。
|
影响文档数量 METRICS-DOCUMENT | 5分钟 | counts | 统计数据库文档数量。
|
扫描文档和索引数量 METRICS-QUERYEXECUTOR | 5分钟 | counts | 统计数据库扫描文档和索引数量。
|
TTL | 5分钟 | counts | 统计执行 TTL 操作的次数 。
|
全局锁-活跃客户端 GLOBALLOCK 请求状态 | 5分钟 | counts | 统计活跃客户端操作的次数。
|
全局锁-当前列队 GLOBALLOCK 队列状态 | 5分钟 | counts | 统计当前队列由于锁排队的操作数。
|
支持的资源监控指标
监控项 | 监控周期 | 单位 | 指标含义 |
---|---|---|---|
CPU | 5分钟 | % | 统计当前资源 CPU 使用率。 以 % 为单位。 |
内存 | 5分钟 | % | 统计当前资源内存使用率。 以 % 为单位。 |
硬盘使用率 | 5分钟 | % | 统计当前资源硬盘使用率。 以 % 为单位。 |
硬盘 IOPS | 5分钟 | counts/s | 统计每秒资源硬盘 IOPS 读取或写入次数,可分别查看读取或写入监控指标。 以次每秒为单位。 |
硬盘吞吐量 | 5分钟 | MByte/s | 统计每秒资源硬盘读取或写入速率,可分表获取读取或写入速率。 以 MByte 每秒为单位。 |